句蜕构成及汉英变换处理
文献类型:学位论文
作者 | 李颖 |
学位类别 | 博士 |
答辩日期 | 2004 |
授予单位 | 中国科学院声学研究所 |
授予地点 | 中国科学院声学研究所 |
关键词 | 机器翻译 句类 语义块 句蜕 |
其他题名 | A Study of Sentence Ecdysis in Chinese-English MT |
中文摘要 | 本研究属于机器翻译的范畴,是在HNC(Hierarcllical Networks ofconcePts)理论框架下对HNC机器翻译引擎原理中的一部分—句蜕构成及汉英变换处理—进行的研究,其目的是为机器翻译提供理论与技术支持。6项过渡处理是HNC机器翻译引擎原理的重要内容,其中的语义块构成变换是6项过渡处理中使用频率最高的一种处理,而句蜕现象的出现是形成语义块复杂性的主要因素,因此,句蜕构成及汉英变换处理是语义块构成变换的核心内容。本文对句蜕进行了较为深入的研究,提出了句蜕处理的规则及算法,具体包括:》要素句蜕构成及其汉英变换的处理规则和算法;》原型句蜕构成及其汉英变换的处理规则和算法;》包装句蜕构成及其汉英变换的处理规则和算法;》句蜕中的一利1常见歧义结构的消歧算法。这些算法和规则的提出,标志着句蜕从语言描述阶段进入了可计算阶段,推进了HNC机器翻译引擎的研制。同时本文从理论上对一句蜕及其相关内容也进行了比较深入地探讨,主要包括:》句蜕的理论阐释;》句蜕的汉英对比研究;》句类空间的再抽象;》交互引擎的形式化描述。所有这些,都从不同侧面丰富了HNC关于句蜕及其相关的理论。论述次序上,本文首先对机器翻译原理进行了概述。概述是依照“机器翻译是一种映射”的观点,按映射的类型来展开的,在简要介绍了HNC的机器翻译观之后,指出本文研究内容及意义;接着对与本文相关的HNC基本概念及基本观点进行了简述,包括句类,语义块和机器翻译引擎原理,这是本文研究的前提条件;之后就是本文的重点内容:句蜕构成及汉英变换处理,这里涉及到句蜕的理论阐释、句蜕内部的计算、句蜕的汉英变换处理;最后是机器翻译实例分析与本文取得的结论以及今后进一步研究的方向。论述方法上采用理论阐释与归纳演绎并举,对理论及相关概念主要从语言学的角度进行阐释,而对句蜕的处理规则和算法,主要是从汉英两种语言对比分析的基础上,借助归纳演绎手段,来进行提取的。 |
英文摘要 | Sentence Ecdysis (SE), as a common structure in sentences, exists widely in natural languages and is not processed properly in Machine Translation (MT) systems at present. Based on Hierarchical Networks of Concepts (HNC) theory, this dissertation puts forward some rules and algorithms for processing SE. These rules and algorithms are as follow: The rules and algorithms for processing Constituent SE (CSE); The rules and algorithms for processing Prototype SE (PSE); The rules and algorithms for processing Wrapped SE (WSE); The algorithm for disambiguating the structure of SE. These rales and algorithms mentioned above make it possible for computer to process SE, which marks the transformation from description of SE to calculation of SE and promotes the development of HNC-based MT Engine. Besides, this dissertation sheds light on SE and relative subjects from different viewpoint, such as the follows: Expatiating on SE in theory; Comparative analysis of SE between Chinese and English; Mathematical description for sentence category space; Formalization of HNC-based Interactive Engine This dissertation includes 6 parts. In the first two parts, the review of MT and summary of HNC are given, then comes the main contents of this dissertation. In the third and fourth parts, some linguistic descriptions of SE, some definitions of sentence format and comparative analysis between Chines and English are given first. Then, the dissertation focuses on the questions of how to process SE in Chinese-English MT, and gives some rules and algorithms for processing SE. In the last two parts, some tests of these rules and algorithms in the current MT systems and statistical analysis in large-scale real texts have been taken to manifest the importance of SE processing. Besides, some conclusions drawn from this dissertation are given and the futher works are introduced. |
语种 | 中文 |
公开日期 | 2011-05-07 |
页码 | 111 |
源URL | [http://159.226.59.140/handle/311008/822] ![]() |
专题 | 声学研究所_声学所博硕士学位论文_1981-2009博硕士学位论文 |
推荐引用方式 GB/T 7714 | 李颖. 句蜕构成及汉英变换处理[D]. 中国科学院声学研究所. 中国科学院声学研究所. 2004. |
入库方式: OAI收割
来源:声学研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。