机器翻译的媒介语
冯志伟
机器翻译中语言之间差别的对应体,两种或多种语言对译时的中介语言。
采用媒介语时,机器翻译的过程是由源语言至媒介语,再由媒介语至目标语言。由于源语言分析和目标语言生成都只与媒介语打交道,而不与具体的哪种自然语言打交道,因而它们之间是相对独立的,在多种语言机器翻译系统中,无论有多少种语言参与机器翻译过程,只需要分别为每种语言制定一套分析系统和一套生成系统就可以了,这样,就减少了规则系统的数目,因而也就减少了机器翻译规则系统的研制经费以及在计算机上使用和存储机器翻译规则的开销。
对于任何特定的民族来说,如果采用媒介语,在机器翻译中只需要使用两个机器翻译规则系统,一个是从本民族语言到媒介语的分析规则系统,一个是从媒介语到本民族语言的生成规则系统。这样,媒介语就可以使各民族之间在机器翻译的领域进行真正的合作。
各国学者提出的媒介语方案很多,可以归纳为如下6种类型:
① 利用某种自然语言做媒介语;
② 利用某种经过标准化或简化的自然语言做媒介语;
③ 采用国际人造语言(如世界语)做媒介语;
④ 用类属词典的方法建立一套诸自然语言的对应关系系统,把这套系统作为媒介语;
⑤ 根据自然语言的特点,选择对于计算机工作状况最有利的因素,建立一种类似于自然语言的媒介语;
⑥ 不管参与机器翻译的自然语言的特点如何,根据某门学科的内容,设计专业性的、纯逻辑的媒介语。
机器翻译的媒介语问题尚待继续研究。
