语言学家冯志伟的戏剧性人生
郑伊 言语和语言 2018-03-09
冯志伟应该没有料到,1957年的某一天,自己在北大外文图书室偶然看到的一本美国杂志里的文章,竟开启了自己走语言学的道路。也应该料想不到,这条道路那么曲折又总能一以贯之。而在这之前,他在北大读的是和语言学风马牛不相及的地质系的地球化学专业。
杂志是关于信息论、计算机科学基础理论的,文章是乔姆斯基写的《语言描写的三种模型》。不像现在这么名声大噪,当时的乔姆斯基还很年轻,不太有名气。文章认为形式语言、程序语言、自然语言及描写程序的机器语言都有一个共同的基础,即数学。而正是这点让数学很好的冯志伟产生了兴趣和共鸣。他觉得乔姆斯基说的东西很新奇,当时中国基本上还没人知道这个。并且他预感到“有一件很伟大的事情就要发生了,他的这篇文章虽然很普通,但是我认为对我们人类的智能研究会有很大的作用”。不妨回顾一下时间和空间,1946年,世界上第一台计算机才在美国诞生,1958年,中国第一台计算机出现,当时是1957年,他正读大一。不得不说,敏锐的洞察力真是一种不可捉摸的天分。
而直到大三,在学了两年的地球化学之后,冯志伟才辗转到北大中文系。在这期间,他去咨询过中文系的老师,当时中国研究语言学的多是理论语言学,得到的回复是中文系有搞语言学的,但不知道什么乔姆斯基,觉得用数学方法搞语言学是很古怪的事情,是异端邪说。对于转系,中文系也有条件,一是他必须放弃两年学理的学历,从中文系的一年级读起,并且中文系的考试及格才能转;二是转过来之后,老师教什么就学什么。他并不讨厌原来的地球化学专业,相反,有浓厚的兴趣,觉得挺好的。但他的眼睛出现了问题,而他的专业需要用眼。这使他最后下定了决心。
因为兴趣驱使来到中文系的冯志伟,在对自然科学完全无感的文科生堆里显得有点格格不入。他一边上中文系的课,一边研究数学,每天做数学题,读数学系的书。希望将来可以像乔姆斯基一样,用数学的方法研究语言。吊诡的是,当时的政治气氛不让读很多书,太拔尖的学生会被看成白专分子,而冯志伟又求知若渴。于是冯志伟一边好好学习,一边又表现出成绩不是特别好的样子。
当时还没有计算语言学,本科毕业后,冯志伟就跟着著名语言学家岑麒祥读硕士,学理论语言学,又学了法语。他打算把自己的“异端邪说”跟导师说说,岑麒祥教授是典型的人文学者,不能接受。听了冯志伟各种各样的理由后,他不反对也不支持。经过这么多年的准备,1966年,冯志伟提前写就了他的硕士毕业论文《数学方法在语言学中的应用》,导师也承认了他搞的是语言学,这在当时已经很不容易了。好在,当时北大中文系的有些老师还是支持他的,比如学物理出身的语言学家朱德熙,推崇逻辑学的语言学家王力教授。
冯志伟本来在1967年才硕士毕业,但他写完论文后,希望能提前答辩,因为家里很困难,早点毕业好早点工作。岑麒祥教授虽然看不太懂他的论文,但很开明,想着既然写出来了,大概已经成熟了。然而,1966年5月,“文化大革命”发生了,什么都乱了套。不仅提前毕业的计划泡汤了,冯志伟在北大一直待到1968年才毕业。
离开北大后,冯志伟被分到天津一个中学教书。他对语言学的看法也发生了转变。在北大时,他是一个优秀的学生,学了那么多理科和文科的东西,自认为很有学问,也能得到老师的认可,可离开北大跨出了语言学的圈子进入社会后,别人根本不知道你搞的是什么玩意儿,什么主谓宾啊,人家觉得你是疯子,搞这个干嘛?人家只看你有什么真本事。他想教语文,学校领导说语文课大家都能教,中国人不会讲中国话还行吗?他外语好,于是就教了外语。他教外语一年翻来覆去只教了一句话:毛主席万岁(Long Live Chairman Mao),不敢教其他的。因为当时反对地道英语,中国人讲的英语不能跟美国人的一样,无产阶级,最革命的人只能讲Long Live Chairman Mao。
在天津工作了两年后冯志伟被调到了昆明一个中学,同样,学校不需要中文老师,也不需要外语老师,幸亏他理科好,就教了物理,一教就是八年。在这八年里,他常常思考人们对语言学的看法。“为什么我会教物理呢?”因为离开了语言学的圈子,别人根本就不关心语言学,研究这个又没什么经济效益,在别人看来不是真本事。到底有没有用最后得用社会来衡量。从学校走出来在社会历练过后的冯志伟,开始犹豫还搞不搞语言学。尽管内心有很多怀疑,但对用数学方法研究语言学,他仍然充满信心,常去省图书馆找相关的书看。在那里,他又读到了启发过他的乔姆斯基,像冯志伟50年代预感到的那样,在70年代,这个普通人已经很有名了。
1978年,高考招生制度恢复。冯志伟在昆明教物理教得很好,培养的学生成绩都不错,在家长中有了口碑。是继续教书过受人尊重又安定的生活还是放弃现在的一切考研究生,他又一次面临着选择。但总是这样子不是吗?有的人就是能让最初的信念在一次次挫败、一次次自我怀疑、对未来不可知的情况下死灰复燃,然后循着那条路勇往直前。冯志伟联系北大以前的老师,老师知道他读书厉害,推荐他过来。北大军宣队的领导跟云南宣传省委部长是老战友,就写了封信。没想到就是因为自己的才华,阻断了自己去北大的路。云南宣传省委部长想到北大要这个人,说明这个人很有用,当时正是建设时期,云南省需要人才,不能放他走。就这样,他转而去考了中国科技大学。
此时的冯志伟已经39岁,对于目标明确的人,年龄什么的从来都不是问题。他考的不是地球化学,不是数学,不是物理学,也不是语言学,他考的是信息科学。并且一考就考上了。为什么考这个?他觉得信息科学跟数学的联系比较多,这个系有信息检索和机器翻译专业,跟语言学有关。所以考了这个。
进入科技大学后,学校认为年轻的同学比较有培养前途,把这些同学就送往美国学习,冯志伟算研究生里比较大的了,就被送到了法国学习。他到的是法国的格勒诺布尔大学应用数学研究所。幸运的是,导师是当时世界上一流的计算语言学家,正是用数学方法搞机器翻译。因缘际遇,碰到对的人,有很好的环境,是多么的难能可贵。在这里,冯志伟充分地施展了自己平生所学,将数学和语言学结合,做了一个将汉语翻译成五种语言的翻译系统。
当时乔姆斯基在句子分析中是“单标记”的思想,但这不能解释和划分有的语言结构。比如“谁吃了午饭?——郑伊吃了。”“午饭吃了吗?——午饭吃了。”“郑伊吃了”和“午饭吃了”这两个句子里,“郑伊”和“午饭”都是NP(名词短语),“吃了”是VP(动词短语)。按照乔姆斯基“单标记”的方法,可以把它们都表示为S(句子)=NP+VP,它们有相同的词性、词序和层次,但我们能发现它们的作用并不同。如果用机器这样子做出来,是一样的树形图,就不能区别它们的不同。不单汉语这样,英语也有类似的例子。这是当时乔姆斯基解决不了的问题(乔姆斯基用转换的方法区别它们)。冯志伟提出采用“多标记”的方法,就是在做树形图后,在节点上不能只标出NP,比如“郑伊吃了”,“郑伊”是NP,还要标出它是施事。同样。“午饭”是NP,还要标出它是受事。然后在程序上下功夫,让树形图表示多标记,这样就区分开了。除了“多标记”方法,还有“多叉”的观点。冯志伟的翻译系统就是根据这个做成的,这个系统是世界上第一个把汉语译成多种外语的机器翻译系统。
1981年,冯志伟回国。回想起来,从北京到天津到昆明,又从昆明到北京到国外再回北京;从理科到文科又到理科,兜兜转转,这么大一圈。自己在语言学里摔了这么大的筋斗。真是让人心生感慨。后来科技大学把他分配到中国科技情报所计算中心做机器翻译组的组长。又做了一些机器翻译系统。
1982年,北大邀请他在中文系汉语专业开设“语言学中的数学问题”的选修课。是国内首次在高等学校全面系统讲述数理语言学的课程。这个在他做学生时被认为是“异端邪说”的东西受到了学生和老师的欢迎。
还远远没有结束,在科技信息研究所工作,如冯志伟所愿,他的工作有很强的实用价值。他的团队在中国第一次用计算机输出了汉字。他研究歧义,提出了PA(潜在歧义)理论,应用于自然语言处理。他出了很多书《数理语言学》《现代语言学流派》《自然语言学的计算机处理》等等。有人问他:“希望别人评价您的时候说您是位语言学家吗?”他回答:“即使我做数学,也是为了语言的目的。我还是个语言学家。”
后记:本文改写自张宜的《历史的旁白——中国当代语言学家口述实录》冯志伟一章。该书通过口述的方式,记录了很多有名的语言学家的学思历程。比如周有光、吴宗济、徐通锵、陆俭明等。他们的学问、成就的确让人敬佩,治学的方法也让人很有启发。但我从中发现,大多数语言学家走上语言学道路的原因,并不是自己喜欢或者对其有所了解,而是心甘情愿地依从组织安排,爱国,建设国家等等。面对选择时都是服从组织分配。而冯志伟教授的故事打动我的地方正是在同样黑暗的时代大环境中,他从来都是自主选择自己的道路,而他的道路从来都不是一帆风顺的,这也是他的弧光。冯志伟教授现在已经七十多岁,早已退休,但他还写博客,这是他博客链接http://blog.sina.com.cn/zwfengde2011
,里面有很多关于人工智能和语言学方面的文章,感兴趣的可以了解一下。
