Quantcast
Channel: 冯志伟文化博客
Viewing all articles
Browse latest Browse all 562

语言计算研究的先驱

$
0
0

   语言计算研究的先驱


冯志伟

 

在电子计算机出现之前,就有一些具有远见卓识的学者研究过语言的计算问题,他们从计算的角度来研究语言现象,揭示语言的数学面貌。

1847年,俄国数学家B. Buljakovski(布良柯夫斯基)认为可以用概率论方法来进行语法、词源和语言历史比较的研究。

1851年,英国数学家A. De Morgen(摩尔根)把词长作为文章风格的一个特征进行统计研究。

1894年,瑞士语言学家De Saussure(德索绪尔)指出,在基本性质方面,语言中的量和量之间的关系,可以用数学公式有规律地表达出来,他在1916年出版的《普通语言学教程》中又指出,语言好比一个几何系统,它可以归结为一些待证的定理。

1898年,德国学者F.W. Kaeding(凯定)统计了德语词汇的在文本中的出现频率,编制了世界上第一部频率词典《德语频率词典》。

1904年,波兰语言学家Baudouin de Courtenay(博杜恩库尔特内)指出,语言学家不仅应当掌握初等数学,而且还要掌握高等数学,他表示坚信,语言学将日益接近精密科学,语言学将根据数学的模式,更多地扩展量的概念,发展新的演绎思想的方法。

1933年,美国语言学家L. Bloomfield(布龙菲尔德)提出一个著名的论点:“数学只不过是语言所能达到的最高境界”。

1935年,加拿大学者E.Varder Beke(贝克)提出了词的分布率的概念,并以之作为词典选词的主要标准。

1944年,英国数学家 G.U.Yule(尤勒)发表了《文学词语的统计分析》一书,大规模地使用概率和统计的方法来研究词汇。

这些事实说明,关于语言计算的思想和研究是源远流长的。

在本章中,我们着重讨论三项最值得我们重视的关于语言计算的先驱性研究,它们是:俄国数学家A. A. Markov(马尔可夫)关于马尔可夫链的研究,美国学者G.K.Zipf(齐夫)关于Zipf定律的研究,美国科学家Shannon(香农)关于熵的研究。这些先驱性的研究为尔后的自然语言处理形式模型的研究奠定了初步的基础。


 

Viewing all articles
Browse latest Browse all 562

Trending Articles