词向量及其在自然语言处理中的应用(七)
词向量及其在自然语言处理中的应用(七) 冯志伟 词向量相似度的余弦计算 为了定义两个目标单词v和w之间的相似性,我们需要取这两个单词的词向量并计算词向量之间的相似度。迄今为止,最通常的相似度的计算方法是使用词向量之间夹角的余弦(cos)来进行的。 这个“余弦”在自然语言处理中被广泛地应用来计算词向量的相似性。余弦的根据是线性代数中的点积(dot...
View Article丁石孙校长鼓励我写《数学与语言》的专著
丁石孙校长鼓励我写《数学与语言》的专著 冯志伟 我从法国回国之后,1982年秋天,我应北京大学的邀请,在北京大学中文系汉语专业开设了“语言学中的数学问题”的选修课。这是国内首次在高等学校全面地、系统地讲述数理语言学的课程,受到学生们的欢迎。 从此,丁石孙校长开始关注我在语言的数学描述方面的工作。...
View Article神经机器翻译中的词向量
神经机器翻译中的词向量 冯志伟 2007年以来,采用深度学习的方法,以大规模的双语对齐的口语语料库作为语言知识的来源,从双语对齐的口语语料库中获取翻译知识,研制了神经机器翻译(Neural Machine Translation, NMT)系统,机器翻译的水平大大提高,口语神经机器翻译正确率已经超过了...
View Article四字节的规范汉字
四字节规范字表 冯志伟 规范字表中有的汉字是四字节编码的,有的字在计算机上打不出来,这里只打印出一些一部分字。这种情况讲可能妨碍规范汉字的使用和推广。 规范字号码 汉字 GB18030代码 繁体形 部首 6791 9932BD34 蔄 艹 6820 9837D838 睍 目 6839 9836CB34 山 6844 9838E137 鈇 钅 6846 9933A630 鋹 钅 6847...
View Article乔伟教授是中德文化交流的桥梁
乔伟教授是中德文化交流的桥梁 乔伟教授于2021年2月24日在德国特里尔去世,我和老伴初阳都感到万分的震惊和悲痛。2019年6月我们曾经到特里尔拜访过乔伟教授和夫人方海湘老师,约定2020年再次相会,由于疫情2020年我们没能到特里尔,正打算疫情过后我们再度到特里尔拜访乔教授。看来这样的愿望不能实现了!...
View Article冯志伟谈计算语言学
冯志伟谈计算语言学把基于语言大数据的经验主义方法和基于语言规则的理性主义方法结合起来 2020年09月25日 10:32 来源:中国社会科学网 作者:曾江 打印 推荐...
View Article打破“乔家大院”的枷锁,NLP的发展需要深入探索语言本质
先锋洞见 | 白硕:打破“乔家大院”的枷锁,NLP的发展需要深入探索语言本质 原创 白硕 恒生技术之眼 昨天 收录于话题 #人工智能21 #NLP9...
View Article术语抽取
术 语 抽 取Terminology Extraction 什么是术语抽取? 术语抽取(或术语识别) 是从特殊领域文本中获得表示领域概念术语的过程,传统的术语抽取主要依赖专家知识来手工制定规则以进行术语的识别与抽取,存在规则维护扩展困难、应用范围有限、可移植性差等问题。 自动术语抽取(automatic term...
View Article中国语文教学的发展(从古代到现代)德文版
本文载 Bruecke zwischen Kulturen, Ostasien-Pazifik Trierer Studien zu Politik, Wirtschaft, Kultur, Band 17, LIT Verlag, 2003, 127-141, ISBN 3-8258-6430-8 中国语文教学的发展(从古代到现代) Über die Entwicklung der...
View Article论华文教育的发展从古到今(中文译文,机器翻译的译文,仅供参考)
本文载文化间的桥梁,东亚太平洋地区政治、经济的特里尔研究。 文化》第17卷,LIT Verlag, 2003, 127-141, ISBN 3-8258-6430-8 中国语文教学的发展(从古代到现代)。 论华文教育的发展 从古到今 冯志伟 (特里尔大学第二系C3教授) 本讲座旨在回顾描述中文教育从古代到现在的发展,并强调其优势和不足之处。...
View Article冯志伟1957年写的现代诗:《我们奔往理想》
1957年高中毕业前夕,作为团支部书记的冯志伟带领昆明一中高27班团支部全体团员进行高中阶段的思想总结,在团内展开批评和自我批评,发扬优点,克服缺点,为走向新的生活做好准备。在团支部的总结会上,冯志伟热情洋溢地朗诵了他的新诗《我们奔往理想》: 我们奔往理想...
View Article为什么神经网络不适合理解自然语言?
为什么神经网络不适合理解自然语言 ? 中关村金融科技产业发展联盟 昨天 作者 | Ben Dickson译者 | 王强策划 | 刘燕 过去十年中,人工智能行业的一大趋势就是通过创建更大的深度学习模型来解决问题。这种趋势在自然语言处理领域最为明显,这也是人工智能最具挑战性的领域之一。...
View Article