Quantcast
Channel: 冯志伟文化博客
Viewing all articles
Browse latest Browse all 562

智能会话代理:话段切分

$
0
0

   


智能会话代理:话段切分

    冯志伟

      

 

话段切分的算法要根据许多边界线索(cue)来设计。这些线索是:

l         线索词cue word):例如wellandso等都是线索词,它们倾向于出现在话段的开头或结尾处。

l         N元语法的单词或词性标记序列N-gram word or POS sequence):特定单词或词性标记序列往往预示着是边界的所在之处。例如,使用标注了特定的话段边界标记的训练集来训练N元语法,然后通过解码算法可以给标注的测试集找到最可能的话段边界。

l         韵律prosody):韵律的特征在话段话轮的切分中扮演着重要的角色,例如,音高、重音、短语最后延长、停顿音延等韵律特征都可能是话段的边界。当然,话段与韵律单位(例如,语调单位或语调短语)之间的关系是很复杂的。

 

在人与机器的对话中,话轮和话段之间的关系出现一对一的情形似乎多于在人与人对话中的情形。这可能是因为在目前自然语言处理的技术水平还不高的情况下,为了保证人机对话系统的简单性,研究人员只好采用较简单的话段和话轮。

 


 青春就应该这样绽放  游戏测试:三国时期谁是你最好的兄弟!!  你不得不信的星座秘密

Viewing all articles
Browse latest Browse all 562

Trending Articles