智能会话代理:会话接续的复杂性
冯志伟
下面的例子说明:通过旅行代理人A对于on the 11th的重述,说明旅行代理人A已经理解了客户C的意思:
C6: OK I’ll take the 5ish flight on the night before on the 11th.
A6: On the 11th?
对基于会话智能代理的电话系统来说,并不是前面一篇博文中所指出的所有的5种接续方法都是可以使用的。
例如,如果没有出现凝视这样的表示关注的视觉表征,那就不能选择继续关注。实际上,在处理基于语音界面的用户话段之后,如果系统没能给用户一个明显的确认信号,用户常常会感到困惑。
除了这些确认行为,听话人可以表明对前面话段的理解存在问题。例如,听话人B可以发出一个修复请求(request for repair):“Huh”:
A: Why is that?
B: Huh?
A: Why is that?
听话人使用这样的修复请求,表明他对于前面的话段还没有充分地理解。
在会话中,对于话段的理解不仅仅是基于句子的字面意义。研究上面例子中客户的反应C2,重述如下:
A1: And, what day in May did you want to travel?
C2: OK uh I need to be there for a meeting that’s from the 12th to the 15th.
我们注意到,客户C2实际上并没有回答旅行代理人A1的问题。客户C2仅仅说在那段时间他要参加一个会议。通过会话智能代理系统中的语义解释引擎生成的这个句子的语义解释中只会简单地提及这次会议。那么,旅行代理人A1怎样才能推导出客户C2提及这次会议是为了告知他旅行的时间呢?
再看看另一个话段,旅行智能代理A4说:
A4: …There’s three non-stops today.
这里旅行代理人表示的是今天有三个并且不多于三个的直飞航班。客户C从中进行推理,可以认识到,旅行代理人A要表达的意思是今天仅仅只有三个(only three)直飞航班,他只能在这三个直飞航班中进行选择,从而确定他所需要的直飞航班。
在上面的例子中,说话人似乎都期望听话人能推导出某个结论。这种情况说明:在口语对话中,说话人和听话人之间交流的信息大于话段单词的字面所给出的信息。

