公众号
关注微信公众号
移动端
创头条企服版APP

Google发布两神经语言对话资料集

5632
搜狐财经 2019-09-10 20:48 抢发第一评

原标题:Google发布两神经语言对话资料集

Google发布Coached Conversational Preference Elicitation(CCPE)和Taskmaster-1两个可用于训练数位助理对话能力的资料集,其中CCPE能帮助人工智能学习人类表达偏好的方法,而Taskmaster-1则能增加训练语料库的大小以及对话者的多样性。

虽然近年来数位助理的对话能力,比起过去已经有长足的进步,但是仍然未达到与人类相同的理解程度,Google提到,这是因为缺乏能够反应人类表达需求和偏好的训练资料。数位助理的学习限制,来自于人类希望数位助理理解人类表达的方式,人类雕琢了训练数位助理模型的字句,而造成了人工智能的学习偏差。

为了解决这个问题,Google发布了CCPE以及Taskmaster-1两个对话资料集,里面的对话皆采用名为绿野仙踪(Wizard of Oz)的方法,该方法配对两个参与对话的人,其中一人扮演语音助理使用者,另一位则扮演理想的数位助理,整个设计模仿今日人类与数位语音助理对话过程,并能在自动化系统环境中,保留口语对话的特征。

Google表示,由于人类扮演的数位助理,能够精确理解用户的要求,因此Google同时也能捕捉用户,真实呈现自己想法与偏好的表达方式,而Google便捕捉这些对话,制作成CCPE以及Taskmaster-1两个对话资料集。

CCPE资料集包含12,000个注释范例语句的502个对话,由一人扮演使用者对麦克风讲话,而声音直接向扮演数位助理的人工助理播放,并由人工助理以文字输入回应,回应以文字转语音技术转成声音后播放给使用者听,模拟使用者与数位助理对话的真实情况。

CCPE资料集中对话的内容在谈论电影偏好,Google提到,真实人类的对话,包含了合成对话难以重现的不流畅和错误等自然情况,另外,这个资料集还呈现了许多人类描述偏好的方法,而且Google也发现,由系统所提供的电影喜好过滤器,可能不适合使用者用来描述喜好的语言。CCPE资料集是第一个大规模呈现喜好描述丰富度的资料集。

Taskmaster-1则是任务面向的资料集,Taskmaster-1里的对话除了采用绿野仙踪方法之外,也使用书写完整对话的方法,来增加语料库大小以及谈话者的多样性。书写方法是由一个人同时扮演用户以及人工助理,依照任务概述独自创建完整的对话,Google提到,虽然口语对话会更接近对话语言,但是书写的对话复杂丰富,而且更便宜且易于收集。

Taskmaster-1包含了订购披萨、建立汽车维修预约、设置租车、订购电影票、订购咖啡以及预约餐厅6种任务对话。这个资料集使用简单注释架构,建立资料的人员可以简单地为资料加上标签。返回搜狐,查看更多

责任编辑:

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 0
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
宁波城市站
金华城市站
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP