很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱customer@hrtwrk.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:墨澜云栈小羽毛
作者|语义机器研究团队翻译|平川策划|陈思微软语义机器正在尝试构建会话式人工智能体验。用户只需要专注于说出他们想要的式A数据,剩下的对话对话就交给系统了。SfW 本文最初发布于 Microsoft Research 博客,式A数据由 InfoQ 中文站翻译并分享。对话对话SfW “说起来容易做起来难。式A数据”这句话反映了会话式人工智能的对话对话前景。只需要几秒钟就可以问我和梅根什么时候有空。式A数据但是对话对话,手动查看日历需要更长的式A数据时间。事实上,对话对话我们在科技的式A数据帮助下完成的每一件事都让人觉得他们为短期目标走过了漫长的道路。在微软语义机器公司,对话对话我们正试图填补这一空白——,并建立一个对话式的人工智能体验。你只需要专注于说出你想要的,剩下的交给系统。与这样的人工智能交谈应该像与朋友交谈一样:自然地、情境地、协作地。SfW 一个真正强大的对话式人工智能不仅需要对语言的深刻理解,还需要情境性、灵活性和健壮性。人工智能也必须对Action ——有深刻的理解。大多数目标涉及多个步骤和多个信息源。表达目标、动作和对话状态是对话式人工智能系统的核心挑战之一。在《计算语言学协会会刊》 (TACL)中,我们发表了一篇题为“面向任务的对话作为数据流合成”的新论文,该论文描述了一种新的表示和建模框架,该框架将对话解释为数据流图,并使跨多个领域的复杂任务对话成为可能。我们还发布了包含4万多个对话(用数据流程图标注)和公众排名的数据集,可以帮助人工无线城市在多轮面向任务的对话中解决具有挑战性和实用性的问题。SfW 从我们的新数据集,我们可以看到令人难以置信的用户请求多样性:SfW 目标多样性.用户可能想要“预约与梅根的会面”。他们可能还想“和梅根约好周二见面”,甚至“和梅根约好五一劳动节后她有空的第一天早上见面”。SfW 语言多样性.问题可能是“明天天气怎么样?”同样的问题可能是“明天出去怎么样?”或者“徒步旅行需要带夹克吗?”以这种形式。SfW 语境多样性.“三个怎么样?”这句话的意思完全取决于刚才说的话。句子“梅根两点钟不在。你还有其他建议吗?”提议改变会议时间。“天气预报说中午多云”这句话是关于天气的问题。“里沃利有一张两个人的桌子”这句话的意思是增加为晚餐预留的座位数量。SfW 传统的“填槽”对话系统忽略了这种多样性。它们只支持一组目标,除了当前目标中缺少的参数列表之外,它们没有上下文表示。在另一个极端,最新的“端到端”神经对话系统原则上可以自由学习任何与语境相关的反应,但仅仅灵活运用词汇是不够的,因为对话还需要灵活执行动作。部署的系统还需要可控性和真实性,这在非结构化系统中非常具有挑战性。SfW 我们提供了第三种方法,它使用深度学习来生成和使用强大的“数据流”表示。它超越了槽填充方法,提供了灵活的动作和可控的语义。数据流旨在支持人类在日常生活中自然、灵活、开放的对话。我们的方法基于以下五个关键概念。SfW 1.用户请求是程序。SfW 现有的对话模式非常适合解释固定的、预定义的任务请求,比如“开灯”或者“设置一个叫pasta的定时器5分钟”。在这些方法中,对话系统设计者定义了一组固定的意图,每个意图都有一组固定的参数。系统用用户表达的意图和意图的参数来标记每个用户请求:SfW 但是,对于更复杂的要求,比如“我和梅根喝咖啡的时候温度会是多少?”要回答这个问题,对话代理需要做一系列不同的事情:找出梅根是谁,使用梅根在日历应用中查找事件,找出开始时间,然后使用时间查询天气服务。我们不需要系统构建器创建weather _ during _ event _ with _ person的特殊意图,而是将自然语言请求转换成一个程序,并将所有这些调用链接在一起。我们将该计划表述为一个数据流图,它明确定义了对话机构计划(节点)中各步骤之间的数据依赖性:SfW 一旦神经网络预测到这个程序,对话代理就会执行它,根据结果回复用户,并将结果存储在数据流图中。SfW 2.面向任务的对话是交互式编程。SfW 使用数据流表达用户意图的优势之一是,可以非常自然地概括为多次往返通信中的交互。如果用户开始问“我下一次什么时候见梅根?”,对话代理首先预测一小段图片:SfW 如果用户继续问“当时的天气怎么样?”在下一轮对话中。回答这个新问题所需的大部分工作已经完成。代理返回到上一轮的程序片段,将其输出输入到新的API调用中,然后描述结果:SfW 这个过程的结果和我们之前为一个复杂问题生成的程序完全一样!这种重用是我们框架的核心特征。——在边,复杂的行为是由更简单的行为构建的,而不是定义一堆顶级行为。这种组合可以一次完成,也可以通过在多个周期中依次扩展数据流图来逐步完成。SfW 3.语义对语境的依赖。SfW 展开的图形用作对话状态。它记录了代理迄今为止为理解、服务和响应用户而执行的所有计算。随后的表达式在这个上下文中解释(通过深度学习),它们可以参考这些早期的计算和结果。如本文所示,显式引用和重用先前计算的机制提高了对话代理机器学习的数据效率和准确性。它们还使工程师更容易推理和控制对话代理的行为。SfW 在前面的示例中,用户使用单词组合来指代数据流图中较早的节点。其他引用表达式,如then,that或her,也可以表达重用前面在对话中提到的值或实体的请求。SfW 这种the second meeting you mentioned现象也可能是隐性的。想象一下,问你的设备,“天气怎么样?”通常你指的是最近的天气。但是如果你在提到未来的活动后问同样的问题,你可能是在问活动期间活动地点的天气。最终,这两种情况需要两种不同的计算方法。如下图,左边的计算将用于解释最近的情况,右边的计算将用于解释特定事件的情况:SfW 如何区分这些用法是一个具有挑战性的机器学习问题(更不用说对这个问题的其他解释了)。但直觉上,在这两种情况下,“天气怎么样?”同样的——个用户想要知道与对话上下文最相关的时间和地点的天气。SfW 在我们的方法中,这种推理是显式的:当在上下文中解释用户输入时,我们的对话代理显式地预测引用现有计算片段的程序,包括从对话开始就隐式可用的片段,例如引用和here.对于上面的两个例子,它将是这样的:SfW 换句话说,在这两个对话中,对话代理人解释了“天气怎么样?”以同样的方式。这个问题。它预测数据流图的相同片段,并调用refer(Time)和refer(Place),但是这个片段的解释将根据前面的上下文而改变。SfW “公司休假怎么样?”这个问题与语境关系更为密切。在这里,用户不仅引用了一个现有的实体,还要求对话代理为之前的问题计算一个新的答案,并且一些细节已经改变。我们称这种转换为now.类参考,修订版提供了一个强大的机制来执行复杂的图形转换,以响应简单的请求。下图说明了代理预测的修订。当用户问“我和梅根喝咖啡的时候天气怎么样?”。然后他问:“公司假期过得怎么样?”SfW 这里,第一次事件搜索的条件(包括修正名为Megan的事件)被新的条件(指定名为http://www . Sina.com/)代替。SfW 详情请见报纸:SfW https://www . Microsoft.com/en-us/research/publication/task-oriented-dialogue-as-SfW 4.事情会出错的。SfW 在任何复杂的对话中,事情都会以许多意想不到的方式发生。预约与梅根会面的请求可能会失败,因为用户的联系人列表中没有梅根;因为很多人都叫梅根;因为没有时间开会;即使网络断开,会话代理也无法联系服务器。每种情况都需要不同的响应,现有的对话系统通常使用复杂的硬编码逻辑来从错误中恢复。SfW 我们通过从数据流图中的一个节点抛出异常来处理所有这些失败。我们的对话代理将对失败的“结果”做出响应,并为用户生成适当的警告或问题。用户可以随意回应,或许可以通过纠正问题;例如,在这种情况下,“我是说梅根鲍文”将被解释为对原始请求的修改。该方法允许系统和用户根据上下文灵活、模块化、协作地处理错误。SfW 5.语言的生成依赖于对话语境。SfW 要成为有用的团队伙伴,对话AI系统需要能够生成语言,而不仅仅是解释语言。现有的对话方法大多要么是硬编码的生成规则(使输出听起来像机器人,不会因不同的上下文而改变),要么是非结构化的神经语言模型(有时不说实话!在我们的方法中,语言生成被建模为神经引导的合成程序转换过程,其中代理将轮流扩展数据流图。代理可以讨论图表中出现的任何内容,而不仅仅是它计算的最终结果。它甚至可以向图表中添加新的计算和结果,用户可以在未来的对话中随意引用它们:SfW 代码、数据和新竞争。SfW 我们认为,这种方法是迈向新一代自动对话代理的第一步,它可以像人一样与人互动。然而,解决这个问题需要全社会的共同努力。为了推动基于数据流的对话代理的开放研究,我们发布了规模最大、最复杂的面向任务的对话数据集SMCalFlow。这个数据集有41517个用数据流程序标记的对话。这个数据集来自人类之间关于日历、天气、人和地方的公开对话。与现有的对话数据集相比,我们的对话集合不是基于预先指定的脚本,参与者也不受限制。他们可以问任何问题,他们可以用自己的方式完成任务。因此,SMCalFlow本质上不同于现有的对话数据集,它对代理能力、多轮错误恢复和复杂目标有具体的讨论。SfW 数据集、代码和排行榜可以在我们的GitHub页面上找到。我们期待看到自然语言处理社区如何使用这一新资源。SfW |
本文为作者独立观点,不代表墨澜云栈立场,未经允许不得转载。
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)
Powered by © 2010-2022 墨澜云栈 粤ICP备77645321号