2019年,Harish Natarajan参加了辩论一个五英尺半高的长方形电脑屏幕摆在大约800人的现场观众面前。这台计算机是由IBM设计的人工智能系统projectdebater。纳塔拉扬是全球公认的辩论冠军。而眼下的话题是学前教育是否应该得到补贴。

根据观众投票,项目辩论者在比赛中失败了。但现在的“它”有它自己的,形成合乎逻辑的开场白。而在2018年,项目辩手赢得了一场辩论,在另一场辩论中几乎势均力敌。不过,在与对手辩论和反驳时,这个系统完全有可能听起来很尴尬。

虽然计算机不会很快登上政治讲台,但今天发表在自然这表明这个算法正在慢慢接近参与以正式辩论为代表的复杂人际交往.

研究人员观察到,辩论的要求超出了AIs的“舒适区”,AIs在一系列棋盘游戏和电子游戏中都取得了成功,更不用说一个著名的智力竞赛节目了。近几十年来,人工智能取得了惊人的进步。1997年,IBM的深蓝成为第一台击败国际象棋冠军的计算机,在六局比赛中击败了巨人加里·卡斯帕罗夫。14年后,IBM的沃森打败了危险!全明星布拉德拉特和肯詹宁斯在他们自己的比赛。

但是许多竞争性的计算机智能已经在任务或游戏中进行了测试,有明显的赢家和输家。而且,它已经适应了编码,导致了一个明确的二进制算法的胜利之路。计算机科学家所回避的是一个能够与细微差别进行交互的系统,这种细微差别使得人们能够进行复杂的对话。项目辩论者正在接近这个目标。

在新的自然论文中,IBM研究人员组成了一个合作团队,在该公司位于以色列海法和爱尔兰都柏林的人工智能研究中心报告了他们的系统的进展。在2019年的辩论之后,项目辩论者和三位人类专家辩论者的演讲由15位虚拟听众就近80个不同的主题进行了评估。

在这些人机对抗的比赛中,任何一方都不允许接入互联网。相反,每个人都有15分钟的时间来“收集他们的想法”,克里斯托弗P。ibmresearch全球实验室的通信经理Sciacca说。这意味着人类辩论者可以花一点时间草草记下关于手头某个话题的想法,比如资助幼儿园,而“辩论者计划”则会梳理之前储存的数百万篇报纸文章和维基百科条目,分析特定的句子以及特定话题上的共同点和分歧。在准备时间之后,双方轮流发表四分钟的演讲,然后每人发表两分钟的闭幕词。

根据观众和读者评分,项目辩手在2018年战胜了三位专家中的一位,并在开场白中获得了令人印象深刻的高分。但平均而言,它仍然略逊于人类。障碍是保持一个有意义的交流,可以采取任何方向,类似于一个真正的人类对话。尽管如此,研究结果还是为开发一个能够理解并产生有意义的语言交互的人工智能系统打下了基础。

“近年来,在开发能够理解和生成人类语言的算法方面做了大量的工作,”Noam Slonim说,他是IBM研究院的杰出工程师,也是Project Debater成立以来的首席研究员他补充说,IBM的研究结果反映了一个系统,虽然它仍然排在第二位,但它仍然排在第二位智人“对手”可以以一种迄今为止其他人工智能系统无法达到的方式与对手交战。许多这样的系统可以用实际语法生成看似有意义的语言。但该领域面临的一个大问题是,机器是否能够模仿人类的实际推理或变得有意识。

“在舞台上,项目辩论者远不是完美的,它的失误揭示了人类论证和辩论是多么困难和多么明确,”苏格兰邓迪大学的计算机科学家Chris Reed说,他没有参与这项研究,但在2019次辩论中出现在观众席上。然而,]项目辩论者研究是创新工程的巡回演出。。。。IBM团队的成就规模也可以从系统的实时性能中清楚地看到:不仅使用从非常大的数据集中提取的知识,而且还可以对人类的话语做出即时响应。”

纳塔拉扬和其他辩论家还没有准备好向“机器霸主”认输,但不管是好是坏,人们对更好的机器学习的希望正开始进入一个超越国际象棋和围棋既定规则的领域。