2019年,哈里什·纳塔拉简参加了一场辩论在一个五英尺半高的长方形电脑屏幕前,大约有800名现场观众。这台计算机就是IBM设计的人工智能系统“辩论者计划”(Project Debater)。纳塔拉简是全球公认的辩论冠军。当时的话题是学前教育是否应该得到补贴。

根据观众投票,“辩论计划”输掉了比赛。但是现在的“它”保持了自己的状态,形成了合乎逻辑的开场白。在2018年,“辩论者计划”赢得了一场辩论,在另一场辩论中几乎打成平手。尽管如此,在与对手进行辩论和反驳时,这套系统完全能够听起来很尴尬。

虽然计算机在短期内还无法走上政治舞台,但今天发表在《科学》杂志上的一项研究表明自然说明这个算法正在慢慢接近从事以正式论证为代表的复杂的人际交往

研究人员观察到,辩论的要求超出了人工智能的“舒适区”,人工智能已经在一系列棋类和电子游戏中取得了胜利,更不用说著名的智力竞赛节目了。近几十年来,人工智能取得了惊人的进展。1997年,IBM的“深蓝”电脑在一场六局的比赛中击败了巨人加里·卡斯帕罗夫(Garry Kasparov),成为首台击败国际象棋卫冕冠军的电脑。14年后,IBM的沃森打败了IBM冒险!全明星布拉德·拉特和肯·詹宁斯在他们自己的比赛中。

但是很多有竞争力的计算机智能都是在任务或游戏中进行测试的,赢家和输家都是明确的。它已经被编码,导致一个定义的二进制算法的胜利之路。计算机科学家们一直没有找到一个系统,它可以与细微差别进行交互,从而实现与人类的复杂对话。“辩论者计划”正在接近这个目标。

在新自然IBM的研究人员组成了一个合作团队,他们在公司位于以色列海法和爱尔兰都柏林的人工智能研究中心报告了他们的系统的进展。2019年辩论结束后,15名虚拟观众就近80个不同的话题对“辩论计划”和3名人类辩论专家的演讲进行了评估。

在这些人机竞赛中,任何一方都不允许访问互联网。取而代之的是,每个人都有15分钟的时间来“整理他们的想法”,正如IBM研究院全球实验室的公关经理克里斯托弗·p·夏卡所说。这意味着,人类辩手可以花一点时间来记下手头上某个话题的想法,比如补贴学前教育,而“辩手计划”则会梳理之前存储的数百万篇报纸文章和维基百科条目,分析特定句子、特定话题的共性和分歧。在准备时间结束后,双方轮流进行四分钟的演讲,然后分别进行两分钟的闭幕词。

根据观众和读者的评分,“辩论计划”在2018年成功“赢”了三位专家中的一位,而且在开场陈述方面得分很高。但平均而言,它仍然略低于人类的整体水平。障碍在于保持一种有意义的交流,这种交流可以有多个方向,类似于真实的人类对话。尽管如此,这项研究结果对开发能够理解并产生有意义的语言互动的人工智能系统起到了推动作用。

“近年来,在开发能够理解和生成人类语言的算法方面做了大量的工作,”IBM研究中心的杰出工程师、“辩论者项目”(Project Debater)自成立以来的首席研究员诺姆·斯洛尼姆(Noam Slonim)说。“研究的任务范围从预测一句话的情感到机器翻译和对话系统等更复杂的任务。”他补充说,IBM的业绩反映了一个系统,虽然仍然排在第二智人“对手”可以以一种其他AI系统迄今为止无法企及的方式与对手互动。许多这样的系统可以生成具有实际语法的有意义的语言。但该领域的一个大问题是,机器是否能够模仿实际的人类推理或变得有意识。

苏格兰邓迪大学的计算机科学家克里斯·里德(Chris Reed)说:“在舞台上,辩论者计划远非完美,它的失误揭示了人类辩论和辩论有多么困难,有多么明确。”里德没有参与这项研究,但他在2019年的辩论中作为观众在场。“然而,‘辩论者项目’的研究是创新工程的杰作....IBM团队的成就也从系统的实时性能中得到了体现:不仅使用了从非常大的数据集中提取的知识,而且还对人类的话语进行了实时响应。”

纳塔拉简和其他辩论者还没有准备好向“机器霸主”认输。但无论是好是坏——人们希望更好——机器学习正开始进入一个超越国际象棋和围棋规则的领域。