为了在不失去控制的情况下沿着最快的“赛车线”冲过拐角,赛车手必须在精确的时间序列中刹车、转向和加速。这一过程取决于摩擦的极限,而这些极限是由已知的物理定律控制的——这意味着自动驾驶汽车可以学会以尽可能快的速度完成一圈(就像一些自动驾驶汽车一样)已经完成).但当自动驾驶必须与其他车辆共享空间时,这就成为一个更加棘手的问题。现在科学家们虚拟地解开了挑战通过训练一个人工智能程序,让它在超现实的赛车游戏《gt赛车》(Gran Turismo Sport)中超过人类对手。这些发现可以为自动驾驶汽车的研究人员指出让这项技术在现实世界中发挥作用的新方法。

人工智能已经在某些电子游戏中征服了人类玩家,比如星际争霸2而且队伍2.但是《gt赛车》在很多方面都与其他游戏不同,索尼AI美国部主管Peter Wurman说道,他也是这项新研究的合著者自然.他解释道:“在大多数游戏中,环境定义了规则并保护用户免受其他玩家的伤害。“但在比赛中,赛车彼此非常接近,(人工智能)代理必须学习和部署一种非常精致的礼仪感。为了赢得比赛,他们必须尊重对手,但他们也必须保持自己的驾驶路线,确保他们不会轻易让路。”

为了让他们的程序熟悉情况,索尼人工智能研究人员使用了一种名为深度强化学习的技术。他们奖励AI的某些行为,比如保持在赛道上,保持对车辆的控制和尊重比赛礼仪。然后,他们放开程序,尝试不同的比赛方式,使其能够实现这些目标。索尼人工智能团队训练了多个不同版本的人工智能,称为GT Sophy (GT Sophy),每个版本都专门在特定的赛道上驾驶一种特定类型的汽车。然后,研究人员将该程序与人类gt赛车冠军进行了较量。在去年7月进行的第一次测试中,人类获得了最高的整体团队得分。在2021年10月的第二次比赛中,人工智能突破了。无论是个人还是团队,它都击败了人类敌人,创造了最快的圈速。

人类玩家似乎对失败泰然处之,有些人还喜欢与人工智能斗智斗勇。索尼人工智能战略与合作总监埃里卡·卡托·马库斯(Erica Kato Marcus)说:“我们还从驾驶员那里听到,他们还从索菲的动作中学到了新东西。”“AI使用的台词非常复杂,我可能一次就能完成。但它太难了,我永远不会在比赛中尝试它,”艾米丽·琼斯说,她是2020年国际汽联认证的GT赛车锦标赛的世界决赛选手,后来与GT索菲比赛。尽管琼斯表示,与人工智能竞争让她感到有点无力,但她认为这种经历令人印象深刻。

赛车在gt赛车运动。
赛车在gt赛车运动。资料来源:索尼互动娱乐公司

琼斯说:“赛车和许多运动一样,都是为了尽可能接近完美的一圈,但你永远无法真正做到。”“和苏菲在一起,看到一些东西是疯狂的完美的腿上。没有办法更快了。”

索尼团队现在正在进一步开发人工智能。沃曼说:“我们为每个赛车赛道组合训练了一个特工,一个GT Sophy的版本。”“我们正在考虑的一件事是:我们能否训练一种可以在游戏中任何赛道上的任何汽车上运行的单一政策?”在商业方面,索尼AI也在与《GT赛车》的开发商,索尼互动娱乐的子公司Polyphony Digital合作,有可能在未来的游戏更新中加入GT Sophy的版本。要做到这一点,研究人员需要调整人工智能的表现,使其成为一个具有挑战性的对手,但不是不可战胜的对手——即使是对那些技术不如迄今为止测试过人工智能的冠军的玩家来说也是如此。

因为《Gran Turismo》提供了对特定赛车和特定赛道的真实近似,以及控制每种赛道的独特物理参数,所以这项研究可能也适用于电子游戏之外的领域。人工智能研究公司OpenAI的软件工程师布鲁克·陈(Brooke Chan)说:“我认为有趣的一点是,它与Dota游戏的区别在于,它是在一个基于物理的环境中。”他是OpenAI Five项目的合著者,该项目在Dota 2中击败了人类。“它不在现实世界中,但仍然能够模仿现实世界的特征,这样我们就可以训练人工智能来更多地理解物理世界。(Chan没有参与GT Sophy的研究。)

“《gt赛车》是一个非常好的模拟器——它在一些方面被游戏化了,但它确实忠实地代表了你在不同的汽车和不同的赛道上所得到的许多差异,”斯坦福大学机械工程教授J. Christian Gerdes说,他没有参与这项新研究。“在我看来,这是最接近发表论文说人工智能可以在比赛环境中与人类正面交锋的事情。”

然而,并不是所有人都完全同意。他说:“在现实世界中,你必须应对骑自行车的人、行人、动物、从卡车上掉下来的东西、你必须避免的掉落在路上的东西、恶劣的天气、车辆故障等等。史蒂文Shladover他是加州大学伯克利分校交通研究所加州先进交通技术合作伙伴(California PATH)项目的研究工程师,他也没有参与该项目自然纸。这些东西在游戏世界中都没有出现。”

但格德斯表示,GT sophie的成功仍然是有用的,因为它颠覆了关于自动驾驶汽车必须编程方式的某些假设。自动驾驶汽车可以根据物理定律或人工智能训练做出决定。格德斯说:“如果你看看文献中的内容,在某种程度上,人们在道路上所做的事情,运动规划师将倾向于基于物理的优化,而感知和预测部分将是人工智能。”然而,对于GT Sophy,人工智能的运动计划(例如决定如何在不造成碰撞的情况下接近性能上限的拐角)是基于人工智能的公式。他说:“我认为对自动驾驶汽车开发者的教训是:这里有一个数据点,也许我们的一些先入之见——这个问题的某些部分最好用物理方法来解决——需要重新审视。”“AI或许也能在那里发挥作用。”

格德斯还认为,GT索菲的成就可以为人类和自动化系统互动的其他领域提供借鉴。他指出,在《Gran Turismo》中,人工智能必须在实现赛道上最快路线的困难问题和与通常不可预测的人类顺畅互动的困难问题之间取得平衡。格德斯说:“如果我们真的有一个人工智能系统,可以在那种环境下做出一些复杂的决定,它可能不仅适用于自动驾驶,还适用于机器人辅助手术或在家帮忙的机器等交互。”如果你有一个任务,一个人和一个机器人一起工作来移动东西,在某种程度上,这比机器人自己尝试去做要棘手得多。”

本文标题为“AI冠军”的一个版本被改编以列入2022年5月号的新利18luck体育《科学美国人》。