登上《自然》封面的索尼赛车AI，是如何击败人类顶级车手的？

作为这个世代中为数不多的拟真赛车游戏，《GT赛车Sport》的玩家们可能从来没有想过，自己玩的游戏，有天会登上世界顶级科学期刊《自然》（Nature）的封面。

在昨天，索尼公布了一款由其旗下AI部门开发的人工智能技术，同时它也相应地成为了本周《自然》的“封面人物”，而这个人工智能的成就，是在《GT赛车Sport》中击败了全球一流赛车游戏选手们。

Nautre第7896期封面

或者，用“征服”这个词来形容更为合适。在索尼演示的四位AI车手与四名职业赛车玩家的对决中，冠军AI的最高圈速比人类中的最优者快了两秒有余。对一条3.5英里长度的赛道而言，这个优势一如AlphaGo征服围棋。

在近五年的研发时间里，这个由索尼AI部门、SIE还有PDI工作室（也就是《GT赛车》开发商）共同研发的AI完成了这个目标。

索尼为这个AI起名为GT Sophy。“索菲”是个常见的人名，源自希腊语σοφία，意为“知识与智慧”。

Sophy和一般的游戏AI有什么区别？

AI在游戏中打败人类，并不是一件稀奇事。OpenAI在“冥想训练”了成千上万场DOTA2后击败过当时的Ti8冠军OG，谷歌的AlphaStar也曾面对《星际争霸2》的顶级职业选手时表现过碾压态势，而我们每个普通玩家，也都尝过“电脑[疯狂的]”的苦头。

2019年，OpenAI曾经在仅开放部分英雄选用的限制条件下击败过OG

但这些“打败”并非一回事。要明白GTS中的AI车手Sophy意味着什么，首先要明确Sophy和其一个单纯“你跑不过的AI”有什么区别。

对过往赛车游戏里的AI而言，尽管呈现形式都是游戏中非玩家控制的“智能体”，但传统意义上的AI车手通常只是一套预设的行为脚本，并不具备真正意义上的智能。

传统AI的难度设计一般也是依赖“非公平”的方式达成的，比如在赛车游戏中，系统会尽可能削弱甚至消除AI车的物理模拟，让AI车需要处理的环境参数远比玩家简单。

而要塑造更难以击败的AI敌人，也不过是像RTS游戏中的AI通过暗中作弊的方式偷经济暴兵一样，让AI车在不被注意的时刻悄悄加速。

所以对于具备一定水平的玩家而言，赛车游戏里的传统AI在行为逻辑和策略选择上几乎没有值得参考的点，遑论职业赛车游戏选手。

而Sophy则是和AlphaGo一样，通过深度学习算法，逐渐在模拟人类的行为过程中达到变强：学会开车，适应规则，战胜对手。

这种AI带给玩家的，完全是“在公平竞争中被击败”的体验。在被Sophy击败后，一位人类车手给出了这样的评价：“（Sophy）当然很快，但我更觉得这个AI有点超乎了机器的范畴……它像是具备人性，还做出了一些人类玩家从未见过的行为。”

这难免再次让人联想到重新改写了人类对围棋理解的AlphaGo。

相对于围棋这种信息透明的高度抽象游戏，玩法维度更多、计算复杂度更高的电子游戏，在加入深度学习AI之后，其实一直很难确保“公平竞技”的概念。

例如在2019年征战《星际争霸2》的AlphaStar，基本没有生产出新的战术创意，只是通过无限学习人类选手的战术，再通过精密的多线操作达成胜利——即便人为限制了AlphaStar的APM，AI完全没有无效操作的高效率也并非人类可比。

这也是为什么在AlphaStar与人类职业选手的对抗记录里，当AI用“三线闪追猎”这样的神仙表演击败波兰星灵选手MaNa后，并不服气的MaNa在赛后采访中说出了“这种情况在同水平的人类对局中不可能出现”这样的话。

AlphaStar用追猎者“逆克制关系”对抗MaNa的不朽者部队

同样，《GT赛车》也是一款与《星际争霸2》具备同样复杂度的拟真赛车游戏。

在专业赛车玩家的眼中，路线、速度、方向，这些最基本的赛车运动要素都可以拆解为无数细小的反应和感受，车辆的重量、轮胎的滑移、路感的反馈……每条弯道的每次过弯，都可能存在一个绝佳的油门开度，只有最顶级的车手可以触摸到那一缕“掌控”的感觉。

在某种意义上来讲，这些“操纵的极限”当然能够被物理学解释，AI能掌握的范围显然要大于人类。所以，Sophy的反应速度被限制在人类的同一水平，索尼为它分别设置了100毫秒、200毫秒和250毫秒的反应时间——而人类运动员在经过练习后对特定刺激的反应速度可以做到150毫秒左右。

无疑，这是一场比AlphaStar更公平的战斗。

Sophy学会了什么

和Sophy为数众多的AI前辈一样，它也是利用神经网络等深度学习算法来进行驾驶技巧的训练。

Sophy在训练环境中会因为不同的行为遭受相应奖励或者惩罚——高速前进是好的，超越前车则更好；相应地，出界或者过弯时候撞墙就是“坏行为”，AI会收获负反馈。

在上千台串联起的PS4组成的矩阵中，Sophy经受了无数次模拟驾驶训练，在上述学习里更新自己对《GT赛车Sport》的认知。从一个不会驾驶的“婴儿”到开上赛道，Sophy花费了数个小时的时间；一两天后，从基础的“外内外”行车线开始，Sophy已经几乎学会了所有常见的赛车运动技巧，超越了95%的人类玩家。

索尼AI部门为Sophy搭建的“训练场”

然而，赛车并不是一个人的游戏。即便Sophy在去年7月份的比赛中，已经可以没有其他赛车的情况下拥有超出顶级人类选手的计时赛成绩，但在真实的多人游戏中，Sophy还需要学会与对手进行对抗上的博弈，理解其他车手的行为逻辑。

因此，索尼AI部门的科研人员对Sophy进行了更多的“加练”，比如面对其他车时如何插线超车、阻挡卡位。到最后，Sophy甚至还被“教育”到能够理解和遵守赛车运动中的比赛礼仪——比如作为慢车时进行让车，同时避免不礼貌的恶意碰撞。

赛车游戏中的AI车，一般即便会尝试躲避与玩家擦碰，其实现方式也只是不自然地闪躲。而Sophy呈现出的“比赛理解”，都是依靠脚本运行的传统赛车AI无法做到的。

到了10月，Sophy已经可以在正式的同场比赛中击败最顶级的人类选手。

索尼邀请的四位人类车手，其中包括GT锦标赛三冠王宫园拓真

比如第一场在Dragon Trail（龙之径）上进行的比赛。作为《GT赛车Sport》的驾驶学校尾关，每个GTS玩家应该都相当熟悉这条赛道（以及DLC中的“汉密尔顿挑战”）。在数万个小时的训练过后，排名第一的Sophy车手已经可以踩着绝对的最优路线保持全程第一。

而在四个Sophy与四位人类车手角逐的第二个比赛日中，AI们的优势进一步扩大了——几乎达成了对顶级人类玩家的碾压。

如果只是在路线的选择和判断上强过人类，用更稳定的过弯来积累圈速优势，这可能还没什么大不了的。

但研究者们认为，Sophy几乎没有利用在用圈速上的绝对优势来甩开对手（也就是AI身为非人类在“硬实力”上更强的部分），反而在对比赛的理解上也超过了人类玩家，比如预判对手路线的情况下进行相应的对抗。

在《自然》论文所举的案例中，两名人类车手试图通过合法阻挡来干扰两个Sophy的首选路线，然而Sophy成功找到了两条不同的轨迹实现了超越，使得人类的阻挡策略无疾而终，Sophy甚至还能想出有效的方式来扰乱后方车辆的超车意图。

Sophy还被证明能够在模拟的萨尔特赛道（也就是著名的“勒芒赛道”）上执行一个经典的高水平动作：快速驶出前车的尾部，增加对前车的阻力，进而超越对手。

更令研究者称奇的是，Sophy还捣鼓出了一些非常规的行为逻辑，听上去就像AlphaGo用出新的定势一样。通常，赛车手接受的教育都是在过弯时“慢进快出”，负载只在两个前轮上。但Sophy并不一定会这么做，它会在转弯时选择性制动，让其中一个后轮也承受负载。

而在现实中，只有最顶级的F1车手，比如汉密尔顿和维斯塔潘，正在尝试使用这种三个轮胎快速进出的技术——但Sophy则完全是在游戏世界中自主学会的。

曾经取得三次GT锦标赛世界冠军的车手宫园拓真在与AI的对抗中落败后说，“Sophy采取了一些人类驾驶员永远不会想到的赛车路线……我认为很多关于驾驶技巧的教科书都会被改写。”

“为了更好地了解人类”

区别于以往出现在电子游戏中的先进AI们（比如AlphaStar），Sophy的研究显然具备更广义、更直接的现实意义。

参与《自然》上这篇论文撰写的斯坦福大学教授J.Christian Gerdes就指出，Sophy的成功说明神经网络在自动驾驶软件中的作用可能比现在更大，在未来，这个基于《GT赛车》而生的AI想染会在自动驾驶领域提供更多的帮助。

索尼AI部门的CEO北野宏明也在声明中表示，这项AI研究会给高速运作机器人的研发以及自律型驾驶技术带来更多的新机会。

Sophy项目官网的介绍

但如果我们将目光挪回作为拟真赛车游戏的《GT赛车》本身，Sophy的出现，对大众玩家和职业车手而言同样具备不菲的意义。

正如文章前面所说，在目前市面上大多数拟真赛车游戏中，“传统AI”已经是一个完全不能带给玩家任何乐趣的事物。这种依赖不公平条件达成的人机对抗，与赛车游戏开发者希望带给玩家的驾驶体验是相悖的，人类玩家也无法从中获得任何教益。

在索尼AI部门发布的纪录片中，“GT赛车之父”山内一典就表示，开发无与伦比的AI可能是一项了不起的技术成就，但这对普通玩家来说可能不是什么直白的乐趣。

因此，山内承诺在未来的某个时候，索尼会将Sophy带入到三月份即将发售的《GT赛车7》中。当Sophy能够更加了解赛场上的环境和条件，判断其他车手的水平，一个这样智能又具备风度的AI，就能够在与人类比赛时，为玩家提供更多真实的快乐。

在拟真赛车游戏逐渐“小圈子化”，众多厂商都做不好面对纯新玩家的入门体验的今天，或许一个AI老师的存在，有机会能给虚拟世界中的拟真驾驶带来更多的乐趣，就像《GT赛车4》的宣传片片头所说，“体验汽车生活”。

这可能才是一个基于游戏而生的AI能为玩家带来的最重要的东西——如同山内一典对Sophy项目的评论， “我们不是为了打败人类而制造人工智能——我们追求人工智能，是为了最终更好地了解人类。”

本文来自微信公众号“游戏研究社”（ID:yysaag），作者：AriaX，36氪经授权发布。

Sophy和一般的游戏AI有什么区别？

Sophy学会了什么

“为了更好地了解人类”

推荐内容

登上《自然》封面的索尼赛车AI，是如何击败人类顶级车手的？

冲上App Store免费榜首，《啫喱》到底有什么魔力？

情人节将至，韦伯望远镜首次太空「睁眼」，这枝18星「黑玫瑰」只送给你

执御老将再出发，ChicPoint能否在中东赶超Shein？

情人节，我的情书代写生意爆单：每天40多封，写到手烂也写不完

Chrome 8 年来首次换Logo，能看明白算我输

刚刚，辉瑞新冠口服药，在国内应急附条件获批，死亡率降低89%

史上最传奇的头骨：被铁棒贯穿，被挖坟研究，最终登上 Science 封面

苹果、Google、宜家等20多家大公司，都在这件事上骗了我们

9点1氪丨知乎回应裁员传闻；国家医保局回应种植牙纳入集采：方案基本成熟；乐视网被恢复执行12.9亿元

电视正在消失

中国公司全球化周报｜小鹏汽车与欧洲经销商达成战略合作；特斯拉2021仍为全球电动车销量冠军

小镇父母的人情江湖，在抖音快手里

咪咕大火、股价大涨，中移动的“腾讯梦”还有救吗？

哲学真的是无用之学吗？

36氪领读 | 埃隆·马斯克的决策逻辑：与万物原理同行

你离成功并不远：成功人士的7个心理习惯

谁是货运“滴滴”？快狗上市能起多大浪？

冬奥走红的氢能源车，你开不起

​这个春节，谁是游戏市场最大赢家？

近30家品牌“押宝”谷爱凌，效果如何？

年年被玩家骂摆烂，但他们还是7天狂卖超650万份

“新意不足”的Android 13预览版，还隐藏了哪些信息

卖空气炸锅给老外卖成世界第一，年入15亿，这家公司要上市了

搜索引擎倒在Web3.0？

“AI裁判”眼中的羽生结弦

元宇宙头部玩家图鉴

登顶免费榜，春节最大赢家居然是一款“元宇宙”？

咪咕的限时“水晶鞋”

《月球陨落》票房失利，中美合拍走向何方

泡泡玛特：我这么努（赚）力（钱），为什么你们还是不认可

国外创投新闻 | AI配音技术公司「Deepdub」A轮融资2000万美元，人工智能代替真人配音的时代来临了吗？

冬奥点燃冰雪经济：中国每4人就有1人滑雪，雷军李彦宏最爱东北雪场

从淘小铺到东小店关闭，社交电商已退潮？

用时不到一个月！PC《战神》销量超200万份

马斯克发布人类最强星际飞船，去火星又猛又快又省钱

索尼收购棒鸡：36亿美元背后的逻辑

一墩难求，这家公司趁势涨了25亿

最前线｜阿里冬奥大数据：数据中心节能约“每年8吨煤”，转播延迟下降30%

冬季滑雪忙，雪季骨科忙

疫情下的连锁巨变：有人选择深造，车道变人行道，图书销量有增无减

寻访顶流冰墩墩诞生地：705号工作室，藏着南方人对冰雪的渴望

曝《死亡岛2》仍在积极地开发 或将于年内发布

虎年大吉！《命运2》中国玩家送惊喜送节日惊喜

曝《COD战区2》将于明天公布！与《现代战争2》一同推出

《家园》开发商将改变工作制度 一周工作四天

生物技术可以对固体废物中的哪些物质进行处理？

干细胞“越老越没用” 还是“越进化越没用”

把冬奥专项当作“航天任务” 为北京冬奥会打上“航天烙印”

用人类心脏细胞造机器鱼，游泳速度比真鱼还快，哈佛新研究登上Science

TikTok表示，「声音」正在让品牌焕发新机

对开源的执念：Matt Mullenweg 能拯救互联网吗？（一）

「AI番茄」背后，科技农人的新图谱

对开源的执念：Matt Mullenweg 能拯救互联网吗？（二）

对开源的执念：Matt Mullenweg 能拯救互联网吗？（三）

刚评上院士的马斯克就飘了，说要每天发射三次大火箭，向火星转移100万吨物资

青藏高原何时隆升到如今4000多米的高度？

科技场馆助力赛场逐梦 北京冬奥会的科技魅力

火山剧烈喷发对全球气候有何影响？

中国科技馆巨幕影院胶片电影落幕演出即将举办！

具有良好发展态势的元宇宙 在落地过程中会遭遇哪些困难？

科学家开发新技术 利用旧口罩可制造经济型电池

冬奥会不同冰上项目所需的冰有何不同？

花样滑冰高贵优雅 冰为什么那么滑？

科学家开发新技术 可从煤炭废料中提取稀土元素

“另一只靴子”落地！多重基因剪刀“拿下”小麦白粉病

科技巨头齐聚冬奥会，AI技术与应用哪家强？

数字阅读三分天下，阅文、掌阅、中文在线战略差异几何？

专注物联网安全，「信长城」完成千万元级B++轮融资

游戏大国日本难以主导行业重构的原因

TikTok电商，只等一个“罗永浩”？｜36氪出海深度

为赚拼多多的钱，我们耗尽了人脉

焦点分析 | 市值跌去五分之四，这家巨头背后是一个光伏帝国的忧患

一加入局、红米发力，游戏手机也有“路线之争”

元宇宙重塑游戏股

时空道宇领航智慧出行：大规模商用即将展开

这个春节，谁是游戏市场最大赢家？

曝《死亡岛2》仍在积极地开发或将于年内发布

《家园》开发商将改变工作制度一周工作四天

科技场馆助力赛场逐梦北京冬奥会的科技魅力

具有良好发展态势的元宇宙在落地过程中会遭遇哪些困难？

科学家开发新技术利用旧口罩可制造经济型电池

花样滑冰高贵优雅冰为什么那么滑？

科学家开发新技术可从煤炭废料中提取稀土元素

Salesforce有意推出NFT云服务将 NFT技术带到企业软件领域

Jen Simmons：“ Safari 是最糟糕的它是新的 IE”

B站：已处理冬奥有关违规内容超一万条封禁其中442个账号

“雪道尽头是骨科”引热议专家提醒冰雪运动千万注意热身

注意！不要随便二次创作冬奥会赛事视频有可能构成著作权侵权

神舟十三号载人飞船将首次采用快速返回方案计划4月中旬返回

“网红”冰墩墩官方NFT盲盒将开售每人限购5个！

元宇宙炒房热一块虚拟土地被炒至数千万元！