几乎每个人的智能手机都配备了语音AI助手。
你可能和ta定过闹钟、查过资料、甚至玩成语接龙或者斗过嘴。现在,想象一下,如果你的Siri此刻拥有了一个人类形象,ta会是什么样子?你会更加亲近ta吗?
这正是一众数字人创企正在尝试的事情。近日,一向对机器人硬件有所偏好的软银,相中了一家特别的数字人创企,领投了该公司的7000万美元融资。有了这笔资金,公司的总投资已达1.35亿美元,其中,李嘉诚旗下维港投资的身影出现在3次投资之中。
这家公司的名字就野心十足——Soul Machines,有一丝要在机器上复刻人类灵魂的意味。更早之前A轮融资,这家公司便获得来自李嘉诚旗下的维港投资(Horizons Ventures)和Iconiq Capital共750万美元资金注入。
Soul Machines正在向世界输出一批数字人,并希望这些有情感的虚拟AI们,能够进一步融入人类的真实世界。
未来几年,从银行到商店客服,从手机到汽车,从视频网站到社交平台,这群新的物种很可能变得无处不在。
那么,接下来,Soul Machines会是全世界最成功的数字人供应商吗?
图丨Soul Machines官网展示的数字人
01 拿过奥斯卡奖的创始人
首先,打造一个数字人和培养一名人类难度自然是不可同日而语,但可不要小瞧一个数字人的诞生。
按照大的技术方向拆解的话,一个基础的数字人将包括动作捕捉、渲染建模、AI能力的注入等前沿技术。目前世面上的数字人供应商们,也可以按照上述3个不同侧重方向进行简单分类。
其中,动作捕捉和渲染建模主要决定了一个数字人的形象,而AI能力则负责塑造数字人与人类交互时的反应。
Soul Machines的创始人——Mark Sagar——则是少有的兼具这些方面从业背景的人。
Mark Sagar 是电影《阿凡达》《金刚》《蜘蛛侠2》背后的灵魂人物。凭借他和他的团队在这些电影中的虚拟人物技术,他曾于2010年和2011年获得奥斯卡颁发的科技奖。
更早之前,在于奥克兰大学生物工程学院动画技术实验室任主任期间,他就开始进行能够自主互动的动画系统的开发,以助力下一代人机互动和面部动作技术的发展。
以自家女儿为原型,Mark Sagar带领动画技术实验室研发出一个“永生”于屏幕中的数字宝宝—— Baby X,这个宝宝拥有一个数字大脑,可以感知、学习、进步和交流,基于生物仿真原理,它的形象是一个18月左右的婴儿样貌,其面部表情会随着思想、认知、情绪的变化而改变,且可以倾听并对语言给出表情和动作上的反馈。虽然现在我们已经对这样的虚拟形象不陌生,但是在2016年,开发出这样一个具有情感响应功能、有着个性和特色的虚拟人,实属新鲜。
图 | Baby X (来源:Fanatical Futurist YouTube)
2016年,一个特别的机会降临到Mark Sagar身上。李嘉诚基金会成员参观奥克兰大学时,Mark Sagar和他的Baby X项目被安排到了行程之中。那次展示相当成功,之后为Mark Sagar的公司Soul Machine带来了维港投资的资金:同年12月,维港投资宣布,和Iconiq Capital牵头Soul Machines的750万美元A轮融资。
不过,Soul Machines为他们的客户提供的产品,却不是再是这个“数字小婴儿”,而是更成熟的数字人。
Mark Sagar和他的团队看到了数字人在增强公司品牌体验上的潜力。面向企业提供定制化的数字人是Soul Machines成立之后的重心。
他们想要解决这样一个基本问题:大部分公司与C端用户的最主要的互动,依赖应用程序和网站进行,那么,企业如何在日益数字化的世界中塑造个人品牌体验?
对于这一问题,Soul Machines认为答案是数字化劳动力——数字人。
理想情况下,数字人在一天中的任何时候使用任何语言提供服务,并能很好地模仿人类体验,使人类产生情感反应,最终提高品牌忠诚度。当C端用户与Soul Machines提供的数字人互动时,还可以收集C端用户面部表情和情绪反应方式信息,匿名化后用于训练数字人背后的数字大脑,以便它持续解释并改进反应。
这就像与虚拟销售员交谈。
举个例子,作为体验的一部分,你可以在电子商务平台购买护肤品,并有机会与智能护肤顾问交谈。特别是在疫情期间,我们发现一个关键问题是,越来越多的购物行为和体验品牌的方式是在数字世界中完成的。
“传统上,数字世界具有某种业务主导性,甚至聊天机器人也具有很强的针对性,你输入一个问题,就会得到对应的回应。促使我们思考的是,应该如何想象人类与未来所有数字世界的互动?”公司联合创始人兼首席商务官Greg Cross曾如此表示。
02 Soul Machines的数字人方法论
目前,不少重视线上购物体验的国际品牌已经开始和Soul Machines进行这种尝试。
比如雀巢。Soul Machines为它打造了“Ruth”,一个由AI驱动的烘焙老师,可以回答关于烘焙的基本问题,并根据客户厨房里的材料帮助他们找到适用的食谱。除了雀巢以外,梅赛德斯奔驰、SKI-II和索尼也都和Soul Machines定制了它们的数字人。
图丨Soul Machines的企业用户分布行业
值得一提的是,Soul Machines还与世界卫生组织合作,创建了Florence,一个虚拟卫生工作者,可以全天候为那些试图戒烟或了解新冠疫情的人提供咨询服务。Florence的存在,也预示着数字人在远程医疗领域的潜在应用能力,比如,对于更喜欢现场视频体验的患者,数字人可以帮助提供一定程度的隐私和舒适性,让患者以一种舒服的方式提出敏感问题,从而使医生能够处理更多医疗情况。
图源:Twitter
软银投资顾问公司投资总监Anna Lo表示,Soul Machines的数字人解决方案在服务行业尤其受到青睐。这些行业中的企业希望增强在线客户服务体验,而不仅仅是基于文本的聊天或纯音频电话,“借助自主动画,Soul Machines的定制数字人是一个有用的客户获取工具。”
数据显示,使用了Soul Machines的数字人之后,有客户的C端用户的转化率平均提高了4.6倍,用户满意度提高了2.3%。在Soul Machines与SK-II的合作中,客户在与数字人“Yumi”互动后,购买的可能性提高了两倍。
这种直接收益之外Greg Cross则指出数字人对于企业的另一个好处还在于,对于消费者来说,许多数字助理可能感觉更像是一个噱头而不是一个有用的工具,但这些助手允许公司收集客户的第一方数据。这些数据可用于获取和留住客户并增加更多价值,而不是花巨资从社交媒体平台或谷歌广告联盟那里购买这些数据。
目前,这家公司的团队成员由 AI 研究人员、神经科学家、心理学家、艺术家共同组成,既提供我们上文提到的面向企业的定制化数字人业务,也提供标准化数字服务,用户可以从Digital DNA Studio中选择标准化的数字人(长相、声音、12+语言、性格、会话能力等等)应用到网站上,并监测数字人的流量。
当然,Soul Machines设想用数字人改善品牌线上体验的种种,这些事情成立的一个大前提是,数字人本身能够提供好的使用体验。
事实上,正如语音助手市场早期常给人留下“人工智障”的笑料一样,眼下初出茅庐的数字人产业,其实也有着很大的改善空间,核心在于更快地持续提升人机交互体验。
为了能够衡量数字人产品的进展,Soul Machines撰写了一份白皮书,提出了一个由五个级别组成的数字人进化框架:
0级,即“无自主权“,只是一个录制的动画,就像一部卡通片。
第1级和第2级,涉及了更多理解人类反应并作出更真实表现的动画。此处可以想象一下,《阿凡达》或《指环王》等电影中,动画人物如何模仿真实演员的动作。(比如实时形象生成上,数字人的口型或表情略为僵硬等还是业内尚未解决的大问题)
第3级至第5级,则属于实时的、动态生成的、具有内容感知力的数字人。
Soul Machines认为自己目前处于第3级,即"认知训练的动画(CTA)系统,该系统使用算法来生成一组动画,而不需要明确的作者。作者被专注于定义内容和角色范围的AI训练师。系统会告知训练师需要改进的领域。
Cross介绍,Soul Machines正在努力实现第4级自主性,或“基于目标的形象”。该系统在训练师的指导下尝试新的交互,并从每个交互中学习。这方面的一个近似的应用例子是虚拟AI助手,但拥有实时形象的虚拟AI助手更接近Soul Machines的设定。
最近,Soul Machines就宣布了一个更大胆的计划,他们打算建立一个名人虚拟孪生名录。
去年开始,该公司与洛杉矶湖人队的篮球运动员 卡梅罗·安东尼合作,创造了他的数字人形象。更早之前,说唱歌手 Will.I.am也和Soul Machines进行了类似的合作。
图源:RNZ
没错,Soul Machines还设想了一个人类可以自由创建自己的数字人的世界。“我们非常有可能在未来的某个时间创造出自己的数字孪生体,并且能够通过与他们在线互动来训练这些孪生体,”Cross说。
不知道作为读者的你有没有心动,想要马上尝试打造虚拟世界中的另一个“你”。至少,作者本人已经开始幻想,我的数字人化身能代替我上班码字。
文末互动:
你对虚拟数字人这个新兴产业怎么看呢?你想要个数字孪生体吗?
首图来源:SIMENS
本文来自微信公众号 “硅兔赛跑”(ID:sv_race),作者:椎名,编辑:王子,原标题《李嘉诚连投3轮、软银匆忙入局,最成功的数字人创企竟是它?》,36氪经授权发布。