图片来源@视觉中国

2023年4月10日,原搜狗CEO王小川官宣创办百川智能——一家研发并提供通用人工智能服务的中国公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。


(资料图片)

百川智能将借助语言AI的突破,构建“中国最好的大模型底座”,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠地获取世界知识和专业服务。

很多人对王小川不陌生。

王小川曾任搜狗CEO,先后主导开发了搜狗搜索、搜狗输入法、搜狗浏览器等产品,首创破局搜索的“三级火箭模式”,先后推动了阿里巴巴和腾讯战略入股搜狗,并于2017年带领搜狗在美国纽交所上市,此后搜狗被腾讯私有化收购,王小川告别搜狗。王小川先后担任第十三届全国政协委员及提案委员会委员、九三学社第十四届中央委员会委员及促进技术创新工作委员会主任、清华大学计算机学科顾问委员会委员等职务,曾获1996年第8届国际信息学奥林匹克竞赛(IOI)金牌、2014年北京市劳动模范称号、2015年北京市科学技术奖一等奖、2018年中国青年五四奖章、2019年第十五届中国青年科技奖、2019年中国电子学会科学技术奖科技进步奖一等奖、2020年钱伟长中文信息处理科学技术一等奖等奖项和荣誉。

站在多年积累之上,再创业的王小川无疑是中国AI大模型创业阵容中最受关注的人之一。王小川一直被外界称为“五道口守门员”,他来到北京二十余年,始终没有离开过清华大学和搜狐大厦所在的五道口区域。离开搜狗542天后,这一次再创业,虽然换了一个身份,但“守门之路”依然继续。

本文,甲小姐于官宣当日在五道口独家对话百川智能CEO王小川,抵达官宣背后更深一层的思考。

谈认知:“AGI(通用人工智能)不是OpenAI,不是ChatGPT,也不是某个产品,而是一个大时代”

王小川:最初看到ChatGPT时,我没把它理解成一个严肃科学问题,比如你问个问题它答错了,但当你要求它“think step by step”,它就答对了,我最初觉得很好笑,直到今年1月底我开始认真看,才发现通用人工智能时代到了。

对于“该不该下场”,我可能是最后一个下判断的,但对于“这是不是AGI(通用人工智能)”,我在用完ChatGPT之后就知道了,我可能是第一个这么斩钉截铁认为它是AGI的人。

王小川:就像AlphaGo出现时我很早就确信它会赢,我是看论文的人。

王小川:现在对AGI还没定义,但我是做自然语言的,我深知语言多难。我们上学时学人和动物的核心区别是语言,维特根斯坦说“语言的边界就是世界的边界”。我的判断是,机器掌握语言,通用人工智能时代就到来了。

你也看过侯世达写的《表象与本质》,看完之后就很清楚什么叫AGI了。掌握语言, AGI就来了——这件事的逻辑清晰,不是我作为一个企业家的鸡汤说法。

只是我原来认为光从语言做大模型行不通,必须加图,但现在发现,大模型没加图就学会了。

王小川:广义上生命分几种,AGI主要指向创造智力。人最根本的需求是“生存”,我反复讲繁荣和延续人类文明,“繁荣”指向“生”,“延续”指向“存”我说的“生命”,既不是个体的生命,也不是AGI,而是整个人类文明——让人类文明能够更繁荣和延续是我的终极理想我希望向文明、向生命致敬。

王小川:第一,我是不怕竞争的。你也知道奥赛是怎么卷过来的,搞搜索是怎么卷过来的,我倒不怕竞争,我只是不希望过多突出竞争,但大家非得问。我觉得更好的逻辑不是竞争,是告诉大家AGI时代已经开启了。

王小川:目前我的思考跟OpenAI高度一致,也许是被他们感染。接下来文字模型搞完之后,视觉还有更复杂的事情,有些不是现在能弄清楚的,现在可能是“不知道自己不知道”的状态。但我想强调的是,本质上AGI不是OpenAI,不是ChatGPT,也不是某个产品,而是一个大时代。在我个人公开信的结尾有对这件事的刻画,我还是挺满意的。

王小川:不到100人。

王小川:没什么变化,主要还是靠自己思考。我自己的大脑不是一个靠各种数据驱动的深度学习系统,我的大脑就是一个pre-training model(预训练模型),我脑子里存了很多东西,pre-train之后靠大家激活。

王小川:至少我讲的都是我比较确认的东西,肯定还有更多我不知道的细节,但我的核心观点就是“通用人工智能时代已经来临”,这比其他都重要,我很笃定。

王小川:我还得继续强化,还不够。我现在涉及工作的内容问人,语言知识信息类的都问AI。比如我想知道“从10月30号到今天总共过了多少天”,直接问ChatGPT是最简单的,做大模型创业要开媒体见面会的建议也是ChatGPT告诉我的。

谈创业:“把自己的名字压进去了,把朋友都带进去了,自己最后就是兜底的这个人”

王小川:因为我不想什么都没有就官宣。

王小川:当然。我也觉得很陌生,之前和别人聊,经常一不小心就说成“我们搜狗”怎么样。

王小川:是的,核心就是把自己放进去。把自己的名字压进去了,把朋友都带进去了,自己最后就是兜底的这个人

王小川:没犹豫过。有人想做投资,而我是要创业的。

王小川:当你有势能去推动一件事情发生改变的时候,钱和名都不在意,只在意这件事本身。

王小川:我最关心的是有没有人愿意来一块儿干。

王小川:几个领军人物都是90年的。

王小川:不会。很多人可能对搜狗有误解,觉得搜索公司不够AI,其实搜狗现在12000片GPU在跑着,70%是做推理的搜狗是非常AI化的公司。搜狗的核心是语言相关工作,NLP是基本功,在大量文本数据中筛选高质量数据的方法和大模型是完全一样的;其次,在评价方法上,从平台输入一个问题,评价它的反馈答案好不好的标准和搜狗也相对一致,所以我们在一头一尾原始数据治理上相对有更多经验,也更擅长对生成内容的好坏做评价。当然,大模型会涉及独有的经验和算法,但我们学起来也会很快。

王小川:不同的更多。很多人还是从“几板斧”的视角来考虑这件事,比如怎么搞算力,怎么搞算法,怎么找人,找人的时候大家也缺乏对生命的思考,还是在用物理方式堆明星团队。

关于招人,我的观点是不能靠“拼”团队。也许资本喜欢听把明星团队凑一块儿的故事,但公司是个生命,生命不是这么长的——它得深度融合,它的基因得交融,公司是进化出来的,拼出来的团队反而生长速度会很慢。

搭团队既要有一个融合好的团队基础,一个好胚子,也要注入更高级的基因。我最近的核心工作就是把团队理顺了,到月底我们差不多就接近50人了,下旬我就到美国去,也得去抢人。

王小川:第一版今年年中就训出来了,500亿参数,年底可以做到中国最好,达到GPT-3.5以上的水平。当然,这不代表我们中间没有产品发出来。

王小川:基础参数量、在各个评测集上的测试效果发布产品后用户体验

王小川:我还在不断迭代,但我知道哪些东西是该有的。

王小川:To C,今年之内你会看到。

王小川:语言是知识的载体。什么行业知识密集,什么行业就适合大模型。教育服务高知群体,医学生要学8年才能走进工作岗位,这明显是知识密集的两个领域。

甲小姐:和李志飞对话时,他说大模型公司的首席科学家第一年会非常难受,看到别人的“孩子”已经满地跑,自己的“孩子”还没有出生,周围很多人会不断问你孩子什么时候出生?你要权衡应该快速发布抢占时间窗口,还是更有定力先把产品做到足够好,你对节奏怎么把握?

王小川:可能看到别的“孩子”跑出来了我会有压力,但我不会难受,因为团队在一,跟他们一块同进同出、同吃同住,知道他们的状态,他们的决定和我的决定是一体的。

王小川:是一把手工程,但要同欲同心。

谈路径:“今天的钱你可以买楼,你可以买卡,你可以买人,但它都不直接变成市场份额,也不一定有那么多网络效应”

王小川:首先我很尊重OpenAI,他们都是很聪明的人,但我更愿意自己想好后根据OpenAI的做法来自我验证,是一个校对、校准的过程,而不是抄袭或参考。

王小川:他们可以用几万张卡跑模型去通向AGI,有些深水区他们就不碰了,比如搜索、医学,他们可能躲着走,但我要去碰这些东西,我需要更考虑落地应用。

王小川:国内都难。

王小川:资源、能力到了才行。我之前提出过若干今天看起来自己都觉得非常惊叹的技术创想,比如我之前想过怎么预测下一个词,怎么预测视频的下一帧,但团队做不到,就放下来了。

王小川:首先,网络结构的设计需要科学家,不是工程师就能做的。国内能搞网络结构的人屈指可数,杨植麟搞一篇东西在国内简直就已经(牛得)不行不行了。第二是确实烧钱,这是信仰层面的事,你需要能得到无限资金供给,我觉得现在还不具备。

王小川:我觉得不能照抄openAI,文化不一样,角色不一样。OpenAI有几万张卡跑模型。我们为什么经常有悲观主义?因为你想要和OpenAI一样。

王小川:那团队要打过仗,练起来才行——你要相信团队能干这事,团队要相信你指的方向是正确的。这两个条件成熟才能做,这些东西是需要被验证的。否则你给我钱,团队hold不住,我在搜狗的时候这些是不成熟的。

王小川:有点难,也许以后会有。微软和OpenAI的组合里不是缺微软,是缺OpenAI。OpenAI用了7年时间孤独地做AGI,直到微软看见它,并且相中它。

王小川:我大概估算过,只是从0到1起步,5000万美元就够了但要持续做到最好,大概需要3-20亿美元。

但人比钱重要。这个领域不会像之前打车、外卖一样,钱能直接转化成市场份额——今天的钱你可以买楼,你可以买卡,你可以买人,但它都不直接变成市场份额,也不一定有那么多网络效应。

王小川:不会,训练肯定是中英文结合,中英文之间也不是翻译的关系,就像一个小孩,妈妈是中国人,爸爸是美国人,小孩不需要翻译,很自然就会了。

王小川:现在谈到算力,人们总有好多假设在里面,比如你需要弄1万张A100显卡。可你为什么要1万张?你要先想清楚。算力这件事其实打开看都是有办法的,而且几年后中国芯片企业也会有突破,这一点我特别有信心。

王小川:那是幸福的烦恼。

谈生态:“人究竟该怎么跟机器相处,这是我关心的问题”

王小川:如果非要选的话是苹果,我会往C端做。

王小川:我觉得这才是象征综合能力的做法,而不是单点能力。安卓开源是工程师就可以搞的事,但C端是一个更复杂的系统,苹果比安卓更综合。

王小川:这个问题可能还会有,但不是我最喜欢视角。我是从“人本”来看的——人究竟该怎么跟机器相处,这是我关心的问题。从这个角度出发,我更知道C端要什么。

王小川硅谷对于改变世界、创造不同的心态会好很多,千团大战这种事他们是不会干的,我们还是受儒家文化影响,总希望出人头地、赚钱。

王小川:不知道。在短期内,创业公司真能做大模型的可能就5个以内,大厂的标配是一人做一个。

王小川:现在盯着OpenAI往下干就是趋势(笑),他们是人类的希望,大家都围着他们转。

王小川:美国在研究上确实遥遥领先,但在商业应用里面,我认为追上的机会就大了。

谈心态:“现在跟世界的连接更轻松了”

王小川:我昨天晚上写官宣公开信写到凌晨四点多还没写完,睡到早上八点又接着写。

王小川:没有。

王小川:还好,离开搜狗这两年我更接纳自己了,我现在和过去两年比又放松了一层,和世界的连接更轻松了。在搜狗时你作为CEO总会说我们人才很充分了,我们想得很清楚了,我们事也干得很漂亮,你不断传递你是完美的这种状态,但创业不是这样——你会发现自己还有很多不足的地方,需要大家帮忙,这样一种心态对我而言是进步的,可能几位大佬不会这么搞。

王小川:我现在的感受很真实。越来越多人进场,我既不是非要秒掉他们,但自己也不是一无是处,这是一个很好的状态,反而让我感觉很松弛。

王小川:暂时没有,这个问题不到那个时候没法回答。就像我们都说不害怕死亡,但死亡真正来临时就是另外一件事了。

王小川:“怎么去延续人类文明”不就是一个问题吗?

王小川:也许我的答卷和别人不一样,但至少到今天为止我已经自问自答好多问题了。就像我写AGI和工业文明的关系,和互联网文明的关系,和文艺复兴的关系,我都已经回答这些东西了,但别人还没问过。

谈追求:“要把整个人类文明当作一个生命来看待,我们希望寻找终极答案”

王小川:现在大家老问机器把人取代了怎么办有些人一直喊怕被取代,但你问他用ChatGPT了吗,他还没用。

“找到自我”这件事,对很多人而言是很困难的,包括我们做这件事的意义到底在哪?好多人创业是因为这个事很牛,或者这个事大家都愿意做,但我们希望寻找终极答案

与此同时,我们还是在脚踏实地做事的。我对这件事的思考深度超过了很多人,有些人还没意识到这是时代变化,而且相当于把以前所有时代加起来的变化。我们正在创造一种新的生命,它和石头、蒸汽机、电脑的出现都不一样,以前都是工具,但AGI不是工具了——是你的伙伴,新的朋友,是人类进化的下一个阶段。

王小川 :AI只是改写了软件。

王小川:我们常说“上帝”有两种,一种“上帝”无所不能、什么都管;一种“上帝”在创造一个世界后,这个世界就自行运转了。人也是这种状态——一方面创造一个生命,像“上帝”般的位置,但创造出来后就放手让它自己运行了。

王小川:也许“上帝”就是我们的preloader(预加载程序)。

王小川:核心要回答三个问题:这个世界是什么样的?我是谁?我跟世界有什么关系?

王小川:反正我是好奇的。我对娱乐化没什么感觉,比如我能做头条,但我做不了抖音。如果这次创业我们做成了,我们就有机会在中国做一家能真正有技术理想主义的公司。之前没有这种条件和能力,但我有意愿,现在有了这个机会,是让我愿意去大干一场的最大动力。

王小川:AGI跟人的生命是连结在一起的,要把整个人类文明当作一个生命来看待。

王小川:是的。

王小川:这取决于AGI能不能解释人的生命,是否能让所有生命获得一种更大的文明,从繁荣和延续人类文明这个角度来看,AGI是很有意义的。

王小川:首先,把技术做好就是目的,而不是用技术去服务商业化;第二,先相信再看见,而不是先看见再相信。

王小川:我认为任何领域都可能入“道”,茶有茶道,花有花道,而极致的技术理想主义者一定是一个纯粹的理想主义者。

王小川:探索生命的意义是我永恒的主题。

推荐内容