导读
(相关资料图)
THECAPITAL
如王小川所述,中国谁做了最好的大模型,还没有结论,大家都在争取机会,而且不一定落在大厂里。
本文4994字,约7分钟
作者 | 元帅 编辑 | 吾人
来源 | 融中财经
(ID:thecapital)
中国这波大模型创业浪潮的序幕,要从今年2月份的一个饭局开始。
当时的饭局有4个人,美团联合创始人王慧文和真格基金合伙人刘元、真格基金合伙人戴雨森以及出门问问CEO李志飞。
而王慧文当时还是满腔热情,没有意识到自己患有抑郁症的严重性,其大模型创业的“英雄帖”正是从这场饭局发起。
紧接着,搜狗创始人王小川、前京东技术掌门人周伯文、阿里副总裁贾扬清等互联网时代的创业大牛先后发声,有意投身打造中国版OpenAI或ChatGPT。
投资大佬李开复也不愿意错过这次机会,他在3月份发布朋友圈宣布,亲自筹组Project Al 2.0,计划打造一个Al 2.0全新平台和以Al为首要应用的全球化公司。
除了ChatGPT本身的热度和入局者的影响力,创业者们丰富的经验和资金实力也使得这波ChatGPT浪潮显得并非仅仅是一场玩笑。
恍惚间,十年前那个火热的互联网黄金创业潮似乎又闪现了,这群创业老兵点燃了国内“百模大战”的硝烟。
作为科技创业圈最资深的自然语言科学家之一,李志飞今年过年第二天就再次跑到美国去考察。尽管技术大牛都还不清楚 ChatGPT 如何拥有这种超能力的,但所有人都认可,这是 AI 大模型时代的开启,就像 2010 年移动互联网时代一样。
不到硅谷,切身感受不到 AIGC 的火热,也不会下定此刻是“AI 大模型时代”这一结论。
猎豹移动董事长兼CEO傅盛在试用过之后也感慨,“GPT-4非常非常恐怖,是整个世界生产力的变革,一个技术浪潮的来临,先拥抱它!”。
可以说,以ChatGPT 为代表的大模型技术突破,重要性不亚于2016年AlphaGo围棋大赛打败人类的胜役,是人类通向通用人工智能(AGI)道路上迈出的又一步。
然而,理想是美好的、现实是残酷的。不过才过去一个季度,王慧文在5月份被确诊为抑郁症,暂时离岗入院就医。最终,好兄弟王兴出面救场,美团在6月底宣布完成对光年之外100%股权的收购,收购价约为20.65亿元。
眼下,国内这波大模型创业者,最数王小川曝光率最高。因为大模型,王小川将昔日搜狗的老将又重新聚齐了。
久负盛名的创业老兵们,踏上了新征途。
01
大模型最佳代言人
今年4月10日,淡出公众视线近两年的王小川,与前搜狗COO茹立云联合成立大语言模型公司百川智能,拿到5000万美元启动资金,正式宣布进入AI模型创业赛道。
前搜狗CMO洪涛已确认将于这个月加入百川智能,负责商业化方面的业务。他已经开始了招聘工作,并表示急需各类商业人才。他于2005年加入搜狗,在搜狗期间成功打造了搜狗输入法、浏览器、搜索的推广体系,与前搜狗CEO王小川、前搜狗COO茹立云、前搜狗CTO杨洪涛一起并称为搜狗4大天王。
这意味着前搜狗三大高管再联盟,齐力推进AI大模型研究。同时,招揽了大量搜狗的旧部,他们更懂搜索和NLP,与大模型算是近水楼台,还更认同王小川的价值观,更有目标感。
成立不到四个月,王小川的大模型公司百川智能又有了新动作,在 8 月 8 日发布了 530 亿参数的大模型 baichuan-53B。此前6 月和 7 月,先后发布了 70 亿参数的 baichuan-7B 和 130 亿参数的 baichuan-13B 后,
新发布的 baichuan-53B,王小川描述其最大的优势有两点:写作能力好,文科方面博学。能做到这一点,重要原因之一是来自模型在底层应用了搜索的能力。
OpenAI 跟微软是两个独立的实体,把搜索当做一个黑盒去使用;而百川的搜索跟模型的结合是从非常底层的地方就开始融合了。
与前两代大模型不同,baichuan-53B 没有开源。王小川说这是因为参数量大(530 亿)使用成本较高,所以采取了闭源的方式。但与之前一样,百川依然把大模型产品的服务对象定在 B 端,称目前已有超过 150 家企业申请试用。
王小川还透露,除了企业端以外,今年底之前,百川智能团队将部署有消费级(To C)端的超级应用。“未来不只有一款的超级应用,正在研发的路上。”
02
投资人泼冷水
自问世以来,ChatGPT的大模型风口吸引了越来越多的玩家进入这个领域。
百度的文心一言、阿里的通义千问,以及其他大厂和创业公司的通用大模型、专属大模型都在秀功能,无不将大模型作为自身最大的亮点,并竭力追逐这一行业热点。
不过,投资人却没有表现得那么积极,持谨慎态度。
真格基金合伙人刘元上个月在一次公开场合表示,王慧文有两句话让他印象深刻,第一句是一个VC在中国不敢“开枪”将会是耻辱的,第二句是大厂做不好大模型。
6月底,猎豹移动 CEO 傅盛在朋友圈转发了一篇名为《朱啸虎:ChatGPT对创业公司很不友好》的微信文章,并评论“硅谷一半的创业企业都围绕 ChatGPT 开始了,我们的投资人还能这么无知者无畏”。
这一评论很快引起了金沙江创投董事总经理朱啸虎的反击,他称“99%的价值都是GPT创造的,这样的创业公司有什么价值?”“绝大多数创业公司在ChatGPT面前都毫无价值”。
他进一步举例说明,在细分赛道中,受ChatGPT冲击最大的两家创业公司是Grammarly和Jasper,它们分别提供自动语法纠错和利用ChatGPT实现自动营销文案生成的服务。
这场辩论最终在两人达成共识,即创业公司很难(借助大模型)获得再造BAT的机会而结束。
嘉御资本董事长兼创始合伙人卫哲发表了与朱啸虎类似观点的言论:在这轮“百模大战”中,国内AI大模型最终能够胜出的不超过2个。这意味着,剩下的98%的国内大模型将会“死掉”,在竞争中消失。
不止投资人,作为一直在人工智能赛道躬身的资深人士,小冰公司首席执行官李笛表现得也异常冷静,他对外接受采访时表示,目前国内至少有70个大模型问世,但都是同质化的,也没法实现差异化。
“因为大家的训练数据都差不多,训练方法用的是OpenAI发表的论文中的方法,而且都是直接拿GPT去训练,把GPT作为老师。老师、训练数据、训练方法都是一样的,怎么拉开差距?各个大厂都来做大模型,其出发点不在于抓住风口和机会,而是防御。没有自己的大模型,就会被竞争对手压制,反之就有机会压制别人。”
03
试水商业化
自去年11月底以来,ChatGPT引领了一场全球AI热潮。资本市场对ChatGPT和AI大模型概念股的热情高涨,极大地推动了寒武纪、海天瑞声等多家AI公司的股价不断攀升。截至今年年初,寒武纪的股价上涨了245.70%,海天瑞声上涨了94.57%,科大讯飞上涨了98.28%。
这一热潮不仅让已上市的AI和云计算公司迎来了新的发展机遇,同时也让许多未上市的同类公司看到了最佳的上市审批窗口和未来的曙光。超过38家公司纷纷申请在港交所上市,期待能在AI和云计算行业的大发展中分得一杯羹。
据钛媒体App整理,2023年上半年,在港交所排队的 AI 或数字化和智能化相关公司超过38家,占整个港交所累计正在处理中的96家IPO公司的40%左右。
过去一段时间,智能驾驶芯片公司“黑芝麻智能”、AI 语音公司“云知声”、生成式 AI(AIGC)公司出门问问等多家 AI 公司密集向港交所递交上市申请,排队等待审批上市。
对于当下如火如荼的“百模大战”,王小川在8 月 8 日评价称,“每个有技术理想的企业都想下场试一下”。
被问及王慧文现状、大模型创业压力大不大时,以王小川对王慧文的了解,他觉得后者是国内几个主流做大模型里唯一一个没有强势的技术背景的,挑战比其他家要大。工作中要做大量的技术决策、招什么人、走什么技术路线图、需要多少计算资源,一定会面临非常多的决策压力。
“不是做大模型压力大,是没有技术背景做决策压力会大很多,但是技术足够的话,其实挺愉悦的,我们的进度是在一个快乐的状态。”他说。
当前,国内大模型开始竞逐AI大模型技术的商业化落地。
按照小冰公司首席执行官李笛的经验来看,没有谁能够在技术上实现垄断,所以只能靠节约成本来获得利润空间。
“即使跟随所谓的摩尔定律,把价格打下来了,竞争对手也会迅速把利润空间给补上。最后就会出现打价格战的情况,然后大家就开始免费。这看起来是好事,但其实是限制整个人工智能行业的发展。”他说。
就在上个月,国内 AIGC 第一个真正意义上破圈的现象级产品诞生——“妙鸭”,凭借着“只需“9.9 元,就能生成20 张艺术写真级的个人美照”这个噱头,刷爆朋友圈。
令人意外的是,妙鸭是阿里大文娱孵化的内部项目。妙鸭团队在接受媒体采访时表示,AIGC 和互联网时代的商业逻辑根本不同,算力成本昂贵,AIGC 产品应该在诞生的第一天就开始向用户收费。在 AIGC 时代,如果不能在第一天就向用户收费,那么永远都不可能收到用户的钱。
值得一提的是,OpenAI和微软在这方面做出了很好的示范:在C端方面,ChatGPT采用“每月20美元”的Plus会员服务,并对外提供GPT-4 API付费服务,预计年收入将达到数十亿元;而在B端方面,微软365 Copilot的定价提升为每人每月30美元。
王小川的大模型也已经在试水商业化,找到了医疗和教育的大模型应用场景。
04
GPT经济比app经济更重要?
ChatGPT热潮带来的AI竞争,最直接的受益者正是云计算平台。一方面,生成式AI应用背后的大模型需要更强的算力;另一方面,区别于传统云计算平台提供的算力、存储等资源,拥有大模型的云厂商未来可以提供基于大模型开发应用。
目前,在大型模型领域中,以OpenAI GPT-4为代表的闭源大模型和以Meta Llma2为代表的开源大模型正在共同发展。开源大模型凭借其开放性和灵活性,正在迅速吸引更多的合作伙伴和用户。这种开源模式不仅可以加速技术的普及和推广,还可以为商业化做好准备。
如果说ChatGPT的成功预示着AI“iPhone时刻”的到来,那么代码全部开源的Llama 2的推出则预示着AI大模型“安卓时刻”的到来。7月19日,Meta发布了最新AI 大语言模型Llama 2系列。
当谈到开源与闭源之争时,王小川认为,开源确实可以建立良好的声誉和信任,让更多人了解和评估模型。此外,开源也是为商业化做好准备,如果大家对开源模型感到满意,当需要更好的服务和更大的参数时,可以探索进一步的商业化路径。
然而,他认为,开源和闭源并不是像手机中的iOS或安卓操作系统那样只能二选一。从tob角度,开源和闭源都是必要的。他预计未来80%的企业将使用开源的大模型,因为闭源无法对产品进行更好的适配,或者成本过高。闭源可以为剩下的20%提供服务。因此,开源和闭源不是竞争关系,而是在不同产品中互补的关系。
国发院的战略学助理教授侯宏,作为曾经的高科技行业从业者,也高度关注AI产业的进展。
“我不看好所谓的ChatGPT的App Store,但相信GPT经济比app经济更为重要,因为GPT应用影响的主要是生产侧活动而app经济主要依赖消费侧购买力。GPT经济以基础设施模式为主,潜藏在应用背后甚至用户都不一定感知其存在,这是厚德载物、润物无声模式。app经济以平台模式为主,每个用户必须选择平台后而下载应用,这是跑马圈地、小院高墙模式。”
当下的数字经济研究过于关注平台经济而忽视了API经济。API是去中心化的,平台经济是中心化的。一个技术平台通过开放API成为基础设施,但并不一定使用平台商业模式。反之,使用平台商业模式的企业通常对某方或者某几方用户开放API,但该API的使用被牢牢限制在平台的小院高墙内。
可见,平台商业模式的本质是提供场所,而基础设施的本质是提供原料。只不过,如果国内无法解决基础设施的基础设施,一切都只能停留在憧憬中了。这才是GPT经济最为迫切和战略性的问题。
05
尾声
不少人认为,大模型是典型赢家通吃领域,因为需要更多的钱,需要更多的算力,以及更优秀人才,而巨头拥有这些优势会保持先发优势。
不过,王小川是个例外。此前,他在过去巨头林立的互联网巨头中,晚于百度四年进入搜索市场,但仍然带着搜狗杀出一条血路,成为一支不可忽视的力量。显然,过往和巨头竞争的经验,派上了用场,让他依然拥有当年的勇气,不惜隔空喊话李彦宏:“只落后ChatGPT两个月”的李彦宏只存在于平行世界。
不等历史给出结论,王小川一直在尝试书写自己的答案。借用泰合资本CEO宋良静评价贝佐斯的一句话,同样适合王小川,即“要做科技的传教士,而不是商业的雇佣兵”。传教士有正义的终极目标,并试图让世界变得美好;而雇佣兵唯利是图,为了金钱和权利就可以扫除所有拦路之人。
考虑到大型互联网企业的组织架构相对僵化,以及可能受到自身业务的限制,创业公司的战斗力实属令人期待。然而,这仅仅是一个开始。相较于商业模式,打造类似于ChatGPT的数据与算力门槛更需要坚持技术理想主义的定力,这才是这场竞争的关键所在。
在ChatGPT问世时,王小川曾发布一条朋友圈说:OpenAI的胜利,是技术理想主义的胜利。
OpenAI在创立公司到推出ChatGPT的八年中,投入了大量的资金和资源。但是,正是这种对技术的坚定信仰,才让他们取得了震惊世界的成就。这种信仰使他们能够忍受长时间的投入和坚持不懈地探索未知领域,从而实现了技术的突破。
如王小川所述,“中国谁做了最好的大模型,还没有结论,大家都在争取机会,而且不一定落在大厂里。”
OpenAI的成功不仅仅是一个商业成功,更是一次技术的胜利。他们的成果证明了技术理想主义的力量,证明了只要有坚定的信仰和不断的努力,就能够实现看似不可能的目标。这一成就将对未来的科技发展产生深远的影响,并且将会激发更多的科技人员和企业家追求技术理想主义的精神。