作者:解码Decode
计算机科学家吴恩达曾在《为什么AI是新电能》中如是写道:如今我绞尽脑汁,也想不出几年后还有什么行业是AI改变不了的。
在AI发展历史上,曾有过三座里程碑:第一次是1997年,蓝色巨人IBM旗下的AI“深蓝”击败国际象棋大师卡斯帕罗夫;另一次则要回溯到2016年——谷歌旗下的AI机器人AlphaGo在“人机大战”中,第一次击败人类职业围棋冠军李世石。
这之后,AI行业经历了从极速繁荣到资本退潮,行业随之步入数年的低谷期,一直到去年ChatGPT的横空出世。作为后疫情时代的一个绝佳故事脚本,尤其在其三个月达到过亿用户爆火之后,ChatGPT这类大语言模型就像一颗燎原的星星火种,在科技公司间急速蔓延,引得大洋两岸那些曾经高昂头颅的互联网巨头们纷纷趋之若鹜,躬身入局。
百度当然对此也踌躇满志,官宣将在3月份推出新一代的大语言模型“文心一言”。据36氪报道,其内部曾讨论过两种方案,一种是推出独立入口(类似此前百度推出的AI画作平台“文心一格”);另一种则是将文心一言与现有的百度搜索入口打通。
但无论究竟是何种形式,作为国内AI领域的代表龙头,百度此刻率先出阵,究竟意欲何为?中国的大语言模型是否真的能支撑起其梦想的星辰大海?百度曾经定下的“All in AI”路线又是否到了收获的季节?
新的星辰大海?
2023年2月22日,百度发布了截至2022年12月31日的第四季度及全年未经审计的财务报告。据财报显示,2022年,百度实现营收1236.75亿元,归属百度的净利润(非美国通用会计准则,下同)为206.8亿元,同比增长10%。其中第四季度,实现营收330.77亿元,净利润为53.71亿元,同比大涨32%。2022财年,百度核心连续四个季度业绩超市场预期。
随着疫情后经济复苏,疫情逻辑对公司业绩影响逐步弱化,百度收入环比增长得以持续改善,而Q4同比增长的幅度略弱于Q3,说明去年放开之后的疫情的短期冲击对公司收入仍产生了一定的压制。
从净利润上来看,自去年Q2以来,单季均保持在50亿以上,这表明以百度目前的业务结构,核心业务盈利能力相对稳定;而仰赖于非广告业务的战略转型、降本增效以及21年Q4的低基数效应,这三大核心因素的向上共振,2022年Q4得以出现大幅增长。
但由于宏观经济在趋势上的惯性,短期内广告主的投放意愿明显降低。
据数据显示,10月、11月国内广告市场总刊例支出分别同比下滑16%和11%。但资本市场对2023年的经济修复颇为乐观,广告业务与宏观经济关联度较高,随着今年经济复苏的逐步兑现,百度的主营广告业务或将在2023年迎来明显修复。
而从营收数据占比来看,百度营收如今更趋多元化,非广告营收占比逐季增加。
其中百度核心收入总计954亿元人民币,与去年基本持平;广告收入为695亿元,非广告收入为259亿元,同比增长22%,主要受百度智能云及其他AI业务的推动。很明显百度以科技为内核的非广告业务逐步开始兑现业绩,有望成为公司新的业绩增长动能。
而被视为人工智能里程碑的大语言模型无疑是当下一个最好的商业化叙事敲门砖。
2月8日,谷歌发布了基于LaMDA模型的对话机器人Bard,当其在发布会上被问到“如何向9岁的孩子介绍NASA的詹姆斯·韦伯太空望远镜的新发现”时,Bard给出了一条远称不上“新发现”的答案,而这一小小的bug,却令当日谷歌的股价暴跌7.68%,市值蒸发超过1000亿美元;几乎同一时间,宣布推出由ChatGPT支持NewBing搜索引擎的微软市值一天却飙涨超800亿美元。
而在此前一天,百度官宣了“文心一言”项目,坐实此前其正对标美国AI聊天机器人ChatGPT开发应用的传言。消息公布当天,百度港股股价曾一度大涨15%,美股股价涨幅也达12%。
单凭一个概念便能搅动资本市场风云,大语音模型所承载的商业化前景不言自明,这对于已经深耕人工智能多年的百度来说,是一个绝不能错过的风口。
如今百度智能云的市场份额居全球第四,收入增速也高于云市场大盘。但受疫情影响,对智能云的交付产生一定拖累,以及市场整体的增长放缓,因此百度智能云在22年Q4的收入同比才出现一定程度的放缓。
随着2月17日,百度宣布其生成式AI产品“文心一言”将通过百度智能云对外提供服务,率先在内容和信息相关的行业和场景落地。文心一言的接入,无疑将进一步增强百度智能云在云服务市场的竞争力。
在此次发给百度全员的财报信中,李彦宏就重点介绍了百度将在三月份推出的生成式AI产品文心一言,宣布计划将多项主流业务与文心一言整合。并表示:“中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。而百度作为中国人工智能市场长期增长的最佳代表,正站在浪潮之巅”。
所以此时唯一的问题便在于,百度如何做好文心一言?
时代选择了百度
此前对于元宇宙一直不甚感冒的李彦宏,却在公开场合丝毫不掩饰其对于AIGC以及ChatGPT的重视,甚至有报道称其直接把自己的2023年OKR定为:“引领搜索体验的时代变革”。
而实际上李彦宏也的确有足够的底气定下如此的OKR:从目前来看,不论从技术还是应用层面,大语言模型和百度都十分契合。
技术层面上,由于语义理解需要海量数据让AI理解常识而壁垒较高,因此自然语言处理(NLP)也被视为“人工智能皇冠上的明珠”,往往谁能实现在NLP技术的突破,谁就能在AI领域一骑绝尘。
早在百度诞生之时、从百度处理用户的第一次搜索开始,NLP技术就成为搜索技术的重要组成部分,并伴随着百度的快速发展,同步壮大,可以说NLP技术和搜索业务天然契合。
2010年初,百度正式成立自然语言处理部,并不断在语音、图片等技术上布局,敲定了在知识图谱技术上长期投入的战略;2019年3月,百度提出知识增强的语义理解框架ERNIE,半年后,百度又发布了PLATO-XL,一举超过Facebook Blender、谷歌 Meena和微软DialoGPT,成为全球首个百亿参数中英文对话预训练生成模型。
得益于超前的布局和投资,百度取得的成绩也有目共睹。
2018年2月21日,百度 NLP团队研发的V-Net模型以46.15的Rouge-L得分登上微软的MS MARCO机器阅读理解测试排行榜首;2019年12月,百度文心ERNIE又以9个任务平均得分首次突破90大关的好成绩,刷新GLUE(通用语言理解评估基准)榜单历史夺得榜首;一年后,百度ERNIE 又以 90.9 的分数领先谷歌 T5、微软DeBERTa、TuringNLRv4,以及阿里巴巴、华为等研发的其他同类别技术,再度蝉联。
所以从目前的表现来看,中国还没有一家公司的NLP技术水平接近百度,也没有任何一家公司能利用这个技术挑战百度。
另一方面,百度开发文心一言所需的基础能力也并不是从零开始。
从2017年6月,Google发布论文《Attentionisallyouneed》,首次提出Transformer模型,奠定GPT模型发展的基础,到2022年11月30日,OpenAI推出ChatGPT模型,并提供试用。仅仅不足6年时间,大语言模型便走完从理论到现实的历程,其核心催化就在于算法+数据+算力的共振。
而百度恰好在此三项都拥有足够的领先优势,又得益于在芯片、框架、模型、应用四层技术栈均有布局,百度的大语言模型相关技术,在中国乃至全球范围均具有综合优势。
例如算法方面,百度拥有多个云计算可用区、庞大的超算集群,奠定大模型训练的基础设施;算力方面,百度自研AI芯片“昆仑”,已完成无人驾驶场景端到端性能适配,并在多场景实际部署几万片,在公司搜索业务中也已形成较强工程化实践,因此算力也有所保证;而数据层面,百度的搜索业务每天处理上百PB的用户数据,在真实数据和用户需求理解方面的积累有较强的先发优势,这些大规模结构化非结构化数据完全可以支撑大模型的充分预训练。
其中百度的文心大模型和Open AI的GPT模型基本类似,自2019年推出后,已经迭代多次,从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能,因此“文心一言”所基于的ERNIE系列模型也已经具备较强泛化能力和性能。以最新发布的ERNIE 3.0 Zeus为例,该模型迭代于ERNIE 3.0,拥有千亿级参数。其已经具备智能创作等各类自然语言理解和生成任务,且公开数据集上小样本学习、理解和生成任务效果皆好于业界其他模型。
此外,文心大模型作为本土化的AI模型,具备对中文、甚至中国文化的更深理解,这意味着文心一言会更适合中文和中国市场。
而在具体的应用层面,文心一言更是为百度量身打造的开山利斧。
ChatGPT本质上还是自然语言生成式AI,能提供高度智能的对话式问答结果,这显然很适用于搜索场景。而作为中文互联网搜索的龙头巨擘,如果百度能在搜索生成上取得足够大的先发优势,这无异于又是一张互联网新时代的船票。
事实上,百度从2021年就开始尝试把AIGC与搜索两者结合起来,而在今年1月初的百度Create AI开发者大会上,百度也宣布将基于百度自研的生成式模型,升级“生成式搜索”能力。同时还表示,搜索与生成式AI之间的关系更像是互补而非单一替代关系。
而在人员调度方面,据36kr的报道,此次“文心一言”的筹备团队主要由TPG(技术中台事业群)、MEG(移动生态事业群)两大部门协同。前者负责技术攻坚,后者进行搜索、内容产品承接。并且由CTO王海峰任项目总指挥,百度集团副总裁吴甜(同时担任深度学习技术及应用国家工程研究中心副主任)、百度技术委员会主席吴华等人任带队高管。
可以说此次百度做文心一言已经占据天时和地利人和的先机,不仅是百度选择了文心一言,而是凭借多年的苦心经营、研发投入,有了如今的技术沉淀后,如今的AI时代再次选择了百度。
未来的时代奇点
李彦宏认为:“ChatGPT是AI技术发展到一定阶段后的新机会。怎么把这么酷的技术,变成人人需要的产品,让每天有几亿人从中受益?怎么赋能千行百业,让他们的生产效率大幅度地提升?这一步才是最难的,也是最伟大、最能够产生影响力的”。
因此如何将吹得天花乱坠的技术,实际赋能落地到实处已成为当下所有入局玩家亟需解决的眼前之事。
李彦宏说:“2022年是大模型产业化应用的元年,大模型已成为许多上层应用的技术底座”。实际上在AI大模型这个竞争领域,马太效应十分明显,领先一步常常持续领先,强者恒强,但百度文心模型的两大特色已助其先行一步。
一是知识增强,全球独一的技术,文心大模型从大规模知识图谱和海量无结构数据中学习,学习效率更高、效果更好,具有良好的可解释性。二是产业级,文心大模型的技术源于产业并且致力于推动产业智能化升级,通过用户的反馈与各个产业相结合,更好地解决用户的需求。
当然百度能有今天的技术沉淀离不开其十数年如一日的投资研发。
2009年8月,在当年的百度技术创新大会上李彦宏首次提出“框计算”的概念:用户只要在“百度框”中输入服务需求,系统通过用户提交的需求进行语义分析、行为分析、人机交互和海量计算处理之后,就能将搜索与服务对接。
作为最早智能搜索的雏形,而后十几年,百度在“烧钱”的AI路上一去不返。
2020年,李彦宏在一次论坛上提到:“过去十年,百度每年研发投入占营收15%以上,其中AI技术研发就是百度种下的种子之一”。一年后,百度在港交所二次上市,募集资金里有一半用作持续科技投资,用于促进以人工智能为主的创新业务商业化。
目前,百度是全球为数不多的、进行全栈布局的人工智能公司,10年间投入高达1000亿元,每年研发占收入比例都超过15%,去年更是达到了23%。但按照历史经验,技术的超前投入往往如空中楼阁,AI只有与业务结合,为其提供支撑才能走得更远。
在无人驾驶领域,百度亲自下场。2022年Q4,百度自动驾驶出行服务平台萝卜快跑订单量达到56.1万,同比增长162%。截至2023年1月底,萝卜快跑累计订单量超过200万单,稳居全球最大的自动驾驶出行服务提供商。
2021年集度汽车成立后,文心又与吉利建立了行业模型,对智能客服系统、车载语音系统、领域知识库构建进行提升。自己掌握汽车硬件和智能驾驶系统层,百度在无人驾驶领域的数据和反馈直接用于训练硬件软件系统,推动无人驾驶能力提升,这是百度AI模式的一个典型。
另一方面根据IDC、Strategy Analytics和Canalys的市场数据,小度在2022年前三个季度再次取得中国智能音箱和智能屏出货量双第一。未来,小度也将融合文心一言,打造针对智能设备场景的人工智能模型“小度灵机”,升级多轮对话能力。
此外对于百度而言,语言大模型的另一个价值在于推动AIGC发展。从这一角度来看,语言大模型作为文字模态的AIGC发展潜力大,可以与图形模态的AIGC相结合,打造从文字描述到图片生成的AI辅助工具,形成效率和成本上的优势。
说白了,互联网的核心是流量,流量的核心是内容。而 AIGC 的本质,就是一项生产内容的技术。谁掌握了内容,就等同掌握了流量,而掌握了流量就掌握了商业竞争的最大主动。AIGC作为内容业务的开山斧、催化剂,谁先拥有AICG、谁先应用AICG,将进一步成为决定平台内容命运的关键变量。
因此在百度,AI与业务的结合可以说是全方位的。视觉的自动驾驶层面有Apollo,语音的智能交互有小度和DuerOS,云计算领域有百度智能云,在作为百度现阶段基底的MEG中,AIGC与内容的结合补齐了最后一块拼图。百度的千亿投入,沁润进了自身的每一块业务版图,也有了得以价值最大化和持续发展的可能性。
诚然,技术能够提供怎样的价值,最终还是在于如何将其封装进产品,对生成式 AI 也是如此。所以当技术已经进步,老船长是否还能再次扬帆起航,答案已经写在不久的将来。
写在最后
如果从2017年高调宣布 “All in AI” 算起,百度押注AI产业已经有6年了;而如果从更早的2013年建立美国研究院算起,百度投身AI则有十年了。站在当下的时间节点回顾过往,在试图引领下一轮技术浪潮AI的革命的漫长等待途中,百度错过了一些风口。
即便百度称自己在过去10年投入了1000亿研发资金,但AI的投入所带来的反响却并未如预期般热烈。就在这种弥漫着沮丧的行业氛围中,AIGC的出现就犹如漫漫黑夜中的一丝萤火,点燃了沉寂已久的AI热潮。
对于百度而言,长期的诗和远方需要一个具象的落脚点,而业界对于ChatGPT的热情,让这个落脚点终于清晰了起来。所以这就好比一段双向奔赴的恋爱,既是时代选择百度,也是百度主动选择文心一言,拥抱了时代。
而从目前结果来看,能把大语言模型做好的,的确也是百度文心一言。文心一言能做到什么程度,甚至是否真的能超过ChatGPT,成为百度期盼已久的“第二增长曲线”,让我们静待文心一言的表现吧。