一阳易真网

抢跑大模子,AI重构baidu

来源: 时间:2025-03-19 01:37:36

这家在挪移互联网时期稍显清静的抢跑大厂 ,终于凭仗着从前间在AI赛道的大模技术积攒,跑在了时期最前方 。重构

图片源头
:Pixabay图片源头:Pixabay

baidu终于等到了属于它的抢跑机缘 。

一周前 ,大模文心一言位列首批拿到监管部份入场券的重构大模子名单,并成为12家中措施最快那个——8 月 31 日零点,抢跑争先向全社会周全凋谢。大模

在凋谢下载首日 ,重构文心一言日沉闷用户破 100 万  ,抢跑并登上 App Store 收费运用排行榜首位。大模而据baidu民间平台吐露数据展现 ,重构8月31日0点至24点 ,抢跑在这短短24小时内 ,大模文心一言合计回覆网友超3342万个下场 。重构

家喻户晓,揭示词对于大模子内容天生起着关键熏染。为提升用户体验 ,文心一言担当起了科普大模子“prompt”(对于话揭示词)的脚色 。开淘汰模子的同时,baidu文心“灵感中间”也凋谢公测 ,提供海量AI模板 ,涵盖AI绘画 、创作 、娱乐、职场 、命理、激情 、学习等七大类,辅助用户更顺畅、更高效地运用大模子 。

随后 ,其余一众大模子平台逐渐对于外宣告向社会凋谢。但绝大部份平台只豫备好了网页真个进口,并未上线App 。抖音豆包 、讯飞星火 、智谱清言等乐成上线的App ,其下载量也远逊于文心一言  。

据第三方机构七麦数据估算,上述三款App近一周光阴外在App Store的日均下载量无一过万 。与之比照  ,文心一言近一周光阴内的日均下载量逾越18万次。

B端展现也绝不逊色 。9月5日的云智大会上,时隔六个月,baidu智能云交出大模子效率的下场单 :千帆大模子平台上月活企业数已经近万家,拆穿困绕金融 、制作 、能源 、政务 、交通等行业的400多个场景。

在即将修正天下的大模子混战中 ,baidu成为有望夺冠的种子选手。这家在挪移互联网时期稍显清静的大厂,终于凭仗着从前间在AI赛道的技术积攒 ,跑在了时期最前方 。

机缘最终仍是留给了有豫备的人。

十年苦守,去世磕AI

早在2019年,baidu就曾经争先宣告中国首个正式凋谢的预磨炼模子文心ERNIE1.0 。在ChatGPT引爆天生式AI热潮之后,baidu同样快捷照应,于往年3月推出新一代狂语言模子文心一言,成为国内大厂中第一个做出对于标ChatGPT产物的企业 。

产物宣告后仍在减速迭代。往年6月,baidu推出文心大模子3.5版本 。在国内,调研机构IDC宣告的《AI大模子技术能耐评估陈说2023》展现 ,该版本在算法  、生态、效率能耐等12名目的中取患上7项满分  ,综合评分、算法模子、行业拆穿困绕均为第一。

在外洋,InfoQ钻研数据展现 ,文心一言在狂语言模子综合测试上患上分达74.89%,仅次于ChatGPT ,远超第三名的Claude 。

baidu今日技术爆发眼前,是李彦宏的十年苦守。

作为PC时期的互联网巨头,baidu也有过光线的光阴 。曾经多少多时 ,“BAT”这三个字母 ,代表了中国互联网企业在“搜查、电商 、社交”三大规模的最高造诣  。但随着挪移互联网的普遍 ,信息取患上的方式变患上愈加多元 ,搜查再也不是流量的仅有进口,baidu不患上不另寻他路 。

错过挪移互联网先发优势 ,baidu惟独找到新的削减引擎 ,能耐重回浪潮之巅。押注家养智能  ,是李彦宏给出的谜底 。

这一谜底一度看起来过于超前。

在2016年的乌镇互联网大会上,李彦宏就曾经在演讲中作出分说:“两年前我来乌镇时还在讲咱们奈何样顺应挪移互联网的时期 ,明天我要讲的是挪移互联网的时期已经终清晰 。靠挪移互联网的风口已经不可能再泛起独角兽 ,互联网未来的机缘在家养智能。”

次年 ,baidu更是喊出“All in AI”的口号 ,宣称公司有能耐 、有定夺成为中国致使天下的AI标杆企业 。

宏愿壮志眼前 ,baidu早已经妄想AI多年 。作为中国企业家群体中未多少见的“技术派”,李彦宏不断深信技术修正天下。他最先在2012年就曾经向导baidu退出竞拍“深度学习之父”Geoffrey Hinton的守业公司 ,出价高达数万万美元,最终惜败google。

要知道 ,正是Geoffrey Hinton增长google成为全天下AI技术最卓越的公司之一。而昔时追寻他一起退出google的Ilya Sutskever ,也是如今Open AI的散漫独创人兼首席迷信家 。

彼时 ,李彦宏就已经揭示出惊人的前瞻性 。竞标失败的他不光不坚持,反而增长baidu鼎力投入AI技术的自主研发,2013年,baidu先后在中、美两地设立了家养智能钻研中间 ,日后踏上“去世磕”AI的道路 。

这绝非一条坦途 。面临一项并不可熟的前沿技术 ,baidu必需坚持压强式 、马拉松式的研发投入 ,能耐有所后退。

财报数据展现 ,在2013年到2022年这十年间,baidu累计研发投入已经逾越1400亿元。其中 ,光2022年baidu中间研发用度就抵达214.16亿元 ,占baidu中间支出比例抵达22.4%。

摆在baidu眼前的下场是,在以前很长一段光阴内,AI都未能找到适宜的商业化落点 。智能机械人、人脸识别、智能客服、智能音箱等,都未能给成为事实的功劳驱动引擎。

在2022年尾的一次外部演讲中,李彦宏坦言道 ,baidu这多少年过患上比力苦,财报 、营业削减性都不是那末赫然。

幸好baidu从未轻言坚持。苦守十年之后 ,李彦宏等来了机缘。据其在财报电话会上泄露,baidu智能云营业在往年Q1已经实现盈利,并在Q2不断盈利 。

往年第二季度 ,baidu实现营收341亿元,同比削减15%;归属baidu的净利润(non-GAAP)抵达80亿元,同比削减44%。营收以及利润双双实现大幅削减 ,超市场预期 。其中 ,baidu智能云 、智能驾驶 、用户产物等根基盘营业在二季度不断高速削减,迎来突破性妨碍,领跑行业 。

“天生式AI以及狂语言模子在良多行业具备重大刷新能耐 ,为咱们提供了严正的市场机缘 。”李彦宏展现 。

全栈妄想  ,重构baidu

十年的不断投入 ,让baidu把握了其余相助对于手难以坚持的优势 。

以数据 、算法、算力这AI时期的三概况始终看,baidu都有着丰硕的蕴藏  。搜查营业降生的baidu做作就具备优异的数据能耐 ,不论是在抓取、抽取  、洗涤 、去重、反剩余等操作上,都可能更快拿到高品质数据集 。

算法层面 ,早在2019年,baidu就曾经争先宣告中国首个正式凋谢的预磨炼模子文心ERNIE1.0  ,该模子一度登顶全天下威信数据集GLUE榜单。在随后四年光阴内,该模子不断迭代,已经从繁多的做作语言清晰缩短至少模态,实现视觉 、文档 、文图 、语音“万能”。

反对于文心模子磨炼的算法框架平台,是baidu飞桨。这是中国首个自主研发的财富级深度学习开源凋谢平台。妨碍2023年8月,飞桨平台上已经凝聚800万开拓者,效率22万家企事业单元,基于飞桨建树了80万个模子。位列中国深度学习平台市场综合份额第一。

算力层面 ,baidu自主研发的云端通用AI芯片——昆仑芯一 、2代已经实现量产 ,并抵达数万片规模部署,昆仑芯第三代估量2024年初量产。此外 ,baidu还已经在阳泉、徐水 、定兴三地建树起自用云合计中间,重大的超算集群为大模子的磨炼奠基了根基  。

上述三重优势 ,使baidu能在极短的光阴内跟上OpenAI的脚步 ,成为全天下大厂中第一个做出对于标ChatGPT产物的企业  。

加倍紧张的是,随着文心大模子跟文心一言的宣告,baidu乐成补上了全栈AI能耐的最后一块拼图 。如今的baidu在“芯片层、框架层 、模子层 、运用层”等四层IT技术栈上均有妄想 ,成为全天下为数未多少、妨碍全栈妄想的家养智能公司 。

从昆仑芯片、飞桨深度学习平台 、文心大模子到文心一言,baidu经由这些关键自研技术,实现为了层与层反映 ,端到端优化 ,大幅提升功能 。

患上益于此,baidu能耐在强烈的国产大模子之战中,不断坚持争先并吞C位。

以文心一言为例 ,这一产物在往年3月宣告以来快捷妨碍。妨碍当初,其熟练把握的创作文体逾越200个,内容丰硕度是宣告早期的1.6倍,脑子链长度是早期的2.1倍,知识点拆穿困绕抵达早期的8.3倍。

功能方面,经由飞桨端到端自顺应混并吞行磨炼技术以及缩短  、推理、效率部署的协同优化  ,文心大模子磨炼速率抵达原本的3倍,推理速率抵达原本的30多倍 。

随着技术能耐慢步降级 ,以及大模子存案的经由 ,baidu正减速建树生态 ,增长大模子运用的睁开 ,为下未来的睁开做好铺垫 。baidu总体资深副总裁何好汉就对于外展现 ,基于根基大模子开拓进去的运用,以及这些运用能在多大水平上提升破费功能,才是大模子存在的意思 。

“巨匠比的不理当是你有多少多把鎯头,而是找到那个钉子,用鎯头把钉子给敲进去 。这是未来比拼的中间关键。”

当初,在C端,baidu旗下种种用户侧产物正在运用大模子妨碍重构 ,baidu搜查 、百家号 、baidu文库 、baidu输入法等产物正在研发并陆续推出相关AI功能 ,未来还将推出NEWAPP等产物;在B端,baidu经由飞桨开源凋谢平台  、baidu智能云赋能工业  、能源 、金融、通讯、媒体 、教育等各行各业 。

而这正是李彦宏心中baidu的临时目的 。在往年5月举行的2023中关村落论坛上,他清晰指出baidu要做第一个把全副产物重做一遍的公司。

“不是整合,不是接入 ,是重做 、重构。”