前一天在極越車內(nèi)直播,第二天又為大模型工具“打call”,百度CEO李彥宏無縫銜接。4月16日,他花了約一個小時講解百度最新發(fā)布的AI開發(fā)工具,再度吐槽開源模型落后。像往年一樣,百度眾高管在Create大會上秀數(shù)據(jù)、講功能、談未來,但行業(yè)格局已大不一樣。
2023年3月,百度搶先發(fā)布文心大模型及產(chǎn)品文心一言,同年10月拿出最新版文心大模型4.0,一年時間文心一言用戶超2億。競爭對手的動作也不慢,月之暗面異軍突起,Sora表現(xiàn)震撼,文心一言AI應(yīng)用老大的位置則遭到威脅。李彥宏說這一年百度開發(fā)AI原生應(yīng)用踩了坑,交了學(xué)費。而當(dāng)日百度以95港元在港交所開盤,收盤時股價94.15港元。
三個工具
上午9點多,李彥宏開講,《人人都是開發(fā)者》的題目和臺下的開發(fā)者和科技愛好者的適配度很高。
“過去,開發(fā)者用代碼改變世界;未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,”李彥宏強調(diào),“未來開發(fā)應(yīng)用就像拍個短視頻一樣簡單!
基于上述判斷,百度上新了“開發(fā)工具”:針對智能體開發(fā)的AgentBuilder、針對AI原生應(yīng)用開發(fā)的AppBuilder,以及各種尺寸的模型定制工具M(jìn)odelBuilder。
李彥宏認(rèn)為,智能體可能是未來每一個人最近、最主流的大模型使用方式。百度升級的文心智能體平臺上有3萬多個智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。
智能體方面的進(jìn)展也是瑞達(dá)恒研究院經(jīng)理王清霖關(guān)注的內(nèi)容,“具有更廣泛的發(fā)展前景,可以應(yīng)用于C端的各種場景進(jìn)行內(nèi)容生成。由于這種模式的使用門檻低、場景多,可以兼顧工作與日常、個人與企業(yè),并且可以涉及到很多業(yè)態(tài)的多個環(huán)節(jié),看起來是更具有發(fā)展?jié)摿Φ,只是如何商業(yè)變現(xiàn)是挑戰(zhàn)”。
AppBuilder是用來開發(fā)AI應(yīng)用的,開發(fā)需要三步:給應(yīng)用起名、在角色指令中描述具體要求、到工具組建中把代碼解釋器加進(jìn)來,幫助運算。ModelBuilder可以根據(jù)開發(fā)者的需求定制任意尺寸的模型,并根據(jù)細(xì)分場景對模型進(jìn)一步精調(diào)SFT。
演示這個功能時,李彥宏向小度詢問了一系列問題,包括新聞、日程安排等,“看起來是跟同一個在交流,其實背后調(diào)用了不同的模型”,有的是文心大模型4.0,有的是基于ERNIE Lite的精調(diào)模型。
看不上開源
“我們可以根據(jù)需要,兼顧效果、響應(yīng)速度、推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,并且支持精調(diào)和post pretrain(一種預(yù)訓(xùn)練模型的遷移學(xué)習(xí)方法)。這樣通過降維裁剪出來的模型,比直接拿開源調(diào)出來的模型,同等尺寸下,效果明顯更好,同等效果下,成本明顯更低!崩顝┖赀M(jìn)一步說,“大家以前用開源覺得便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落后!
這不是他第一次吐槽開源大模型。據(jù)報道,李彥宏近日在內(nèi)部講話中表示,大模型閉源是有真正的商業(yè)模式的,是能夠賺到錢的,最終才能聚集算力、聚集人才。
巧合的是,本月阿里云通義千問披露了最新開源(20.600, 0.00, 0.00%)進(jìn)展,開源320億參數(shù)模型Qwen1.5-32B,此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型。阿里云相關(guān)人士告訴北京商報記者,上述大模型均已升級至1.5版本。此次開源的320億參數(shù)模型相比通義千問14B開源模型,在智能體場景下能力更強,相比通義千問72B開源模型,推理成本更低。
李彥宏也強調(diào)了成本,“通過這種大小模型的組合調(diào)度方式,小度完成了‘換腦行動’,裝上AI原生操作系統(tǒng)DuerOS X,相比全部使用文心大模型的旗艦版,響應(yīng)速度提升2倍,成本下降99%”。
其實,大小模型組合不是百度獨有!敖裉旌芏嚅_源的軟件給的是百億(級別的)模型,跟ChatGPT不能比,但是在企業(yè)內(nèi)部夠用的情況下,它的部署成本可以從原來的千萬美元降到千萬元甚至百萬元的級別。我覺得,這就真正達(dá)到了‘把大模型拉下神壇’的目標(biāo)!360創(chuàng)始人周鴻祎在2023年8月說。
認(rèn)知和落地
另一個總會占據(jù)百度Create大會不小篇幅的業(yè)務(wù)是出行。李彥宏是在談及多模態(tài)大模型上提到駕駛的。在他看來,“多模態(tài)大模型,或者說文字、圖片、語音、視頻等多模態(tài)的融合,是基礎(chǔ)模型非常重要的長期發(fā)展方向,是通往AGI(人工通用智能)的必經(jīng)之路。視覺大模型最大的應(yīng)用場景是自動駕駛”。
“李彥宏的認(rèn)知沒有問題,但認(rèn)知正確不代表能順利落地,”文淵智庫創(chuàng)始人王超告訴北京商報記者,“百度在人工智能的積累和開局不錯,但目前大規(guī)模商業(yè)化的能力欠缺!
2023年百度營收1345.98億元,較2022年增長9%,非公認(rèn)會計準(zhǔn)則下凈利潤287億元,較2022年增長39%。根據(jù)百度電話會議透露的信息,受益于通用人工智能和基礎(chǔ)模型,百度2023年四季度云業(yè)務(wù)產(chǎn)生6.56億元收入,這個數(shù)字在2024年全年將增長到數(shù)十億元。
換一個角度看數(shù)據(jù)。2023年12月百度App月活6.67億,該數(shù)字在2023年6月是6.77億。
來自QuestMobile的數(shù)據(jù)顯示,在AIGC(人工智能生成內(nèi)容)領(lǐng)域,2024年1月,抖音的豆包、百度的文心一言、昆侖萬維(39.740, 0.00, 0.00%)的天工是國內(nèi)月活躍用戶規(guī)模排名前三的App,當(dāng)月月活分別是1756.9萬、1212.5萬、801.4萬。用戶超2億,那月活數(shù)據(jù)呢?北京商報記者就文心一言用戶數(shù)據(jù)采訪百度相關(guān)人士,其表示“未對外公布”。