南方財經(jīng)全媒體記者 吳立洋 上海報道
算力、數(shù)據(jù)與算法,在本輪人工智能大模型產(chǎn)業(yè)興起時被稱為行業(yè)發(fā)展最重要的三大要素,隨著ChatGPT帶動的通用大模型熱潮褪去與垂直賽道大模型的涌現(xiàn),上述三大要素的細(xì)分需求亦隨之發(fā)生變化。
在近日舉辦的2024云棲大會上,阿里云展示了全新升級后的AI Infra系列產(chǎn)品及能力,據(jù)其介紹,該模型中臺連續(xù)訓(xùn)練有效時長大于99%,模型算力利用率提升20%以上。隨著GPU供給漸趨穩(wěn)定與架構(gòu)方式的不斷優(yōu)化,算力降價亦成為各大云廠商的普遍趨勢。
在訓(xùn)練數(shù)據(jù)供給方面,高質(zhì)量、細(xì)分領(lǐng)域數(shù)據(jù)仍是稀缺資源,但圍繞數(shù)據(jù)采集、清晰、交易的產(chǎn)業(yè)流程已漸趨完善,各行業(yè)對數(shù)據(jù)采集與利用重要性的認(rèn)識亦不斷加深。
而在各大廠商爭相發(fā)布自身的通用大模型后,面向細(xì)分領(lǐng)域及場景需求的垂直類大模型,開始成為AI商業(yè)化落地過程中最重要的賽道——畢竟如若無法與市場需求對接,智能性再強(qiáng)的大模型也很難擁有支撐其長期迭代訓(xùn)練的土壤。
在本屆大會上,豐富且多元的大模型應(yīng)用似乎也在先在顯示這樣一種現(xiàn)實:此前被認(rèn)為可能不及算力與數(shù)據(jù)重要的算法,成為大模型面向具體領(lǐng)域商業(yè)化的重要環(huán)節(jié),且這種面向具體場景的算法競爭,也對算力和數(shù)據(jù)供給反向提出了新的要求。
成本降低
企業(yè)對大模型價格的書名可能存在差異,但定價無疑是最難以說謊的直觀數(shù)據(jù)。從公開價格來看,無論是大模型調(diào)用的價格還是算力價格,在過去一年都開始呈現(xiàn)下降趨勢。
以阿里云為例,百煉平臺上的三款通義千問主力模型中,Qwen-Turbo價格直降85%,Qwen-Plus和Qwen-Max分別再降價80%和50%;阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長兼CEO吳泳銘在主論壇開幕式上表示,通義千問API在阿里云百煉上的調(diào)用價格下降了97%,百萬tokens調(diào)用花費(fèi)最低降到0.5元。
今年4月,SCNet國家超算互聯(lián)網(wǎng)官網(wǎng)給出的英偉達(dá)A800人工智能訓(xùn)卡每小時訓(xùn)練價格降低到2元,且伴隨著眾多大模型開源,很多企業(yè)的訓(xùn)練需求也由整體的模型訓(xùn)練轉(zhuǎn)為對成熟模型的二次訓(xùn)練調(diào)整,疊加GPU供給度過極度緊缺狀態(tài),算力價格得以有所下滑。
阿里云副總裁張啟在大會發(fā)言中表示,目前新增的算力需求AI占比已經(jīng)超過了50%,這意味著整個算力市場的主體需求正從原來的CPU轉(zhuǎn)向AI計算,且這一趨勢的加速度仍會不斷提高。吳泳銘也不禁在大會發(fā)言中感慨,過去一年,阿里云投資新建了大量的AI算力,但還是遠(yuǎn)遠(yuǎn)不能滿足客戶的旺盛需求。
“現(xiàn)在我們也瘋狂搞AI大基建,只有把資費(fèi)降到足夠低,才有可能去談未來應(yīng)用的爆發(fā)!睆垎⒈硎尽
而在數(shù)據(jù)方面,無論是對通用大模型還是垂直類大模型,高質(zhì)量、專業(yè)化的數(shù)據(jù)依然是各大廠商急需的訓(xùn)練資源,在本次云棲大會期間,與數(shù)據(jù)相關(guān)的產(chǎn)品和話題也受到廣泛關(guān)注。
例如在產(chǎn)品方面,海天瑞聲(42.550, -0.16, -0.37%)發(fā)布的DOTS一體化數(shù)據(jù)服務(wù)平臺、51Sim展示的合成數(shù)據(jù)集及針對3D數(shù)據(jù)生產(chǎn)的工具鏈,均是圍繞專業(yè)化數(shù)據(jù)采集、清洗提供的解決方案。
此外,對于大模型廠商而言,專業(yè)領(lǐng)域的數(shù)據(jù)積累,也成為其提升模型質(zhì)量,構(gòu)建自身競爭力的主要優(yōu)勢所在。
精準(zhǔn)學(xué)CEO楊仁斌在接受南方財經(jīng)全媒體記者采訪時表示,就教育領(lǐng)域的大模型而言,核心的競爭壁壘在于數(shù)據(jù)積累,其基于自研語音端到端“心流大模型”開發(fā)的“超擬人AI一對一老師”,就是依托大量題庫、學(xué)生行為反饋數(shù)據(jù)以及教育語音數(shù)據(jù)訓(xùn)練而成,充足且與應(yīng)用場景高度相關(guān)的數(shù)據(jù),能夠顯著提升AI生成內(nèi)容的精確度及用戶體驗。
應(yīng)用先行
多模態(tài),是本屆云棲大會的另一重點話題。
作為東道主,阿里云放出的一大重要發(fā)布內(nèi)容便是通義萬相的全面升級:搭載全新視頻生成功能,可生成影視級高清視頻,應(yīng)用于影視創(chuàng)作、動畫設(shè)計、廣告設(shè)計等領(lǐng)域。
“圖形和視頻生成是當(dāng)前付費(fèi)意愿較強(qiáng)的領(lǐng)域之一,但是在商業(yè)化模式方面還沒有形成統(tǒng)一的路徑!币晃磺皝韰膶幉▌赢嬓袠I(yè)從業(yè)者在與記者交流時表示,除了C端訂閱制收費(fèi)外,B端的圖像生成需求往往對細(xì)節(jié)、連貫性等方面存在較高要求,這往往是單次大模型調(diào)用難以一次完成的,且針對不同的主題,內(nèi)容生成的質(zhì)量和速度也各不相同,因此對商用需求的交付標(biāo)準(zhǔn)、訓(xùn)練次數(shù)等,業(yè)界和模型提供者還在磨合過程中。
而在自動駕駛領(lǐng)域,大模型的需求則相對明確。以本次帶著“全球首款A(yù)I汽車”P7+亮相云棲大會的小鵬汽車為例,端到端自動駕駛、車載助力、通義靈碼的代碼編寫是其提到的小鵬運(yùn)用大模型的主要方向。
實際需求與大模型能力能否對接,本質(zhì)上考驗的是模型算法與應(yīng)用場景的適配程度。值得注意的是,當(dāng)ToB還在反復(fù)衡量商業(yè)模式與算力成本時,ToC應(yīng)用則已經(jīng)開始側(cè)重于個性化與定制服務(wù)。
在以體驗和博弈為主要樂趣的游戲行業(yè),富有自由度和應(yīng)變能力的交互方式,被視為AI對游戲帶來的最大提升之一。例如巨人網(wǎng)絡(luò)(9.320, -0.08, -0.85%)于本次云棲大會展示的“AI殘局挑戰(zhàn)”就專注于高智慧行為,能夠根據(jù)不同局勢采取謀略、偽裝甚至互相“抱團(tuán)”。據(jù)展臺工作人員介紹,這種根據(jù)玩家對局情況進(jìn)行調(diào)整的功能能夠極大提升玩家的游玩樂趣。
在教育領(lǐng)域,楊仁斌則指出,一對一教學(xué)是最主要的需求之一,但不同學(xué)生的知識情況和學(xué)習(xí)習(xí)慣則各不相同,垂直類AI在升級后最重要的能力就是根據(jù)教學(xué)情況,及時切換教學(xué)方式,提升學(xué)習(xí)效果,增加教學(xué)資源供給。
“要以AI為中心構(gòu)建一切服務(wù)。而不是原有的產(chǎn)品加上一個AI模塊,這樣充其量只能叫用AI降本增效,但無法從本質(zhì)上解決問題。”他表示,這種能夠根據(jù)學(xué)生實時提問、反饋決定生成內(nèi)容個性化服務(wù),就是其ToC最主要的競爭力和付費(fèi)支撐。