2023年密集升級(jí)后,國(guó)內(nèi)大廠大模型的迭代節(jié)奏轉(zhuǎn)為小步快跑。5月9日,阿里云CTO周靖人揭開了最新版大模型通義千問2.5的面紗,并系統(tǒng)性披露了阿里云AI應(yīng)用的一系列新進(jìn)展。
站在C(用戶)端角度,抖音旗下AIGC應(yīng)用豆包的月活用戶排名第一,且數(shù)據(jù)已拉開差距。B端競(jìng)爭(zhēng)更加劍拔弩張,閉源開源孰優(yōu)孰劣的背后是大模型技術(shù)、成本、商業(yè)化、生態(tài)的比拼,阿里云用1100億參數(shù)的開源大模型證明自己的誠(chéng)意,3%的營(yíng)收同比增幅也實(shí)實(shí)在在地反映了阿里云的瓶頸。
新版本
和上線通義千問2.1版本相比,阿里云這次公布2.5版本要高調(diào)得多!斑@個(gè)版本代表了全方位的能力提升”,周靖人用理解能力、邏輯推理、指令遵循、代碼能力舉例,2.5版本較2.1版本分別提升9%、16%、19%、10%。
將時(shí)間拉長(zhǎng),2023年4月通義大模型啟動(dòng)邀請(qǐng)測(cè)試,一年間行業(yè)發(fā)生的變化讓從業(yè)者都倍感驚訝。
在周靖人看來,目前整個(gè)技術(shù)體系的發(fā)展在一個(gè)快速上升的渠道,不過目前市面上的大模型工具都還有提升空間。
為了證明自己的大模型能力,阿里云和同行的操作一致——援引評(píng)測(cè)結(jié)果:在權(quán)威基準(zhǔn)OpenCompass上,通義千問2.5得分追平GPT-4 Turbo;通義千問視覺理解模型Qwen-VL-Max在多個(gè)多模態(tài)標(biāo)準(zhǔn)測(cè)試中超越Gemini Ultra和GPT-4V,目前已在多家企業(yè)落地應(yīng)用;通義千問代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的頭名選手,是智能編碼助手通義靈碼的底座。
按照通義千問官網(wǎng)的歸納,其基于大模型的服務(wù)共有10項(xiàng),包括大模型服務(wù)平臺(tái)阿里云百煉、AI閱讀助手通義智文、剛發(fā)布企業(yè)版的通義靈碼等。企業(yè)客戶和開發(fā)者可以通過API(應(yīng)用程序編程接口)調(diào)用、模型下載等方式接入通義,個(gè)人用戶可從通義App、官網(wǎng)和小程序免費(fèi)使用通義家族全棧服務(wù)。
N合一
這些垂直領(lǐng)域的產(chǎn)品也在不斷調(diào)整。5月9日,“通義千問App”更名為“通義App”。升級(jí)前,通義App設(shè)有三個(gè)入口:對(duì)話、智能體、頻道,升級(jí)后變?yōu)橹、工具、角色、頻道。2024年通義推出的“全民舞王”“全民唱演”“通義照相館”等應(yīng)用在頻道一欄。
兩個(gè)月前,通義聽悟工程研發(fā)負(fù)責(zé)人邢君就向北京商報(bào)記者透露了通義聽悟集成進(jìn)通義App的計(jì)劃。5月9日,阿里云相關(guān)人告訴北京商報(bào)記者,“目前,包括通義聽悟、智文等通義家族產(chǎn)品能力已集成到通義App中”。
根據(jù)蘋果應(yīng)用商店數(shù)據(jù),通義在免費(fèi)效率榜單排在第13位,同類的大模型產(chǎn)品還包括豆包、文心一言、訊飛星火、智譜清言、天工、kimi等。
第三方商業(yè)智能數(shù)據(jù)服務(wù)商QuestMobile發(fā)布的最新數(shù)據(jù)顯示,AIGC獨(dú)立App用戶量超7380萬(wàn),同比增長(zhǎng)8倍。2024年3月,豆包、文心一言、天工、訊飛星火、Kimi的月活用戶分別是2328.2萬(wàn)、1466.1萬(wàn)、966.1萬(wàn)、620.4萬(wàn)、589.7萬(wàn)。
這一排名等同于國(guó)內(nèi)大模型的能力嗎?文淵智庫(kù)創(chuàng)始人王超的答案是否定的,他告訴北京商報(bào)記者,“還是要以用戶的使用感受為第一,而不是月活規(guī)模。我個(gè)人的排名是Gemini免費(fèi)版、GPT3.5和Kimi差不多、通義千問、文心一言”。
除獨(dú)立App外,小程序也是大模型接觸用戶的主要渠道。根據(jù)QuestMobile提供的Kimi和訊飛星火的數(shù)據(jù),2024年3月Kimi微信小程序月活用戶91.1萬(wàn),訊飛星火去重總用戶規(guī)模635.6萬(wàn)。
繼續(xù)開源
“用戶活躍度能一定程度上反映大模型產(chǎn)品的市場(chǎng)格局。受到用戶屬性、產(chǎn)品體量和活躍度影響,目前豆包和文心一言的用戶量級(jí)明顯較高,但從產(chǎn)品功能來看,kimi的使用場(chǎng)景更為垂直,這意味著kimi近600萬(wàn)的活躍用戶黏性更高,用戶的忠誠(chéng)度和未來的運(yùn)營(yíng)空間也會(huì)更大。”瑞達(dá)恒研究院經(jīng)理王清霖告訴北京商報(bào)記者,“通義這類大模型產(chǎn)品也可以結(jié)合阿里自身的產(chǎn)品屬性優(yōu)勢(shì),找到自己的發(fā)展方向和黏性用戶!
開源閉源的優(yōu)劣則是行業(yè)觀察者聚焦的重點(diǎn)。4月,百度CEO李彥宏公開表示,“大家以前用開源覺得便宜,其實(shí)在大模型場(chǎng)景下,開源是最貴的。所以開源模型會(huì)越來越落后”。5月9日,周靖人接受媒體采訪時(shí)回答的第一個(gè)問題也與此有關(guān)!伴_源對(duì)整個(gè)技術(shù)發(fā)展的意義大家都可以看到。阿里云自己做最先進(jìn)的AI模型,也敢于開源,這對(duì)企業(yè)真正做創(chuàng)新性開發(fā)將起到至關(guān)重要的作用,這一點(diǎn)在全球范圍已經(jīng)被多次證明,沒有再討論的必要。”
“坦率地說,不是所有的閉源公司的模型都能做得過開源模型,首先閉源公司的模型水平要超過開源模型的水準(zhǔn)!敝芫溉搜a(bǔ)充。
當(dāng)天,阿里云發(fā)布了最新款開源模型1100億參數(shù)的Qwen1.5-110B,此前5億、18億、40億、70億、140億、320億和720億參數(shù)的大模型已經(jīng)開源。
談到最近大火的長(zhǎng)文本處理能力,周靖人強(qiáng)調(diào)了兩點(diǎn),支持、先發(fā),“我們的長(zhǎng)文本處理功能其實(shí)是先于行業(yè)所有公司的,通義App單次可處理多達(dá)1000萬(wàn)字的長(zhǎng)文檔,還能同時(shí)解析100份不同格式的文檔。長(zhǎng)文本處理能力不光要看文本的長(zhǎng)度,還要基于場(chǎng)景做總結(jié)、歸納等,誰(shuí)的技術(shù)更強(qiáng)這種討論沒必要”。