首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 必讀 >> 正文

千億參數(shù)AI模型Yi-Large來(lái)了!李開(kāi)復(fù):要發(fā)展普惠型、全球化大模型

2024年5月14日 07:10  CCTIME飛象網(wǎng)  

飛象網(wǎng)訊 (計(jì)育青/文)如今各行各業(yè)都對(duì)AI大模型非常關(guān)注,期待著越來(lái)越多好用易用、低成本的AI應(yīng)用能夠改變我們的工作和生活。近日,零一萬(wàn)物公司發(fā)布了多款A(yù)I模型,以其突出的表現(xiàn)吸引了業(yè)界的廣泛關(guān)注。

零一萬(wàn)物此次發(fā)布了具有千億參數(shù)規(guī)模的閉源模型Yi-Large,在斯坦福最新的AlpacaEval 2.0全球大模型排行榜上贏率名列第一。零一萬(wàn)物還推出了多款參數(shù)規(guī)模較小的開(kāi)源模型,這些模型在多種第三方測(cè)試中都做到了同等級(jí)別模型SOTA性能最佳。零一萬(wàn)物CEO李開(kāi)復(fù)表示,零一萬(wàn)物的目標(biāo)是打造普惠型、全球化的AI大模型,讓人人都能從中受益。

Yi-Large躋身全球SOTA頂級(jí)大模型行列

2023年11月,零一萬(wàn)物曾發(fā)布了Yi-34B大模型,雖然參數(shù)規(guī)模并不大,但評(píng)測(cè)結(jié)果卻超越了Llama2-70B、Falcon-180B等大規(guī)模模型,成為當(dāng)時(shí)全球最強(qiáng)的開(kāi)源基礎(chǔ)模型之一。時(shí)隔半年,零一萬(wàn)物又推出了千億參數(shù)規(guī)模的Yi-Large,性能表現(xiàn)更是經(jīng)驗(yàn)。

據(jù)李開(kāi)復(fù)介紹,第三方權(quán)威評(píng)測(cè)結(jié)果表明,零一萬(wàn)物Yi-Large的中英文雙語(yǔ)表現(xiàn)都非常出色。在最新的斯坦福AlpacaEval 2.0榜單上,Yi-Large模型的英語(yǔ)能力主要指標(biāo)“控制回復(fù)的長(zhǎng)度”名列世界第二,僅次于GPT-4 Turbo。在此之前,國(guó)內(nèi)大模型僅有零一萬(wàn)物和Qwen曾經(jīng)登上此榜單的前20名。在中文能力方面,SuperCLUE發(fā)布的四月評(píng)測(cè)報(bào)告中,Yi-Large位列國(guó)產(chǎn)大模型之首,而且綜合中英雙語(yǔ)能力都表現(xiàn)優(yōu)異。在更全面的綜合評(píng)測(cè)中,Yi-Large有多數(shù)指標(biāo)超越了GPT4、Claude3、Google Gemini 1.5等同級(jí)模型,在通用能力、代碼生成、數(shù)學(xué)推理、指令遵循等方面都位居領(lǐng)先,穩(wěn)列全球第一梯隊(duì)。

李開(kāi)復(fù)表示,一系列權(quán)威測(cè)評(píng)表明,Yi-Large是當(dāng)前可用的最好的AI大模型,不過(guò)零一萬(wàn)物仍在繼續(xù)創(chuàng)新,正在訓(xùn)練規(guī)模更大的新模型Yi-XLarge。Yi-XLarge將是一種混合專(zhuān)家大模型(MoE),雖然尚未完成最終訓(xùn)練,但是在一些權(quán)威評(píng)測(cè)中仍然做到了與Claude-3-Opus、GPT4-0409最新旗艦級(jí)模型互有勝負(fù),非常值得期待。

Yi-1.5開(kāi)源大模型實(shí)現(xiàn)普惠式服務(wù)

Yi-Large是面向商用市場(chǎng)的閉源大模型,不過(guò)零一萬(wàn)物此次也帶來(lái)了新升級(jí)的開(kāi)源系列模型Yi-1.5,包括34B、9B、6B 三個(gè)不同規(guī)模的版本和Yi-1.5-Chat微調(diào)模型。測(cè)評(píng)結(jié)果表明,Yi-1.5系列模型在數(shù)學(xué)推理、代碼能力、指令遵循等方面表現(xiàn)很突出,遠(yuǎn)勝同參數(shù)規(guī)模的其它模型,也優(yōu)于近期發(fā)布的Llama-3-8B-Instruct模型。

李開(kāi)復(fù)表示,很多學(xué)生、創(chuàng)業(yè)者、老師、科研人員、公益組織都需要學(xué)習(xí)、探索和使用大模型,但是可能無(wú)法承擔(dān)GPT-4、Yi-Large等商業(yè)閉源大模型的成本,因此推出開(kāi)源的AI大模型非常重要。零一萬(wàn)物的策略是以開(kāi)源模型構(gòu)建生態(tài)、提供普惠式服務(wù),吸引科研院校、學(xué)生、開(kāi)發(fā)者、創(chuàng)業(yè)者在此基礎(chǔ)上開(kāi)展教學(xué)和創(chuàng)新,豐富生態(tài)、拓展應(yīng)用;同時(shí),以閉源模型展開(kāi)前沿探索,服務(wù)對(duì)先進(jìn)AI大模型有迫切需求的前沿企業(yè)。開(kāi)源閉源雙軌體系構(gòu)成了良好的生態(tài)環(huán)境,加快AI技術(shù)和應(yīng)用的迭代進(jìn)步。

為幫助業(yè)界快速接入全球領(lǐng)先的AI大模型,零一萬(wàn)物此次不僅發(fā)布了閉源、開(kāi)源的系列模型,還推出了面向個(gè)人用戶(hù)的“萬(wàn)知”服務(wù)、賦能行業(yè)伙伴的“API 開(kāi)放平臺(tái)”。李開(kāi)復(fù)表示,使用“萬(wàn)知”服務(wù)很方便,一是在微信上搜索“萬(wàn)知”小程序,二是登錄wanzhi.com。“萬(wàn)知”的作用不僅僅是一個(gè)對(duì)話(huà)工具,它也可以分析海量數(shù)據(jù),處理文字、圖表等信息,自動(dòng)生成PPT等文檔,成為一種高效的工作助手、生產(chǎn)力工具。零一萬(wàn)物的“API 開(kāi)放平臺(tái)”面向商用市場(chǎng),不過(guò)設(shè)計(jì)非常周到,既有調(diào)用大規(guī)模AI模型的Yi-Large-RAG API和Yi-Large-Turbo API,也有調(diào)用中小規(guī)模AI模型的Yi-Medium API、Yi-Vision API,以及調(diào)用超小規(guī)模模型的Yi-Spark API,成本從高到低,客戶(hù)可以各取所需。

“零一萬(wàn)物API的特色是既追求最高的性能,又追求很好的性?xún)r(jià)比!崩铋_(kāi)復(fù)說(shuō)。

發(fā)展AI大模型也要講求成本收益

人們通常認(rèn)為,AI大模型就是要靠越來(lái)越復(fù)雜的算法、越來(lái)越強(qiáng)的算力基礎(chǔ)設(shè)施來(lái)支撐,這導(dǎo)致每一家AI模型開(kāi)發(fā)企業(yè)都在持續(xù)投入巨資建設(shè)算力,而收益卻遠(yuǎn)遠(yuǎn)跟不上。李開(kāi)復(fù)認(rèn)為,AI大模型的競(jìng)爭(zhēng)不是一場(chǎng)短程賽跑,更像是一場(chǎng)比拼耐力的長(zhǎng)跑,每一個(gè)身處其間的選手都應(yīng)該關(guān)注投資和收益,設(shè)法降低訓(xùn)練成本、用戶(hù)調(diào)用API的價(jià)格,并且根據(jù)實(shí)際應(yīng)用需求,務(wù)實(shí)地壓縮模型規(guī)模。

零一萬(wàn)物有自己的獨(dú)特優(yōu)勢(shì),比如全球化布局,模型與算力架構(gòu)綜合研發(fā)能力等。零一萬(wàn)物是一家面對(duì)全世界開(kāi)展服務(wù)的AI企業(yè),在美歐等市場(chǎng)都開(kāi)展業(yè)務(wù),因此可以發(fā)展更快的國(guó)外經(jīng)驗(yàn)引入國(guó)內(nèi)市場(chǎng),包括成本優(yōu)化、模型規(guī)模調(diào)整、市場(chǎng)策略等,從而使得在國(guó)內(nèi)開(kāi)發(fā)的產(chǎn)品從一開(kāi)始就能很好地適應(yīng)市場(chǎng)需求,并且能很快獲得收益。李開(kāi)復(fù)告訴記者,零一萬(wàn)物已經(jīng)有產(chǎn)品在海外市場(chǎng)上線(xiàn)了九個(gè)月,贏得了千萬(wàn)級(jí)用戶(hù)規(guī)模,在行業(yè)市場(chǎng)上也與部分世界500強(qiáng)企業(yè)達(dá)成了深度合作關(guān)系。另一方面,零一萬(wàn)物不僅僅從事大模型開(kāi)發(fā),同時(shí)也有自己的專(zhuān)業(yè)算力架構(gòu)團(tuán)隊(duì),能夠從底層算力的層面對(duì)模型進(jìn)行優(yōu)化,因此整體訓(xùn)練成本比只做大模型開(kāi)發(fā)的企業(yè)低一半左右,而且可以用有限的算力資源來(lái)打造性能極致的大模型產(chǎn)品。

李開(kāi)復(fù)表示,美國(guó)一些先進(jìn)的企業(yè)可以大量堆砌先進(jìn)GPU算力,中國(guó)企業(yè)則沒(méi)有這個(gè)條件,必須采取更加務(wù)實(shí)的策略,加強(qiáng)對(duì)AI+算力架構(gòu)的綜合開(kāi)發(fā),這其實(shí)也是美國(guó)AI研發(fā)企業(yè)的共識(shí)?偟膩(lái)說(shuō),就是做AI模型研究必須要“向下走”,具備一定的計(jì)算效率優(yōu)化能力。經(jīng)過(guò)優(yōu)化,零一萬(wàn)物千億參數(shù)模型的訓(xùn)練成本同比降幅達(dá)一倍之多。以“萬(wàn)知”服務(wù)為例,零一萬(wàn)物利用自研的基于全導(dǎo)航圖的新型向量數(shù)據(jù)庫(kù)笛卡爾訓(xùn)練,大大縮減了“萬(wàn)知”的訓(xùn)練速度和成本,與采用第三方的向量數(shù)據(jù)庫(kù)相比,節(jié)約成本超過(guò)80%。

從2023年9月開(kāi)始,零一萬(wàn)物先后在海外推出了4款產(chǎn)品,面向個(gè)人用戶(hù)的大模型產(chǎn)品也成功打通了用戶(hù)訂閱制的商業(yè)模式。李開(kāi)復(fù)最后強(qiáng)調(diào),AI大模型的推廣應(yīng)用將是一個(gè)長(zhǎng)期的過(guò)程,不能依靠免費(fèi)推廣、持續(xù)大投入研發(fā)升級(jí)的模式來(lái)爭(zhēng)奪市場(chǎng)。一個(gè)更合理的模式是發(fā)展性能優(yōu)異、規(guī)模合理、高性?xún)r(jià)比的AI大模型產(chǎn)品體系,以不同層次的閉源大模型賦能產(chǎn)業(yè)伙伴、服務(wù)商業(yè)客戶(hù),以適當(dāng)性能的開(kāi)源模型促進(jìn)生態(tài)建設(shè)、激活應(yīng)用需求!敖酉聛(lái),零一萬(wàn)物將立足全球市場(chǎng),亦不斷升級(jí)的大模型應(yīng)用助力中國(guó)建設(shè)普惠型AI時(shí)代!崩铋_(kāi)復(fù)說(shuō)。

編 輯:馬秋月
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話(huà)為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
鄔賀銓?zhuān)捍竽P拖鲁恋绞謾C(jī) 將激活萬(wàn)億元規(guī)模手機(jī)產(chǎn)業(yè)
精彩專(zhuān)題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤(pán)點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像