12月23日,“2025中國信通院深度觀察報告會”在北京舉辦。中國信通院信息化與工業(yè)化融合研究所總工程師黃偉針對計算領域發(fā)表了自身觀點和見解。
在他看來,先進計算領域是當前科技創(chuàng)新浪潮的重點,2024年總體仍然保持穩(wěn)步向上的良好態(tài)勢,涌現(xiàn)出了一批創(chuàng)新性的成果,持續(xù)發(fā)揮著對經(jīng)濟社會高質(zhì)量發(fā)展的重要支撐和推動作用。
先進計算領域發(fā)展態(tài)勢穩(wěn)步向上
黃偉從產(chǎn)業(yè)、算力、技術、生態(tài)四方面分析了先進計算領域的發(fā)展成果。具體而言,在產(chǎn)業(yè)方面,智能計算成為核心驅(qū)動力。AI服務器依然保持高增速,AI手機、AI PC迅猛增長,帶動GPU與存儲等上游環(huán)節(jié)開啟新一輪增長,成為扭轉(zhuǎn)半導體市場下降趨勢的關鍵動力。全球數(shù)字化轉(zhuǎn)型與智能應用的需求釋放也帶動軟件市場規(guī)模穩(wěn)定持續(xù)增長。
在算力方面,總量快速增長,2024年全球計算設備算力規(guī)模為2207EFlops,其中,我國達617EFlops,全球占比28%,增速42%。智能算力成為絕對主導。自2018年到2024年,六年間全球算力中智能算力的占比由7%增長至73%,且隨著人工智能落地應用加快,智能算力逐漸向推理側傾斜,算力結構的演進和轉(zhuǎn)變?nèi)栽诔掷m(xù)。
在技術方面,以智能計算為中心的體系化變革進一步深化。通用計算與智能計算架構進一步實現(xiàn)融合,異構算力性能加速突破,集群規(guī)模步入萬卡/十萬卡時代,多數(shù)據(jù)中心分布式訓練進入探索階段。量子計算、類腦神經(jīng)模擬等前沿計算技術也圍繞AI不斷探索落地應用。
在生態(tài)方面,產(chǎn)業(yè)競合態(tài)勢持續(xù)演變。龍頭企業(yè)通過加速自研芯片進程,支持開源項目加快軟件棧生態(tài)的完善,組建開放聯(lián)盟推動打造互聯(lián)新體系等方式,意圖降低對英偉達智算體系的依賴。通用計算領域競爭也趨于白熱化,x86陣營加速技術和產(chǎn)品迭代,意圖抵擋ARM架構對服務器和PC市場的進一步侵蝕。
智能計算多領域創(chuàng)新成果顯著
與此同時,黃偉也指出:“2024年對于智能計算來講是變革與突破的一年,我們迎來了很多的變化,從集群、芯片、互聯(lián)、軟件等領域均涌現(xiàn)出眾多創(chuàng)新性成果,為行業(yè)發(fā)展指明了新的方向!
集群方面,萬億參數(shù)開啟萬卡時代。萬卡集群成為大模型競爭的關鍵支撐,隨著互聯(lián)、存儲等關鍵技術的快速進步,國際龍頭企業(yè)的萬卡/十萬卡智算集群在今年先后投入使用,目前萬卡以上規(guī)模集群數(shù)量已達數(shù)十個。
芯片方面,GPGPU、DSA所面向的應用場景正逐步趨向融合。英偉達、AMD等GPGPU廠商持續(xù)圍繞新算法需求加強布局,以更加契合AI計算需求。而以谷歌TPU為代表的DSA芯片隨代際更迭陸續(xù)加入通用模塊,適用范圍進一步擴大。
互聯(lián)方面,各層級互聯(lián)性能及規(guī)模大幅提升。以英偉達NVLink為代表的卡間互聯(lián)速率4年提升3倍,達到1800GB/s,互聯(lián)規(guī)模由8卡擴大至576卡。節(jié)點間互聯(lián)技術競爭更趨激烈,超以太網(wǎng)技術成為各龍頭與英偉達Infiniband技術競爭的新戰(zhàn)場。
軟件棧方面,多條發(fā)展路徑共存。以英偉達為代表的芯片龍頭企業(yè)加速全棧式布局。AI芯片新勢力聯(lián)合建立開源生態(tài),通過探索建立開源編譯器和算子庫,進一步降低適配成本?蒲性核ㄟ^構建軟件棧中間層,探索推動現(xiàn)有“煙囪式”軟件棧的統(tǒng)一,進而提升AI芯片訓推適配性能。
AI終端成為產(chǎn)業(yè)升級的重點演進方向
2024年迎來端側大模型的爆發(fā)式創(chuàng)新浪潮,以手機、PC為代表的消費電子產(chǎn)品率先響應,蘋果、華為、vivo、OPPO榮耀等主流廠商均推出主打大模型功能的AI手機新品;微軟推出AI PC概念,聯(lián)想發(fā)布內(nèi)置個人大模型的產(chǎn)品。高通、聯(lián)發(fā)科、英特爾、AMD等芯片廠商的最新旗艦產(chǎn)品亦聚焦端側智能算力的升級,操作系統(tǒng)、AI大模型、應用廠商也在加緊布局。
“AI終端成為當下智能終端技術革新、產(chǎn)業(yè)升級的重點演進方向!秉S偉強調(diào)。
從技術發(fā)展角度,終端受限于算力及功耗瓶頸,難以在本地高效承載大模型密集計算任務,AI終端需強化“軟、硬、算、端、云”一體化整合進階。主要呈現(xiàn)出四條重點創(chuàng)新路徑:一是,端云協(xié)同化部署,當前大模型任務仍以云端算力執(zhí)行為主,并呈現(xiàn)向端側滲透趨勢。二是,軟件系統(tǒng)級融合,操作系統(tǒng)集成AI大模型服務組件,并以系統(tǒng)級智能體作為響應用戶交互需求的首要入口。三是,算力智能化升級,端側智能計算芯片以CPU+GPU+NPU異構集成為主,還需圍繞算力+內(nèi)存的協(xié)同升級來提升性能,增強對大模型的應用適配能力。四是,全鏈路安全保障,通過構建覆蓋安全芯片、定制操作系統(tǒng)、私密云計算的可信執(zhí)行環(huán)境,結合新型隱私防護機制,確保數(shù)據(jù)全流程安全管理。
從產(chǎn)業(yè)升級角度,端側大模型的落地正成為推動AI終端市場蓬勃發(fā)展的有效引擎,根據(jù)IDC等數(shù)據(jù)預測,至2027年,我國AI手機、AI PC的市場滲透率將分別超過50%和80%,除了激活消費增長需求外,也將有力驅(qū)動終端上游產(chǎn)業(yè)鏈的升級,包括核心促進端側智能計算芯片、高性能存儲芯片等性能升級,部分拉動周邊芯片、傳感器、電池等零部件需求,如促進傳感器的感知精度提升、電池的續(xù)航能力改進等,多維度帶動產(chǎn)業(yè)邁向新高度。