飛象網(wǎng)原創(chuàng)(高靖宇/文)數(shù)字科技的2024年,人工智能(AI)無疑是當(dāng)之無愧的主角。這一年,AI的發(fā)展呈現(xiàn)出一系列令人矚目的態(tài)勢。
從技術(shù)演進(jìn)來看,大模型在海量數(shù)據(jù)和強(qiáng)大算力的支撐下實(shí)現(xiàn)了從單任務(wù)到多任務(wù)智能的重大跨越,在語言處理、圖像識別等多方面能力持續(xù)進(jìn)化。在產(chǎn)業(yè)層面,AI成為推動各行各業(yè)變革的核心引擎,AI在各行業(yè)的賦能進(jìn)入新階段。
在2025中國信通院深度觀察報(bào)告會上,人工智能再次成為焦點(diǎn)議題,各領(lǐng)域?qū)<覐牟煌囊暯浅霭l(fā),就人工智能及大模型技術(shù)未來發(fā)展趨勢展開了深度探討與解讀。
智能體引領(lǐng)終端革命
在2024年,智能體正逐步成為引領(lǐng)終端革命的重要力量。隨著端側(cè)大模型技術(shù)的迅猛發(fā)展,智能體不僅在技術(shù)上實(shí)現(xiàn)了突破,更在生活場景中展現(xiàn)出強(qiáng)大的應(yīng)用潛力。
vivo推出的PhoneGPT,它不僅能夠識別手機(jī)界面內(nèi)容,還能在復(fù)雜的場景中自動完成訂餐、訂票等任務(wù)。OPPO 的ColorOS 15通過引入系統(tǒng)級的AI交互,擁有強(qiáng)大的屏幕內(nèi)容識別與指令處理能力。例如,在小紅書中,小布助手能識別屏幕內(nèi)容,一鍵生成旅游路線。榮耀最新個人化全場景AI操作系統(tǒng)MagicOS 9.0,用戶只需要簡單一句話,語音助手YoYo就可以自動檢查支付寶和微信的自動續(xù)費(fèi)項(xiàng)目,一鍵關(guān)閉自動續(xù)費(fèi)。
在大會上,中國工程院院士鄔賀銓指出,端側(cè)大模型與智能體的結(jié)合將引發(fā)通信終端模式的深刻變革。首先,終端形態(tài)將多樣化,涵蓋手機(jī)、PC、可穿戴設(shè)備、傳感器、機(jī)器人和網(wǎng)聯(lián)車等多種形式。其次,終端功能將智能化,從傳統(tǒng)的智能終端發(fā)展為具備AI能力的智能體,支持離線使用。此外,人機(jī)交互方式將變得多模化,涵蓋自然語言、觸摸、手勢等,APP的獨(dú)立性將被削弱,轉(zhuǎn)而作為系統(tǒng)的服務(wù)工具。
鄔賀銓強(qiáng)調(diào),這一變革將對網(wǎng)絡(luò)技術(shù)產(chǎn)生重大影響,包括對上行能力的提升和云邊端協(xié)同的需求。隨著5G技術(shù)的普及,需采用大上行技術(shù)以適應(yīng)更高的帶寬需求。同時,云與端之間需要實(shí)現(xiàn)低時延、高可靠的傳輸,以支持模型參數(shù)的高效上傳與更新。
中國信通院泰爾實(shí)驗(yàn)室副主任果敢表示,新一代智能終端呈現(xiàn)出新交互、新應(yīng)用、新服務(wù)、新場景“四新”特征。新交互從“單一模態(tài)交互”走向“多模態(tài)交互”,新應(yīng)用衍生出應(yīng)用+AI、AI原生應(yīng)用兩類代表性應(yīng)用,新服務(wù)由“以用戶指令為驅(qū)動”轉(zhuǎn)變?yōu)椤耙杂脩粢鈭D為導(dǎo)向”,新場景從“萬物互聯(lián)”進(jìn)入“萬物智聯(lián)”。果敢強(qiáng)調(diào),AI重構(gòu)操作系統(tǒng)是未來趨勢,生成式AI能力與操作系統(tǒng)融合將是下一階段重點(diǎn)。
智能網(wǎng)聯(lián)汽車開啟下半場競爭
隨著特斯拉在智能駕駛系統(tǒng)中率先開啟“端到端大模型”架構(gòu)演進(jìn),2024年“端到端大模型”成為幾乎所有汽車廠商和自動駕駛解決方案提供商探索的焦點(diǎn),蔚小理等主機(jī)廠以及華為、Momenta、商湯、元戎等供應(yīng)商均在積極跟進(jìn)。
對此,中國信通院技術(shù)與標(biāo)準(zhǔn)研究所主任葛雨明認(rèn)為:“本質(zhì)上來講是自動駕駛研發(fā)由規(guī)則驅(qū)動向數(shù)據(jù)驅(qū)動的一次技術(shù)變革,但同時也對高質(zhì)量數(shù)據(jù)和智算能力提出了更高需求。盡管企業(yè)對“端到端”研發(fā)范式形成共識,但在感知硬件選擇方面,仍然存在“激光、毫米波雷達(dá)、視覺等多傳感器融合”和“純視覺”兩種不同方案,一方面是考慮保障環(huán)境感知的可靠性和穩(wěn)定性,另一方面是延續(xù)且充分利用既有車型數(shù)據(jù),基于各自在算法、算力等方面的研究和基礎(chǔ)資源。”
“在大力突破單車智能的基礎(chǔ)上,要更好發(fā)揮網(wǎng)聯(lián)賦能作用! 葛雨明指出。截至2024年10月底,我國路側(cè)通信基礎(chǔ)設(shè)施(RSU)部署超過11000臺,5G基站總數(shù)達(dá)414.1萬個,依托車聯(lián)網(wǎng)的通信連接能力,不僅可以將路端、云端等外界感知信息補(bǔ)充給車輛,還可將路端、云端的計(jì)算等資源用于單車業(yè)務(wù)需求,在自動駕駛算法訓(xùn)練、拓展自動駕駛功能運(yùn)行范圍、自動駕駛技術(shù)演進(jìn)等方面發(fā)揮著必不可少的支撐和賦能作用。
葛雨明主任表示,汽車產(chǎn)業(yè)已經(jīng)進(jìn)入到了智能網(wǎng)聯(lián)競爭的下半場。智能網(wǎng)聯(lián)汽車與信息通信、交通運(yùn)輸?shù)刃袠I(yè)的深度融合是必然趨勢。我國智能網(wǎng)聯(lián)新能源汽車發(fā)展勢頭強(qiáng)勁,用戶側(cè)和數(shù)據(jù)側(cè)的智能化水平不斷提升。葛雨明強(qiáng)調(diào),加快汽車智能網(wǎng)聯(lián)應(yīng)用的基礎(chǔ)設(shè)施建設(shè)至關(guān)重要,需要政策法規(guī)、標(biāo)準(zhǔn)規(guī)范、基礎(chǔ)資源的共同謀劃布局。
人工智能為實(shí)現(xiàn)通用機(jī)器人打開大門
近兩年來,產(chǎn)業(yè)界對機(jī)器人的關(guān)注熱度高漲,具身智能和人形機(jī)器人這兩個詞匯出現(xiàn)的頻率很高。谷歌、特斯拉、OpenAI等國外頭部科技企業(yè),以及國內(nèi)企業(yè)銀河通用、智元、小米、小鵬等都在積極布局人形機(jī)器人。
人形機(jī)器人需要具備高度的自主性和智能性,能夠識別環(huán)境、理解指令、規(guī)劃行動,并在執(zhí)行任務(wù)時做出合理的決策。而人工智能技術(shù)的發(fā)展,正是實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵。
中國信通院副總工程師許志遠(yuǎn)認(rèn)為,人工智能技術(shù)突破性發(fā)展,為實(shí)現(xiàn)通用機(jī)器人打開了大門,其核心是增強(qiáng)了機(jī)器人的認(rèn)知與交互能力,并賦予機(jī)器人在物理世界中執(zhí)行任務(wù)的強(qiáng)大泛化能力。
“人形機(jī)器人仍然不夠成熟!痹S志遠(yuǎn)指出,硬件方面,頭部公司的人形機(jī)器人產(chǎn)品除手部以外,全身只有50多個自由度,如果在復(fù)雜的環(huán)境中行走需要更強(qiáng)大的運(yùn)動控制能力。除硬件以外,軟件其實(shí)是機(jī)器人落地的更大挑戰(zhàn)。大模型的本質(zhì)是數(shù)據(jù)驅(qū)動,只有基于龐大的數(shù)據(jù)量來訓(xùn)練,才能實(shí)現(xiàn)智能的涌現(xiàn)。而機(jī)器人大模型與這兩年成熟的大語言模型不一樣,語言模型的數(shù)據(jù)可以來自龐大的互聯(lián)網(wǎng),機(jī)器人還需要物理世界中高精度操作數(shù)據(jù),這些數(shù)據(jù)是互聯(lián)網(wǎng)沒有的。只有解決了這些問題,機(jī)器人才能大規(guī)模走入我們的生活。