人工智能(AI)近兩年的發(fā)展具有“大”和“多”的鮮明特征,大模型的參數(shù)規(guī)模越來越大,文圖視等方面的多模態(tài)能力也越來越強。2025年,它又將如何進化?
從全球業(yè)界發(fā)展趨勢看,AI將具備更強的推理能力,各形態(tài)智能體會更加普及,同時也會有“規(guī)模定律”受考驗等更多挑戰(zhàn)浮現(xiàn)。
大模型應用更廣,推理能力更強大
2024年,各家大模型不再簡單競爭參數(shù)規(guī)模,而是將兼具文字圖片視頻等不同能力的多模態(tài)作為重要發(fā)力點。美國開放人工智能研究中心(OpenAI)的文生視頻大模型Sora在2024年2月面世就驚艷世界,正式版已于12月向用戶開放。
美國谷歌公司近期發(fā)布的《2025年AI商業(yè)趨勢報告》預測,2025年多模態(tài)AI將成為企業(yè)采用AI的主要驅(qū)動力,助力改善客戶體驗,提高運營效率,開發(fā)新的商業(yè)模式。例如,多模態(tài)AI將廣泛用于醫(yī)療領(lǐng)域,通過分析醫(yī)療記錄、成像數(shù)據(jù)、基因組信息等推進個性化醫(yī)療;在零售、金融服務、制造業(yè)等領(lǐng)域的應用也將不斷擴展。有專家認為,通用人工智能正漸行漸近。
AI的邏輯推理能力在提升。OpenAI在2024年9月發(fā)布推理模型o1,并在12月迅速升級到o3版本,新模型在數(shù)學、編程、博士級科學問答等復雜問題上,表現(xiàn)出超越部分人類專家的水平。谷歌也在12月發(fā)布其最新推理模型“雙子座2.0閃電思維”,專注于解決編程、數(shù)學及物理等領(lǐng)域的難題。
美國“元”公司最近推出了與傳統(tǒng)大型語言模型不同的大型概念模型,它可以在更高的語義層級——“概念”上進行思考。這種方法能夠更好地捕捉文本的整體語義結(jié)構(gòu),使模型能在更高的抽象層面進行推理。
這些具備高級推理能力的模型在科學研究中潛力巨大。2024年諾貝爾物理學獎頒給機器學習先驅(qū)、化學獎頒給能預測蛋白質(zhì)結(jié)構(gòu)的AI開發(fā)者,凸顯人工智能推動科研的巨大貢獻。業(yè)界普遍認為,AI將在2025年加速科技突破,有望在可持續(xù)材料、藥物發(fā)現(xiàn)和人類健康等方面展現(xiàn)出新的能力。
智能體將更普及,具身智能受期待
智能體的出現(xiàn)頻率將越來越高。智能體指使用AI技術(shù),能夠自主感知環(huán)境、作出決策并執(zhí)行行動的智能實體。北京智譜華章科技有限公司人工智能專家劉瀟說,如果把大模型比作一名學到很多知識、尚未進入社會實踐的學生,智能體則像個畢業(yè)生,即將學以致用,在社會中發(fā)揮自己的價值。
智能體可以是一個程序。2024年11月底,在智譜AI開放日上最新“出爐”的智能體已經(jīng)可以替用戶點外賣。只要說出需求,它就像一個能理解、會幫忙的小助手,可在無人工干預條件下完成跨應用程序、多步驟的真實任務。
業(yè)界普遍認為,這種智能體2025年將變得更加普及,且能處理更復雜的任務,將人類從一些重復且瑣碎的工作中解放出來。德勤公司發(fā)布的《2025年技術(shù)趨勢》報告預測,智能體很快將能支持供應鏈經(jīng)理、軟件開發(fā)人員、金融分析師等人員的工作。
智能體還可結(jié)合物理實體,形成“具身智能”,如自動駕駛汽車、具身智能機器人等。美國國際數(shù)據(jù)公司負責人工智能領(lǐng)域的高管麗圖·喬蒂認為,智能體未來有望全面革新自動駕駛領(lǐng)域。美國特斯拉公司研發(fā)的人形機器人“擎天柱”已可在工廠行走、分揀電池,還能以接近人類的靈活度用單手穩(wěn)穩(wěn)接住迎面拋來的網(wǎng)球,有望在2025年實現(xiàn)小批量生產(chǎn)并投入使用。
“規(guī)模定律”受考驗,多重挑戰(zhàn)需應對
大模型過去一段時間的快速發(fā)展符合“規(guī)模定律”,即大模型的性能隨著模型參數(shù)、訓練數(shù)據(jù)量和計算量的增加而線性提高。但近來不斷有跡象顯示,由于訓練數(shù)據(jù)即將耗盡、更大規(guī)模訓練的能耗和成本激增等因素,“規(guī)模定律”可能難以延續(xù)。
因此有研究者提出“密度定律”,指AI模型的能力密度隨時間呈指數(shù)級增長。北京面壁智能科技有限責任公司聯(lián)合創(chuàng)始人兼執(zhí)行總裁李大海說,現(xiàn)在越來越多的企業(yè)更注重AI算法的調(diào)優(yōu),同樣的模型能力可被放到一個更小的參數(shù)規(guī)模里,表明模型的能力密度不斷增強!盁挻竽P,不如煉優(yōu)模型”。
微軟開發(fā)的Phi模型等一系列小模型已顯示,管理較小但高質(zhì)量的數(shù)據(jù)集可以提高模型的性能和推理能力。中國深度求索公司2024年12月底發(fā)布混合專家模型DeepSeek-V3。測試結(jié)果顯示,與某些性能相當?shù)膰H知名大模型相比,成本低了一個數(shù)量級。業(yè)內(nèi)人士預測,小模型的吸引力可能在2025年大幅增高。
發(fā)展AI的能源挑戰(zhàn)也備受關(guān)注。由于訓練最新的大模型耗能巨大,微軟、谷歌、亞馬遜等科技巨頭已將目光瞄向核能。
AI的快速發(fā)展還伴隨著安全、治理、版權(quán)、倫理等方面的新風險。例如多模態(tài)功能的拓展,使虛假信息的內(nèi)容形態(tài)更加多元,也更難被普通人所辨別;智能體自主性的提高,會帶來其目標與人類意圖不一致或產(chǎn)生意外行為的風險。
為應對這些風險和挑戰(zhàn),全球多國已從政策法規(guī)、技術(shù)標準、行業(yè)自律等多個維度加強AI治理。2025年,國際社會將舉辦人工智能行動峰會等多場相關(guān)活動,共議AI發(fā)展前景與規(guī)范。