必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會展特約記者

從DeepSeek“上新”看AI演進(jìn) 大模型將成“全能管家”?

2025年12月3日 08:55科技日報(bào)

12月1日晚間,DeepSeek一口氣發(fā)布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale兩個(gè)正式版模型。

《科創(chuàng)板日報(bào)》記者注意到,此次新發(fā)布的DeepSeek-V3.2系列模型,主要強(qiáng)在推理能力的提升。

在Benchmark推理測試中,V3.2與GPT5、Claude  4.5在不同領(lǐng)域各有高低,只有Gemini 3 Pro對比前三者均有較明顯優(yōu)勢。

而與月之暗面新發(fā)布的Kimi-K2-Thinking相比,V3.2的輸出長度大幅降低,顯著減少了計(jì)算開銷與用戶等待時(shí)間。

對于這次DeepSeek新模型的發(fā)布,IDC中國研究總監(jiān)盧言霞向《科創(chuàng)板日報(bào)》記者認(rèn)為,其將推理能力融入到既有大模型,使得大語言模型、多模態(tài)大模型本身就具備推理能力,這也是未來的發(fā)展方向,會讓模型推理更快,以解決之前純推理模型速度慢的問題。

快思慢想研究院院長、特邀評論員田豐則向《科創(chuàng)板日報(bào)》記者稱, DeepSeek新模型降低了推理成本,通過稀疏注意力機(jī)制,使128K長上下文推理成本降低數(shù)倍,內(nèi)存占用減少70%。

與此同時(shí),DeepSeek作為開源模型在某些領(lǐng)域?qū)崿F(xiàn)對閉源模型的反超,通過RL強(qiáng)化學(xué)習(xí)投入超過預(yù)訓(xùn)練投入,以規(guī);度霃(qiáng)化學(xué)習(xí)創(chuàng)新路徑,直接推動模型在數(shù)學(xué)推理(IMO金牌)、編程(ICPC世界第二)等硬核任務(wù)中達(dá)到GPT-5水平。

此外,DeepSeek V3.2模型從“工具調(diào)用”邁向“思考型智能體”,實(shí)現(xiàn)“文武兼優(yōu)”。V3.2版本引入“思考保留”模式,支持將工具調(diào)用嵌入完整的推理鏈條中,從而有效規(guī)避傳統(tǒng)智能體常見的“記憶斷裂”問題。比如,面對多步驟復(fù)雜任務(wù)時(shí),模型能夠基于歷史工具執(zhí)行結(jié)果持續(xù)優(yōu)化決策,而無需重啟推理流程。

技術(shù)報(bào)告顯示,在智能體評測中,V3.2得分高于同為開源的Kimi-K2-Thinking和MiniMax M2。

不過, DeepSeek也承認(rèn),與Gemini3 Pro等前沿閉源模型相比,自家模型仍存在一定的局限性。首先,V3.2的世界知識廣度仍落后于領(lǐng)先的專有模型,其次在令牌(Token)效率方面,V3.2通常需要更多的令牌才能達(dá)到像Gemini3 Pro這樣的模型輸出質(zhì)量。在解決復(fù)雜任務(wù)方面也不如前沿模型。

DeepSeek方面稱,團(tuán)隊(duì)計(jì)劃在未來通過增加預(yù)訓(xùn)練計(jì)算量來填補(bǔ)知識空白,并專注于優(yōu)化模型推理鏈的智能密度以提高效率,進(jìn)一步改進(jìn)基礎(chǔ)模型和訓(xùn)練后方案。

一位AI智能體業(yè)內(nèi)人士在實(shí)測后向《科創(chuàng)板日報(bào)》記者表示,DeepSeek的多智能體效果優(yōu)于國內(nèi)其他模型,而低于谷歌Gemini。

對于DeepSeek近期的新模型都在發(fā)力智能體,盧言霞認(rèn)為,未來的大模型就是智能體平臺,這是必然趨勢。

“大模型衍生出來的智能體,將首先在部分垂直應(yīng)用場景落地。然而,要構(gòu)建系統(tǒng)級的智能體,仍要克服數(shù)據(jù)、硬件、知識融合與外部生態(tài)協(xié)同等多重挑戰(zhàn)。展望未來,專用的智能體開發(fā)平臺將應(yīng)運(yùn)而生。一個(gè)明確的趨勢是,基礎(chǔ)大模型能力將越來越延伸,進(jìn)化為可自主行動的智能體!

從智能體的發(fā)展方向上來看,田豐表示,目前在深度思考、調(diào)用工具兩類發(fā)展方向上漸趨融合,同時(shí)解決長記憶能力、復(fù)雜任務(wù)規(guī)劃能力。

此外,服務(wù)執(zhí)行正在取代信息搜索。田豐表示,初級智能體只能查詢信息、缺少執(zhí)行能力,而以千問app、豆包AI、 DeepSeek等為代表的智能體,則能將購物、支付、物流、社交、娛樂等綜合O2O服務(wù)融為一體,即是百事通,又是“全能管家”。

田豐還看好智能體解決行業(yè)專有問題。“法律、財(cái)會、醫(yī)療、制造、能源、政務(wù)、教育等智能體將成為剛需,萬金油不如一招鮮,用戶會對解決工作生活剛需的專用智能體更有興趣,通過通用智能體調(diào)用專用智能體也成為一籃子協(xié)同模式!

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像