每日微信報(bào)
人物專訪監(jiān)管
制造芯片
6G 運(yùn)營(yíng)
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

從DeepSeek“上新”看AI演進(jìn) 大模型將成“全能管家”？

2025年12月3日 08:55科技日?qǐng)?bào)

12月1日晚間，DeepSeek一口氣發(fā)布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale兩個(gè)正式版模型。

《科創(chuàng)板日?qǐng)?bào)》記者注意到，此次新發(fā)布的DeepSeek-V3.2系列模型，主要強(qiáng)在推理能力的提升。

在Benchmark推理測(cè)試中，V3.2與GPT5、Claude  4.5在不同領(lǐng)域各有高低，只有Gemini 3 Pro對(duì)比前三者均有較明顯優(yōu)勢(shì)。

而與月之暗面新發(fā)布的Kimi-K2-Thinking相比，V3.2的輸出長(zhǎng)度大幅降低，顯著減少了計(jì)算開銷與用戶等待時(shí)間。

對(duì)于這次DeepSeek新模型的發(fā)布，IDC中國(guó)研究總監(jiān)盧言霞向《科創(chuàng)板日?qǐng)?bào)》記者認(rèn)為，其將推理能力融入到既有大模型，使得大語言模型、多模態(tài)大模型本身就具備推理能力，這也是未來的發(fā)展方向，會(huì)讓模型推理更快，以解決之前純推理模型速度慢的問題。

快思慢想研究院院長(zhǎng)、特邀評(píng)論員田豐則向《科創(chuàng)板日?qǐng)?bào)》記者稱， DeepSeek新模型降低了推理成本，通過稀疏注意力機(jī)制，使128K長(zhǎng)上下文推理成本降低數(shù)倍，內(nèi)存占用減少70%。

與此同時(shí)，DeepSeek作為開源模型在某些領(lǐng)域?qū)崿F(xiàn)對(duì)閉源模型的反超，通過RL強(qiáng)化學(xué)習(xí)投入超過預(yù)訓(xùn)練投入，以規(guī)�；度霃�(qiáng)化學(xué)習(xí)創(chuàng)新路徑，直接推動(dòng)模型在數(shù)學(xué)推理（IMO金牌）、編程（ICPC世界第二）等硬核任務(wù)中達(dá)到GPT-5水平。

此外，DeepSeek V3.2模型從“工具調(diào)用”邁向“思考型智能體”，實(shí)現(xiàn)“文武兼優(yōu)”。V3.2版本引入“思考保留”模式，支持將工具調(diào)用嵌入完整的推理鏈條中，從而有效規(guī)避傳統(tǒng)智能體常見的“記憶斷裂”問題。比如，面對(duì)多步驟復(fù)雜任務(wù)時(shí)，模型能夠基于歷史工具執(zhí)行結(jié)果持續(xù)優(yōu)化決策，而無需重啟推理流程。

技術(shù)報(bào)告顯示，在智能體評(píng)測(cè)中，V3.2得分高于同為開源的Kimi-K2-Thinking和MiniMax M2。

不過， DeepSeek也承認(rèn)，與Gemini3 Pro等前沿閉源模型相比，自家模型仍存在一定的局限性。首先，V3.2的世界知識(shí)廣度仍落后于領(lǐng)先的專有模型，其次在令牌（Token）效率方面，V3.2通常需要更多的令牌才能達(dá)到像Gemini3 Pro這樣的模型輸出質(zhì)量。在解決復(fù)雜任務(wù)方面也不如前沿模型。

DeepSeek方面稱，團(tuán)隊(duì)計(jì)劃在未來通過增加預(yù)訓(xùn)練計(jì)算量來填補(bǔ)知識(shí)空白，并專注于優(yōu)化模型推理鏈的智能密度以提高效率，進(jìn)一步改進(jìn)基礎(chǔ)模型和訓(xùn)練后方案。

一位AI智能體業(yè)內(nèi)人士在實(shí)測(cè)后向《科創(chuàng)板日?qǐng)?bào)》記者表示，DeepSeek的多智能體效果優(yōu)于國(guó)內(nèi)其他模型，而低于谷歌Gemini。

對(duì)于DeepSeek近期的新模型都在發(fā)力智能體，盧言霞認(rèn)為，未來的大模型就是智能體平臺(tái)，這是必然趨勢(shì)。

“大模型衍生出來的智能體，將首先在部分垂直應(yīng)用場(chǎng)景落地。然而，要構(gòu)建系統(tǒng)級(jí)的智能體，仍要克服數(shù)據(jù)、硬件、知識(shí)融合與外部生態(tài)協(xié)同等多重挑戰(zhàn)。展望未來，專用的智能體開發(fā)平臺(tái)將應(yīng)運(yùn)而生。一個(gè)明確的趨勢(shì)是，基礎(chǔ)大模型能力將越來越延伸，進(jìn)化為可自主行動(dòng)的智能體�！�

從智能體的發(fā)展方向上來看，田豐表示，目前在深度思考、調(diào)用工具兩類發(fā)展方向上漸趨融合，同時(shí)解決長(zhǎng)記憶能力、復(fù)雜任務(wù)規(guī)劃能力。

此外，服務(wù)執(zhí)行正在取代信息搜索。田豐表示，初級(jí)智能體只能查詢信息、缺少執(zhí)行能力，而以千問app、豆包AI、 DeepSeek等為代表的智能體，則能將購(gòu)物、支付、物流、社交、娛樂等綜合O2O服務(wù)融為一體，即是百事通，又是“全能管家”。

田豐還看好智能體解決行業(yè)專有問題。“法律、財(cái)會(huì)、醫(yī)療、制造、能源、政務(wù)、教育等智能體將成為剛需，萬金油不如一招鮮，用戶會(huì)對(duì)解決工作生活剛需的專用智能體更有興趣，通過通用智能體調(diào)用專用智能體也成為一籃子協(xié)同模式�！�

編輯：高靖宇

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載，請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題，請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。