首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車(chē)|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|大數(shù)據(jù)|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 移動(dòng)互聯(lián)網(wǎng) >> 正文

Skywork Deep Research Agent重磅升級(jí)!帶來(lái)更多模態(tài)、更高質(zhì)量和更高效的體驗(yàn)

2025年8月14日 11:48  CCTIME飛象網(wǎng)  

8月11日,昆侖萬(wàn)維SkyWork AI技術(shù)發(fā)布周正式啟動(dòng)。8月11日至8月15日,我們每天發(fā)布一款新模型,連續(xù)五天,覆蓋多模態(tài)AI核心場(chǎng)景的前沿模型。截至目前,我們已經(jīng)發(fā)布SkyReels-A3、Matrix-Game 2.0、Matrix-3D、Skywork UniPic 2.0模型。

8月14日,昆侖萬(wàn)維正式發(fā)布Skywork Deep Research Agent v2,它是天工超級(jí)智能體(Skywork Super Agents)的核心引擎。

Skywork Deep Research Agent自5月22日上線后,大幅重塑了大模型在AI Office領(lǐng)域的角色,通過(guò)skywork.ai平為用戶產(chǎn)出了大量信息密度極高的優(yōu)質(zhì)文檔、PPT、表格以及其他交付物。新一版本的Skywork Deep Research Agent v2將帶來(lái)以下體驗(yàn)的提升。

歡迎全球用戶注冊(cè)使用skywork.ai:

-全球官網(wǎng):https://skywork.ai 

-中國(guó)官網(wǎng):https://tiangong.cn

1推出“多模態(tài)深度調(diào)研”Agent,首次整合多模態(tài)檢索、理解和生成

當(dāng)前業(yè)界的Deep Research Agent產(chǎn)品都是采用搜索并抓取網(wǎng)頁(yè)文字信息的方式實(shí)現(xiàn),依賴于純文本檢索分析,而互聯(lián)網(wǎng)上超過(guò)一半的關(guān)鍵信息來(lái)自圖文混排:財(cái)報(bào)中的曲線、論文里的實(shí)驗(yàn)圖、社媒上的對(duì)比照、方案里的流程圖……

這些多模態(tài)信息一旦被忽略,代表著Agent將會(huì)丟失大量決策依據(jù),將直接影響Agent產(chǎn)出的交付物質(zhì)量。為解決這一痛點(diǎn),昆侖萬(wàn)維Skywork團(tuán)隊(duì)推出了業(yè)界首個(gè)“多模態(tài)深度調(diào)研”Agent,首次將多模態(tài)檢索理解和跨模態(tài)生成能力完整整合到深度研究工作里。

該功能已在skywork.ai(https://skywork.ai)上線,歡迎全球用戶使用體驗(yàn)。

為實(shí)現(xiàn)多模態(tài)信息檢索這一能力的提升,昆侖萬(wàn)維Skywork團(tuán)隊(duì)在以下四個(gè)方面完成技術(shù)突破:多模態(tài)爬取技術(shù)MM-Crawler、長(zhǎng)距離多模態(tài)信息收集、異步并行 Multi-Agent 多模態(tài)理解架構(gòu)和多模態(tài)結(jié)果呈現(xiàn)能力。

通過(guò)以上技術(shù)創(chuàng)新,多模態(tài)Skywork Deep Research Agent v2把“讀文字+看圖片”這件看似簡(jiǎn)單卻長(zhǎng)期被忽視的事情真正做到位,讓研究人員等用戶一次拿到信息完整、節(jié)奏順暢、視覺(jué)友好的深度報(bào)告。

例如下圖(綠色箭頭處)所示,天工超級(jí)智能體(Skywork Super Agents)在檢索信息的過(guò)程中,會(huì)自動(dòng)瀏覽并分析理解重要的圖片。

在對(duì)圖片做了收集和理解之后,天工超級(jí)智能體(Skywork Super Agents)在生成文檔時(shí),會(huì)充分利用圖片中的信息,Agent會(huì)在恰當(dāng)?shù)奈恢弥苯訉⒏哔|(zhì)量圖片作為交付物中的配圖(下圖綠色箭頭處),更直接地傳達(dá)信息并顯著降低讀者的理解成本:

Agent也可能對(duì)圖片信息進(jìn)行整合加工,以流暢的方式變成文字或者新的圖表(下圖綠色箭頭處):

2 推出“多模態(tài)深度瀏覽器智能體”,重塑社媒內(nèi)容分析與數(shù)據(jù)洞察

為實(shí)現(xiàn)傳統(tǒng)瀏覽器所不具備的低延遲、高回復(fù)率、任務(wù)完成度高、決策靈活等功能,昆侖萬(wàn)維多模態(tài)深度瀏覽器智能體(Skywork Browser Agent)進(jìn)行了多項(xiàng)關(guān)鍵自研技術(shù)優(yōu)化,包括升級(jí)DOM+ 視覺(jué)推理方案、主流平臺(tái)專項(xiàng)適配、并行搜索(Parallel Search)、多動(dòng)作規(guī)劃?rùn)C(jī)制(Multi-Action)、智能篩、人機(jī)無(wú)縫接管與隱私保護(hù)和安全承諾等。

當(dāng)前,多模態(tài)深度瀏覽器智能體(Skywork Browser Agent),能夠模擬人類(lèi)瀏覽與交互方式,革新傳統(tǒng)數(shù)據(jù)采集與分析模式。該智能體可精準(zhǔn)高效地完成智能搜索、多模態(tài)信息分析與社區(qū)內(nèi)容洞察,有效解決傳統(tǒng)瀏覽器智能體的多項(xiàng)痛點(diǎn),充分展示了天工智能體在長(zhǎng)周期任務(wù)(Long-horizon Task)與VLA(Vision-Language Action)任務(wù)中的巨大潛力。

Skywork Browser Agent已經(jīng)進(jìn)入內(nèi)測(cè)和邀測(cè)階段,預(yù)期將于近期面向全部skywork.ai用戶開(kāi)放。

多模態(tài)深度瀏覽器智能體(Skywork Browser Agent)具備以下核心功能亮點(diǎn):

1. 深度多模態(tài)內(nèi)容理解: 不再局限于文本,能夠深入分析社交媒體(尤其是小紅書(shū)、推特以及Instagram等平臺(tái)),對(duì)帖子中的圖片、視頻內(nèi)容,以及評(píng)論區(qū)的情感與觀點(diǎn)進(jìn)行有效篩選和提取,提供更全面的信息洞察。

2. 自動(dòng)化數(shù)據(jù)分析與報(bào)告: 自動(dòng)對(duì)線上社區(qū)內(nèi)容進(jìn)行高效的數(shù)據(jù)分析,并將枯燥的調(diào)研分析工作,轉(zhuǎn)化為直觀、易懂的可視化報(bào)告。

3. 一鍵式網(wǎng)站部署: 可將抓取的關(guān)鍵圖片與分析內(nèi)容,一鍵生成并部署為獨(dú)立的網(wǎng)站,便于成果展示和團(tuán)隊(duì)分享。

4. 無(wú)縫融入工作流: 能夠與信息檢索智能體或者PPT、Doc等其他文檔智能體聯(lián)動(dòng)。當(dāng)用戶撰寫(xiě)報(bào)告時(shí),它可以巧妙地檢索并推薦相關(guān)的圖片素材,極大提升辦公效率。

3 加強(qiáng)深度信息搜索和復(fù)雜任務(wù)執(zhí)行能力,在多個(gè)任務(wù)測(cè)評(píng)集上取得SOTA

為了進(jìn)一步加強(qiáng)Agent基礎(chǔ)模型的復(fù)雜任務(wù)執(zhí)行和信息檢索、整理、總結(jié)能力,Skywork Deep Research Agent v2引入了多種提升機(jī)制,包括高質(zhì)量數(shù)據(jù)合成及訓(xùn)練、端到端強(qiáng)化學(xué)習(xí)、高效的并行推理,以及多智能體自我學(xué)習(xí)演進(jìn)系統(tǒng)。新版本的Skywork Deep Research在多項(xiàng)Agent任務(wù)評(píng)測(cè)上超越現(xiàn)有模型,達(dá)到行業(yè)SOTA水平。

在權(quán)威的搜索評(píng)測(cè)榜單BrowseComp上,Skywork Deep Research的表現(xiàn)尤為突出。常規(guī)模式下,其性能已超越大多數(shù)同類(lèi)產(chǎn)品,正確率達(dá)到27.8%。而一旦開(kāi)啟自主研發(fā)的“并行思考”(Parallel Thinking)模式,正確率更是躍升至38.7%,刷新了行業(yè)SOTA紀(jì)錄。

更值得一提的是,在并行思考模式下,Skywork Deep Research的正確率會(huì)隨著思考時(shí)間的增加而持續(xù)攀升,這充分展現(xiàn)了自研系統(tǒng)架構(gòu)的卓越潛力與強(qiáng)大擴(kuò)展性。

我們也開(kāi)通了API預(yù)覽使用功能,如需體驗(yàn)可訪問(wèn)Skywork官方Github鏈接進(jìn)行申請(qǐng)?zhí)峤?/STRONG>:

https://github.com/SkyworkAI/Skywork-DeepResearch。

另一方面,Skywork Deep Research Agent在GAIA Test基準(zhǔn)上同樣取得了SOTA表現(xiàn),充分驗(yàn)證了其在復(fù)雜任務(wù)中的綜合實(shí)力。

Skywork Deep Research Agent v2即將在skywork.ai的各種Deep Research場(chǎng)景中全量上線。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
中國(guó)電信柯瑞文:星辰智惠 共治共享
精彩視頻
機(jī)器人也太會(huì)整活了!跟隨中國(guó)聯(lián)通,打卡國(guó)家速滑館“冰絲帶”
華為史振鈺:智能體從辦公走向生產(chǎn),AI成為生產(chǎn)力
俄羅斯工程院外籍院士孫立寧:構(gòu)建具身智能的免疫系統(tǒng),從安全服務(wù)到人機(jī)共生的新范式
廣汽副總經(jīng)理閤先慶:安全是智能網(wǎng)聯(lián)汽車(chē)的基石
精彩專題
2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議
2025中國(guó)聯(lián)通合作伙伴大會(huì)
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會(huì)
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像