必讀視頻專題飛象趣談光通信人工智能低空經濟5G手機智能汽車智慧城市會展特約記者

中國信通院云計算與大數據研究所何寶宏:面向AI,數據技術體系正朝著“數智融合”方向演進

2025年12月13日 17:25CCTIME飛象網

飛象網訊  12月13日,在“2026中國信通院深度觀察報告會”上,中國信息通信研究院云計算與大數據研究所所長何寶宏就面向AI的數據發(fā)展分享了自身思考和見解。

數據的規(guī)模、質量決定大模型的上限

談及在AI大模型發(fā)展中,數據扮演的角色,何寶宏分別從AI和數據的發(fā)展兩個角度進行了解答。他表示,早期的人工智能是基于規(guī)則,和數據關系不大;而這一波以大模型為代表的人工智能,數據扮演著非常核心的角色。

從數據的角度來看,大數據上一波的核心驅動主要是推薦算法,典型的應用包括一些用戶畫像,風險控制、市場獲客等;而這一波數據的熱潮主要是以人工智能驅動,可以說數據在這一波人工智能大模型的發(fā)展中,起著非常核心的作用!皵祿囊(guī)模、數據的質量決定著大模型的上限,所以能看到數據是重中之重!

人工智能發(fā)展對數據提出新的需求和挑戰(zhàn)

2025年以來,人工智能的發(fā)展呈現出一些新特征,對數據也提出了一些新需求。比如語言大模型,它的邊際效應遞減已經非常明顯,所以語言大模型要進一步提高它的能力,就需要更高質量的數據。另外一方面,除了語言大模型,越來越多的關注點開始轉向了多模態(tài),無論是對語言大模型的持續(xù)優(yōu)化,還是對多模態(tài)模型等數據都提出了一些新的需求、新的挑戰(zhàn)。

何寶宏指出,為了進一步提高語言大模型的能力,就需要發(fā)展更高質量、覆蓋范圍更廣的數據。為了提升語言大模型推理能力,圍繞推理甚至應用如Agent等,需要結合場景和應用等一些私域的、行業(yè)的、專有的數據。對于多模態(tài)大模型的發(fā)展來說,就不能僅僅只有文字類,還需要音頻、視頻等,這些數據如何對齊,在數據發(fā)展中也提出新的需求和挑戰(zhàn)。

數據技術正以體系化的方式發(fā)生巨大變革

在何寶宏看來,為應對這些新需求、新挑戰(zhàn),數據技術正以體系化的方式發(fā)生巨大變革。

具體來看,一方面,現有數據體系需面向人工智能進行定制化轉型與適配。以數據治理為例,以往通用的治理模式,如今需結合人工智能的專用場景進行調整優(yōu)化;即便是已有的DataOps體系,也需要衍生出面向AI的專屬分支(DataOps For AI),重點推進數據安全治理等相關工作,本質上是現有數據領域工作向AI適配的轉型。

另一方面,人工智能的發(fā)展也催生了數據領域的新情況、新問題,這是以往未曾出現的。當前這一波人工智能以生成式AI為核心,其生成的結果本身也屬于數據范疇。隨著近年來生成式AI的快速迭代,如今的數據格局已發(fā)生改變——人類產生的數據、傳統(tǒng)互聯(lián)網數據與AI合成/生成的數據日益交融,難以精準區(qū)分。后續(xù),如何應對AI合成數據帶來的挑戰(zhàn),尤其是如何規(guī)范AI合成數據在模型訓練與迭代中的應用,已成為數據領域亟待解決的新課題。

何寶宏進一步講到:“除了數據資源層面的變化,數據技術層面也需同步迭代升級。”受上述數據資源體系變革的驅動,數據技術正迎來一系列新調整:在數據存算領域,宏觀層面上存算架構逐步向分布式、存算分離的方向發(fā)展,而面向本地或就近數據處理的需求,近存計算模式也愈發(fā)重要;同時,由于數據體量激增,需根據數據“溫度”(熱數據、溫數據、冷數據)進行分級存儲,對應的存儲介質也需隨之優(yōu)化。在數據庫技術領域,人工智能的發(fā)展同樣提出了新要求——隨著AI向多模態(tài)方向演進,傳統(tǒng)單模態(tài)數據庫已顯現出效率偏低、成本偏高的問題,因此向量數據庫、多模態(tài)數據庫成為技術升級的重要方向。

最后,何寶宏強調,受人工智能技術發(fā)展的驅動,當前數據技術正經歷全方位的巨大變革,其核心目標是實現數智深度融合。

編 輯:高靖宇
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀

精彩視頻

精彩專題

關于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網 CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經書面許可,禁止轉載、摘編、復制、鏡像