國家數(shù)據(jù)局正式掛牌后的首次會議為今年數(shù)據(jù)工作“劃重點”。近日,國家數(shù)據(jù)局在北京召開全國數(shù)據(jù)工作會議,會議部署2024年重點工作時提及,加快全國一體化算力網(wǎng)建設。
聚焦今年數(shù)據(jù)工作,會議要求著力健全基礎制度、釋放要素潛能、加快轉(zhuǎn)型賦能、促進科技創(chuàng)新、完善基礎設施、強化安全保障、推進國際合作、抓好試點試驗。在健全數(shù)據(jù)基礎制度方面,建立健全數(shù)據(jù)產(chǎn)權(quán)制度,制定促進數(shù)據(jù)合規(guī)高效流通和交易的政策,建立數(shù)據(jù)要素收益分配機制,健全數(shù)據(jù)流通利用安全治理機制。在提升數(shù)據(jù)資源開發(fā)利用水平方面,發(fā)揮公共數(shù)據(jù)資源開發(fā)利用的示范效應,持續(xù)探索企業(yè)數(shù)據(jù)、個人數(shù)據(jù)開發(fā)利用新路徑,全力推動“數(shù)據(jù)要素×”行動,著力繁榮數(shù)據(jù)開發(fā)利用生態(tài)。
會議還提出,加快全國一體化算力網(wǎng)和數(shù)據(jù)流通基礎設施建設,發(fā)揮好政府投資的放大效應。統(tǒng)籌做好數(shù)字經(jīng)濟領域國際合作,完善國際數(shù)字治理“中國方案”,持續(xù)優(yōu)化數(shù)據(jù)跨境流動規(guī)則。
供得出、流得動、用得好
交通、教育、氣象等領域都產(chǎn)生公共數(shù)據(jù)。國家數(shù)據(jù)局相關負責人表示,這類數(shù)據(jù)基礎好、質(zhì)量高、管理相對規(guī)范,要讓這些數(shù)據(jù)“供得出、流得動、用得好”。
國家數(shù)據(jù)局最新表示,支持各地區(qū)各部門加快公共數(shù)據(jù)開發(fā)開放力度,要一體化推進公共數(shù)據(jù)共享、開放和授權(quán)使用,平衡好公益性和市場化的關系,推動用于公共治理、公益事業(yè)的公共數(shù)據(jù)產(chǎn)品和服務有條件無償使用,探索用于產(chǎn)業(yè)發(fā)展、行業(yè)發(fā)展的公共數(shù)據(jù)經(jīng)營性產(chǎn)品和服務,確需收費的,實行有條件有償使用。
國家數(shù)據(jù)局將明確公共數(shù)據(jù)授權(quán)運營的合規(guī)政策和管理要求,激發(fā)數(shù)據(jù)供給動力和市場創(chuàng)新活力。
探索建設國家級數(shù)據(jù)標注基地
國家數(shù)據(jù)局在會上最新透露,接下來,將開展數(shù)據(jù)標注基地試點。
會上明確,探索建設國家級數(shù)據(jù)標注基地,充分發(fā)揮地方配套支撐作用,在數(shù)據(jù)標注產(chǎn)業(yè)的生態(tài)構(gòu)建、能力提升和場景應用等方面先行先試,集聚龍頭企業(yè),促進區(qū)域人工智能產(chǎn)業(yè)生態(tài)發(fā)展。
另外,國家數(shù)據(jù)局將開展深化數(shù)字經(jīng)濟創(chuàng)新發(fā)展試驗區(qū)、數(shù)據(jù)要素綜合試驗區(qū)、數(shù)據(jù)基礎制度試點、數(shù)據(jù)資源開發(fā)利用試點、數(shù)據(jù)基礎設施建設試點等一系列試點試驗工作。
業(yè)內(nèi)人士表示,當前數(shù)據(jù)標注需求大幅增長。
據(jù)悉,數(shù)據(jù)標注,即對文本、圖像、語音、視頻等待標注數(shù)據(jù)進行歸類、整理、編輯、糾錯、標記和批注等操作。在當前的人工智能大模型時代,數(shù)據(jù)的質(zhì)量會影響大模型的“智商”!胺墙Y(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù),必須經(jīng)過上述清洗與標注處理,才能變成機器可理解、可學習的數(shù)據(jù)。因此數(shù)據(jù)標注是構(gòu)建人工智能模型的數(shù)據(jù)準備和預處理工作中不可或缺的一環(huán)。以對象作為分類標準,數(shù)據(jù)標注可以分為圖像標注、語音標注、文本標注以及視頻標注。”業(yè)內(nèi)人士表示。
根據(jù)Grand View Research的報告,2022年全球數(shù)據(jù)收集和標注市場規(guī)模為22.2億美元,預計從2023年到2030年將以28.9%的復合年增長率增長。2022年全球數(shù)據(jù)標注解決方案和服務市場規(guī)模為118.3億美元,預計從2023年到2030年的復合年增長率為21.3%。
值得注意的是,隨著大模型的海量訓練數(shù)據(jù)催生出巨大的數(shù)據(jù)標注需求,數(shù)據(jù)標注也將催生新的工作機會。
加快建設全國一體化算力網(wǎng)
算力是支撐數(shù)字經(jīng)濟發(fā)展的關鍵基礎設施。推進數(shù)據(jù)要素市場化配置改革,是當前數(shù)據(jù)工作的主線。在這當中,加快全國一體化算力網(wǎng)建設是重點任務之一。
機構(gòu)預測,未來幾年,我國算力需求增速可能高達每年30%以上。針對算力供給不足、資源分布不均等問題,國家數(shù)據(jù)局表示,正著眼于通用算力、智能算力、超級算力一體化布局,東中西部算力一體化協(xié)同,算力與數(shù)據(jù)、算法一體化應用,算力與綠色電力一體化融合,算力發(fā)展與安全保障一體化推進等,積極推動全國一體化算力網(wǎng)建設。
此前,國家數(shù)據(jù)局發(fā)布數(shù)據(jù)顯示,截至2023年底,全國在用數(shù)據(jù)中心機架總規(guī)模超過810萬標準機架,算力總規(guī)模達到230EFLOPS(EFLOPS指每秒進行1018次浮點運算),我國算力基礎設施建設取得顯著成效。
據(jù)悉,2023年12月,國家發(fā)展改革委、國家數(shù)據(jù)局等部門聯(lián)合印發(fā)的《關于深入實施“東數(shù)西算”工程加快構(gòu)建全國一體化算力網(wǎng)的實施意見》,在產(chǎn)業(yè)生態(tài)、算力供給、網(wǎng)絡傳輸、業(yè)務調(diào)度、系統(tǒng)運營、技術(shù)創(chuàng)新等方面部署,旨在建設聯(lián)網(wǎng)調(diào)度、普惠易用、綠色安全的全國一體化算力體系。
國家數(shù)據(jù)局黨組書記、局長劉烈宏表示,國家數(shù)據(jù)局將構(gòu)建高質(zhì)量的算力供給體系,根據(jù)國家戰(zhàn)略和經(jīng)濟發(fā)展需要,統(tǒng)籌全國一體化算力網(wǎng)建設布局。在“東數(shù)西算”與城市算力中心協(xié)同推進的過程中,面向風光水電等清潔能源豐富、區(qū)位優(yōu)勢突出、產(chǎn)業(yè)基礎較好的非國家樞紐節(jié)點地區(qū),有序推進建設本區(qū)域高效低碳、集約循環(huán)的綠色數(shù)據(jù)中心。在建立健全跨區(qū)域協(xié)同聯(lián)動機制方面,要構(gòu)建全國一體化算力網(wǎng),推動數(shù)據(jù)、算力、算法相關產(chǎn)業(yè)從東部向西部流動。
同時,提升“東數(shù)西算”網(wǎng)絡傳輸效能。國家數(shù)據(jù)局將會同相關部門,探索建立算力服務計費新模式,不斷降低用戶網(wǎng)絡使用費用,提升算力服務普惠易用水平。培育壯大算力產(chǎn)業(yè)生態(tài),以“東數(shù)西算”工程和全國一體化算力網(wǎng)建設為契機,探索新型產(chǎn)學研協(xié)作模式,構(gòu)建具有中國特色的算力網(wǎng)產(chǎn)業(yè)生態(tài)體系。
此外,國家數(shù)據(jù)局還將促進算電協(xié)同高效發(fā)展。加強數(shù)據(jù)中心綠色高質(zhì)量發(fā)展,探索將算力節(jié)點打造為能量流、數(shù)據(jù)流深度融合的數(shù)字能源生態(tài)系統(tǒng)。
中國科技體制改革研究會數(shù)字經(jīng)濟發(fā)展研究小組組長陳曉華表示,隨著“東數(shù)西算”工程推進,將進一步提升信息產(chǎn)業(yè)鏈協(xié)同效率,支撐各地產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型升級。同時,這也是多地拉動經(jīng)濟增長,發(fā)展數(shù)字技術(shù)或數(shù)字科技的新引擎。