123,123

本報記者張佳星

證件、人臉，掃描對比，綠燈亮，通過，在經(jīng)過高鐵安檢閘口的這一流程時，你也許會想：機器認識我。而實際上，并不是。

“當(dāng)前的人工智能（AI）識別做的只是比對，缺少信息進入大腦之后的‘加工、理解、思考’步驟，因此僅僅停留在‘感知’，而并非‘認知’�！�6月18日，紀念吳文俊誕辰一百周年活動的“認知智能行業(yè)應(yīng)用大會”舉行，中國人民大學(xué)高瓴人工智能學(xué)院執(zhí)行院長文繼榮表示，要讓AI有類似大腦的活動，走到認知階段，需要讓它掌握知識、進行推理。AI從“感知智能”走向“認知智能”的實踐目前在通用狀態(tài)下比較困難，但在一些諸如反洗錢、偵察等領(lǐng)域正在應(yīng)用。

AI“大腦”長成要先建知識庫

“現(xiàn)在的AI處于弱人工智能狀態(tài)，它沒有大腦，要讓它形成大腦，最核心的是要有‘知識’。”

微軟亞洲研究院前研究員、北京一覽群智數(shù)據(jù)科技有限責(zé)任公司首席執(zhí)行官胡健表示，如果現(xiàn)有的算法、模型是神經(jīng)或腦結(jié)構(gòu)，那么知識是大腦能夠運轉(zhuǎn)起來的原動力。

讓AI獲得知識的知識庫在業(yè)界稱為“知識圖譜”，它不僅要關(guān)注知識點還要關(guān)注知識點間的關(guān)聯(lián)。這些關(guān)聯(lián)將賦予AI聯(lián)想力�！疤岬剿�，它要反應(yīng)到密度、透明等多個性質(zhì)，還要和澆水、能喝的功能聯(lián)系起來，更高級的是計算出用多大力道去取水�！焙≌f。

知識圖譜的建立非常困難，人類海量的知識如何翻譯成機器的語言，并與之建立聯(lián)系，很成問題。尤其是之前這項工作一直是人工完成的，例如谷歌詞庫、百度百科、維基百科等都可以轉(zhuǎn)換為知識圖譜，但工作量大、內(nèi)容異常龐雜。

“關(guān)聯(lián)密度不足是另一個難以達到應(yīng)用的‘瓶頸’�！焙〗忉專粋€知識點可能最多出現(xiàn)在幾個關(guān)系中，能解決比爾·蓋茨的爸爸的鄰居的媽媽這種單維度的問題，但離反映現(xiàn)實世界中“蝴蝶效應(yīng)”里的相互影響還差很遠。

在關(guān)聯(lián)密度不足的情況下，AI的“大腦”即便擁有一個上千萬詞條體量的通用知識圖譜也難以達到應(yīng)用的級別。

行業(yè)知識圖譜能達“認知層面”

知識點的關(guān)聯(lián)密度更像是一個AI大腦皮層，越復(fù)雜密集AI將越“聰明”。

“聚焦到行業(yè)，AI可以做到相對聰明一點。”胡健說，一些行業(yè)本身就有自己的基礎(chǔ)關(guān)聯(lián)圖，這為其制定圖譜提供了幫助。例如公安系統(tǒng)有一套體系，包括人、地、事、物、組織、機構(gòu)以及關(guān)聯(lián)，將出入境數(shù)據(jù)、第三方物流數(shù)據(jù)等加入進來之后，可固定成知識圖譜。

中國人民公安大學(xué)公共安全行為科學(xué)實驗室主任丁寧介紹，在做入室盜竊、公交扒竊等一些行為規(guī)律的研究時，知識圖譜中除了引入歷史數(shù)據(jù)的發(fā)展態(tài)勢、風(fēng)險感知之外，還逐步加入了環(huán)境、天氣等數(shù)據(jù)，包括PM2.5的值，結(jié)果發(fā)現(xiàn)PM2.5的值對公交扒竊是有影響的。

“我們也提出虛實網(wǎng)絡(luò)結(jié)合的方向，在掌握了實際的社交網(wǎng)，和資金流、社交流聯(lián)系之后，我們對于團伙的刻畫就比較準確了�！倍幷f，這將大大提高AI通過分析輔助決策的能力。

越密集越準確，AI知識圖譜的關(guān)系圖要做到像“福爾摩斯”一樣綜合分析，要形成凝集大量信息的知識圖譜，這對傳統(tǒng)的人工建立知識圖譜的效率提出了挑戰(zhàn)。“為此，我們研發(fā)出人工智能的解決方式，能夠自動從海量的多源異構(gòu)數(shù)據(jù)中抽取知識構(gòu)建關(guān)系、理解語義以及與業(yè)務(wù)場景有效結(jié)合，更標準化、效率更高、關(guān)聯(lián)密度能做到更高。”胡健說。

“在此基礎(chǔ)上，我們研究出來跨境資金網(wǎng)絡(luò)可疑交易的一套AI模型�！敝行陪y行反洗錢專家沈可生說，它習(xí)得“認知智能”后每年的可疑交易預(yù)警量從50萬份下降到10萬份，減少80％人工甄別的工作量，同時把結(jié)果的準確度提升了80％。

AI正從“感知智能”走向“認知智能”