本報(bào)記者 張佳星
證件、人臉,掃描對(duì)比,綠燈亮,通過,在經(jīng)過高鐵安檢閘口的這一流程時(shí),你也許會(huì)想:機(jī)器認(rèn)識(shí)我。而實(shí)際上,并不是。
“當(dāng)前的人工智能(AI)識(shí)別做的只是比對(duì),缺少信息進(jìn)入大腦之后的‘加工、理解、思考’步驟,因此僅僅停留在‘感知’,而并非‘認(rèn)知’!6月18日,紀(jì)念吳文俊誕辰一百周年活動(dòng)的“認(rèn)知智能行業(yè)應(yīng)用大會(huì)”舉行,中國(guó)人民大學(xué)高瓴人工智能學(xué)院執(zhí)行院長(zhǎng)文繼榮表示,要讓AI有類似大腦的活動(dòng),走到認(rèn)知階段,需要讓它掌握知識(shí)、進(jìn)行推理。AI從“感知智能”走向“認(rèn)知智能”的實(shí)踐目前在通用狀態(tài)下比較困難,但在一些諸如反洗錢、偵察等領(lǐng)域正在應(yīng)用。
AI“大腦”長(zhǎng)成要先建知識(shí)庫
“現(xiàn)在的AI處于弱人工智能狀態(tài),它沒有大腦,要讓它形成大腦,最核心的是要有‘知識(shí)’!
微軟亞洲研究院前研究員、北京一覽群智數(shù)據(jù)科技有限責(zé)任公司首席執(zhí)行官胡健表示,如果現(xiàn)有的算法、模型是神經(jīng)或腦結(jié)構(gòu),那么知識(shí)是大腦能夠運(yùn)轉(zhuǎn)起來的原動(dòng)力。
讓AI獲得知識(shí)的知識(shí)庫在業(yè)界稱為“知識(shí)圖譜”,它不僅要關(guān)注知識(shí)點(diǎn)還要關(guān)注知識(shí)點(diǎn)間的關(guān)聯(lián)。這些關(guān)聯(lián)將賦予AI聯(lián)想力!疤岬剿,它要反應(yīng)到密度、透明等多個(gè)性質(zhì),還要和澆水、能喝的功能聯(lián)系起來,更高級(jí)的是計(jì)算出用多大力道去取水!焙≌f。
知識(shí)圖譜的建立非常困難,人類海量的知識(shí)如何翻譯成機(jī)器的語言,并與之建立聯(lián)系,很成問題。尤其是之前這項(xiàng)工作一直是人工完成的,例如谷歌詞庫、百度百科、維基百科等都可以轉(zhuǎn)換為知識(shí)圖譜,但工作量大、內(nèi)容異常龐雜。
“關(guān)聯(lián)密度不足是另一個(gè)難以達(dá)到應(yīng)用的‘瓶頸’!焙〗忉,一個(gè)知識(shí)點(diǎn)可能最多出現(xiàn)在幾個(gè)關(guān)系中,能解決比爾·蓋茨的爸爸的鄰居的媽媽這種單維度的問題,但離反映現(xiàn)實(shí)世界中“蝴蝶效應(yīng)”里的相互影響還差很遠(yuǎn)。
在關(guān)聯(lián)密度不足的情況下,AI的“大腦”即便擁有一個(gè)上千萬詞條體量的通用知識(shí)圖譜也難以達(dá)到應(yīng)用的級(jí)別。
行業(yè)知識(shí)圖譜能達(dá)“認(rèn)知層面”
知識(shí)點(diǎn)的關(guān)聯(lián)密度更像是一個(gè)AI大腦皮層,越復(fù)雜密集AI將越“聰明”。
“聚焦到行業(yè),AI可以做到相對(duì)聰明一點(diǎn)。”胡健說,一些行業(yè)本身就有自己的基礎(chǔ)關(guān)聯(lián)圖,這為其制定圖譜提供了幫助。例如公安系統(tǒng)有一套體系,包括人、地、事、物、組織、機(jī)構(gòu)以及關(guān)聯(lián),將出入境數(shù)據(jù)、第三方物流數(shù)據(jù)等加入進(jìn)來之后,可固定成知識(shí)圖譜。
中國(guó)人民公安大學(xué)公共安全行為科學(xué)實(shí)驗(yàn)室主任丁寧介紹,在做入室盜竊、公交扒竊等一些行為規(guī)律的研究時(shí),知識(shí)圖譜中除了引入歷史數(shù)據(jù)的發(fā)展態(tài)勢(shì)、風(fēng)險(xiǎn)感知之外,還逐步加入了環(huán)境、天氣等數(shù)據(jù),包括PM2.5的值,結(jié)果發(fā)現(xiàn)PM2.5的值對(duì)公交扒竊是有影響的。
“我們也提出虛實(shí)網(wǎng)絡(luò)結(jié)合的方向,在掌握了實(shí)際的社交網(wǎng),和資金流、社交流聯(lián)系之后,我們對(duì)于團(tuán)伙的刻畫就比較準(zhǔn)確了!倍幷f,這將大大提高AI通過分析輔助決策的能力。
越密集越準(zhǔn)確,AI知識(shí)圖譜的關(guān)系圖要做到像“福爾摩斯”一樣綜合分析,要形成凝集大量信息的知識(shí)圖譜,這對(duì)傳統(tǒng)的人工建立知識(shí)圖譜的效率提出了挑戰(zhàn)!盀榇,我們研發(fā)出人工智能的解決方式,能夠自動(dòng)從海量的多源異構(gòu)數(shù)據(jù)中抽取知識(shí)構(gòu)建關(guān)系、理解語義以及與業(yè)務(wù)場(chǎng)景有效結(jié)合,更標(biāo)準(zhǔn)化、效率更高、關(guān)聯(lián)密度能做到更高!焙≌f。
“在此基礎(chǔ)上,我們研究出來跨境資金網(wǎng)絡(luò)可疑交易的一套AI模型。”中信銀行反洗錢專家沈可生說,它習(xí)得“認(rèn)知智能”后每年的可疑交易預(yù)警量從50萬份下降到10萬份,減少80%人工甄別的工作量,同時(shí)把結(jié)果的準(zhǔn)確度提升了80%。