AI被認定為是人類歷史上第四次工業(yè)革命,其發(fā)展必然會伴隨著技術(shù)的不斷演進、應(yīng)用的不斷祛魅。這其中必然也會出現(xiàn)所謂各種泡沫,各種事后被證實的“笑料”。但不可否認的是,初期的人工智能正為我們的生活陸續(xù)帶來驚喜。無論是小到點外賣,還是大到疾病防控、金融監(jiān)管。我們期待著,人工智能技術(shù)未來給生活帶來的更多溫暖和便利。
2018年谷歌I/O大會上,CEO Sundar Pichai展示了一項技術(shù),用Google Assistant在沒有人類干涉情況下進行預(yù)約服務(wù)。
當(dāng)聽到對方回復(fù)“讓我查詢一下時間”時,Google Assistant回復(fù)了聲“嗯哼”,技驚四座。一般情況下,人們對于這部分的回應(yīng)可能會認為是“好的”之類,能在當(dāng)下出現(xiàn)這種極其接近人類的情感化回復(fù),已經(jīng)是很讓人驚訝的表現(xiàn)了。
但事實似乎并非如此。近日美國媒體的報道指出,現(xiàn)實生活中谷歌智能助手絕大部分仍是由谷歌呼叫中心的員工代為處理。為此,谷歌官方回應(yīng)是,為了保障餐廳在接受訂餐時的體驗,并未強力去人工化。
一石驚起千層浪。似乎這家全球領(lǐng)先的AI技術(shù)公司遭遇了一場信任危機,而關(guān)于背后的AI技術(shù)發(fā)展,也在AlphaGo后并未再有讓人驚喜甚至“驚懼”的表現(xiàn)。
近日,清華大學(xué)人工智能研究院院長張鈸接受媒體采訪也指出,AI奇跡短期難再現(xiàn),深度學(xué)習(xí)潛力已近天花板。
從技術(shù)角度來看,近些年人工智能實現(xiàn)飛躍突破的背后,是由一個叫做“深度學(xué)習(xí)”技術(shù)的加速突破帶來的。-甘俊
深度學(xué)習(xí)的瓶頸
從技術(shù)角度來看,近些年人工智能實現(xiàn)飛躍突破的背后,是由一個叫做“深度學(xué)習(xí)”技術(shù)的加速突破帶來的。
但其實早在2006年,“深度學(xué)習(xí)”這一概念便被Geoff Hinton發(fā)表論文時正式提出。他也因此被稱為“深度學(xué)習(xí)之父”、“神經(jīng)網(wǎng)絡(luò)先驅(qū)”,并獲得2019年的“圖靈獎”。
為什么到了近兩年,深度學(xué)習(xí)才終于在AI世界“有了姓名”,Hinton為什么到今年才為此獲獎?這與深度學(xué)習(xí)本質(zhì)上存在一定瓶頸有關(guān)。
Hinton教授發(fā)表論文后的2006年到2012年間,限于整體計算機算力和數(shù)據(jù)基數(shù)問題,深度學(xué)習(xí)并沒有條件發(fā)揮它的真實效力。在2012年,Hinton教授和他的兩個學(xué)生在ImageNet比賽上,使用深度學(xué)習(xí)技術(shù)將識別錯誤率從26.2%猛然降低到15.3%,這才使深度學(xué)習(xí)被廣為關(guān)注起來。
到了2016年,谷歌推出的AlphaGo系統(tǒng)陸續(xù)擊敗人類圍棋世界冠軍,甚至引發(fā)過關(guān)于“機器將取代人類”的論調(diào)(當(dāng)然答案是否定的)。這背后都有賴于“深度學(xué)習(xí)”技術(shù)的推動。
以至于到今天,“深度學(xué)習(xí)”一度成為可以跟“人工智能”并肩的詞匯而普世。
“深度學(xué)習(xí)”技術(shù)逐漸成熟的背后,是與深度神經(jīng)網(wǎng)絡(luò)層數(shù)的演進有關(guān)。從20世紀80年代開始,神經(jīng)網(wǎng)絡(luò)經(jīng)歷過單層神經(jīng)網(wǎng)絡(luò)、多層神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)三次發(fā)展階段,演進帶來的是,能夠容納的數(shù)據(jù)量有了巨大擴容。
當(dāng)然問題也就隨之而來,這意味著深度學(xué)習(xí)的發(fā)展,有賴于對有效數(shù)據(jù)的積累和學(xué)習(xí),而有效數(shù)據(jù)則有賴于人類介入進行大量的數(shù)據(jù)標注。
目前專家們同樣還不能解釋AI算法背后的運算機制如何解釋。-資料
在5月25日舉行的2019未來論壇·深圳技術(shù)峰會上,美團搜索與NLP部負責(zé)人王仲遠就指出,深度學(xué)習(xí)其中一個本質(zhì),是需要大量的標注數(shù)據(jù)來尋找事物之間的靜態(tài)映射關(guān)系。
顯然目前不太適合深度學(xué)習(xí)的問題也很多,比如一些創(chuàng)造性活動中,數(shù)學(xué)家、物理學(xué)家的工作就無法被人工智能簡單取代;再比如一些無法提供大量標注數(shù)據(jù)的領(lǐng)域、一些結(jié)果需要可解釋的領(lǐng)域。這些都成為深度學(xué)習(xí)技術(shù)目前應(yīng)用的一個瓶頸。
深醒科技創(chuàng)始人、首席科學(xué)家袁培江此前也向21世紀經(jīng)濟報道表示,AI技術(shù)的發(fā)展在不斷迭代。理論上機器學(xué)習(xí)掌握了所有存儲在其中的數(shù)據(jù),就可以達到100%準確度。圍棋博弈的棋盤變化情況達到10的172次方,但還可以繼續(xù)優(yōu)化,這是漫長的過程。
他認為,依靠粗暴的數(shù)據(jù)驅(qū)動會有閾限,當(dāng)前深度學(xué)習(xí)的方法很快會遇到天花板。業(yè)界正在謀求算法數(shù)據(jù)可解釋性、模型合理性的進一步探索。“準確率從90%到99.99%會發(fā)展很快,但到小數(shù)點精確到更后面時,技術(shù)瓶頸會越來越明顯。那么與應(yīng)用落地結(jié)合,尤其和其他數(shù)據(jù)結(jié)合是必然!
如何突破瓶頸?
深度學(xué)習(xí)的發(fā)展其實遠遠沒有達到能夠“驚人”的地步。也因此,伴隨著“AI代人”說法而生的,還有“弱人工智能”這個對當(dāng)下階段的定義。
這背后涉及的,其實是關(guān)于深度學(xué)習(xí)的“黑盒子”問題。由于人腦的運作存在諸多包括感情、記憶、常識等主觀因素共同影響,這并不是現(xiàn)階段機器可以全部學(xué)習(xí)到的內(nèi)容。而學(xué)界關(guān)于人腦運作機制問題尚未有進一步的進展。
目前專家們同樣還不能解釋AI算法背后的運算機制如何解釋。一個表現(xiàn)是,當(dāng)需要辨別上圖中哪個動物是“kiki”,哪個是“bouba”時,人類多數(shù)會認為前者是kiki。按照心理學(xué)家的解釋,這是因為“kiki”發(fā)音顯得更加尖銳,這與前者圖片相符。但實際上,這兩者并不存在于世上。但對于機器而言,這恐怕難以得出答案了。
因此關(guān)于深度學(xué)習(xí),業(yè)界開始出現(xiàn)兩種探索思路。一種是換一種技術(shù)架構(gòu),另一種是針對深度學(xué)習(xí)目前的瓶頸,研發(fā)新的改善方向,
中國自動化學(xué)會副理事長陳俊龍研究“寬度學(xué)習(xí)”架構(gòu)。他曾向21世紀經(jīng)濟報道介紹,寬度學(xué)習(xí)和深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),本質(zhì)上是結(jié)構(gòu)和算法的差別。深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)架構(gòu),是在結(jié)構(gòu)固定以后才開始學(xué)習(xí)。那么此后學(xué)習(xí)期間如果出現(xiàn)不準確,就要重新設(shè)計網(wǎng)絡(luò)、再學(xué)習(xí)一次。寬度則是設(shè)計好網(wǎng)絡(luò)后,當(dāng)面臨學(xué)習(xí)不準確的情況,可以隨時以橫向的方式進行增量擴充,即通過增加神經(jīng)元,以提高準確度。
“所以寬度學(xué)習(xí)是增量學(xué)習(xí)的做法,時時可以增量學(xué)習(xí)!标惪↓埍硎荆酝疃壬窠(jīng)網(wǎng)絡(luò)由于數(shù)據(jù)量過大、建設(shè)程序復(fù)雜,需要將數(shù)據(jù)上傳到云端運算,但寬度學(xué)習(xí)的橫向擴充模式,就可以直接用于“端”(邊緣)側(cè),這也成為寬度學(xué)習(xí)架構(gòu)最大的優(yōu)點。
據(jù)介紹,寬度學(xué)習(xí)系統(tǒng)的網(wǎng)絡(luò)架構(gòu),按照目前的測試,其應(yīng)用時耗費的神經(jīng)元和所需速度是深度學(xué)習(xí)的“至少一半”。
在2019未來論壇現(xiàn)場,上海交通大學(xué)教授張婭介紹了她的研究方向。由于深度學(xué)習(xí)需要標注大量數(shù)據(jù)集,她的出發(fā)點在于,希望標注更少數(shù)據(jù)進行計算,減少單位標注數(shù)據(jù)的成本,以及減少采集數(shù)據(jù)的噪聲,針對這三點進行研發(fā)。
“AI是一個大潮流,但每一個AI產(chǎn)品的落地都需要重新采集數(shù)據(jù)集,需要從零開始訓(xùn)練模型,這其實對AI的落地應(yīng)用有很大限制。我們希望通過這種資源受限的機器學(xué)習(xí)研究,得以使這方面得到一定突破,當(dāng)然其實現(xiàn)在從學(xué)術(shù)角度的研究,我們還有更多方向在做,比如自監(jiān)督學(xué)習(xí)等等,我認為這些都是未來AI能夠真正從一個行業(yè)或者說領(lǐng)域人工智能走向真正通用人工智能的必經(jīng)之路。”張婭這樣總結(jié)道。
能怎么應(yīng)用?
智能語音助手的開發(fā)者,并不完全讓助手“放飛自我”當(dāng)助理。不論是否真的出于對餐廳尊重,還是對機主尊重才介入人類幫助,無疑都顯示出當(dāng)前AI技術(shù)應(yīng)用能力還相對弱。
但也并不意味著,目前的AI應(yīng)用就是一種空談。實際上人工智能已在一些領(lǐng)域悄然發(fā)揮作用。
一位AI從業(yè)者就向21Tech表示,代人預(yù)約(如帶點外賣等)就是他認定的一種應(yīng)用方向,為此他在不斷努力。更有手機業(yè)人士推測,未來內(nèi)置在手機中的智能語音助手,會根據(jù)手機主人平常的生活行為,提前自主通過手機軟件,在沒有機主操作情況下,進行代點外賣行為。
前述論壇上,王仲遠介紹道,其所在團隊開發(fā)出的美團大腦,就是通過不斷優(yōu)化其中模型的精細度,更好對平臺中的商家進行精確定義,從而讓用戶有更合適的選擇!俺怂阉饕酝,實際上美團大腦還有非常多的應(yīng)用場景,比如說商戶的運營、金融的反欺詐、旅游的規(guī)劃以及未來開發(fā)中的智能助理!
更遠大的在于醫(yī)學(xué)和金融層面。普林斯頓大學(xué)運籌金融系終身教授王夢迪研究的主題是強化學(xué)習(xí)。本質(zhì)上這屬于深度學(xué)習(xí)和增強學(xué)習(xí)反饋,是基于非同步大規(guī)模并行計算的快速算法。其需要實時數(shù)據(jù)收集,并進行在線大規(guī)模實驗。
她所在團隊的這些研究也有了突破性應(yīng)用進展。據(jù)她在論壇上介紹,美國每年會發(fā)生70萬例膝關(guān)節(jié)置換手術(shù),其康復(fù)時長在100多天,整個成本達到16500-33000美元。
這類手術(shù)本身極其復(fù)雜,根據(jù)個體特異性,往往伴隨適應(yīng)癥、并發(fā)癥等情形。因此這會是一個動態(tài)決策的過程,大概每個療程需要有30-60個決策。
問題的關(guān)鍵在于,膝關(guān)節(jié)置換手術(shù)成本過高,而政府、醫(yī)院和醫(yī)生之間還存在復(fù)雜的博弈,因此整個流程存在很多可以優(yōu)化的地方。
王夢迪所在團隊提出的思路是,將膝關(guān)節(jié)置換療程分解成大規(guī)模狀態(tài)轉(zhuǎn)移模型進行策略求解。基于診斷和醫(yī)療保險記錄,總結(jié)歸納,策略模仿,并且強化優(yōu)化策略,計算出最優(yōu)治療計劃。根據(jù)預(yù)計,療程費用平均下降6%,溢出費用下降33%。
“我一個朋友跟我說,‘這個手術(shù)之后,我又可以去滑雪了’!”在結(jié)尾處,她這樣說到,團隊希望通過強化學(xué)習(xí)將療程費用平均降低1100美元,降低長尾風(fēng)險33%!拔覀兿M麕椭t(yī)生和醫(yī)院,更好優(yōu)化醫(yī)療流程,更好優(yōu)化效率;幫助患者更好地康復(fù)!