首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 論壇 >> 正文

【分享】亞馬遜帝國的人工智能革命史

2018年2月5日 14:01  虎嗅網(wǎng)  作 者:Wired©

虎嗅注:今天恰好看到亞馬遜Alexa的超級碗廣告,亞馬遜創(chuàng)始人、CEO貝佐斯親自出演其中的角色。廣告講述了Alexa突然失聲,亞馬遜不得不找各種替補人員來代替Alexa回應(yīng)用戶的各種需求,然后各種答非所問,比如一位用戶問Alexa如何烤乳酪三明治,后臺的工作人員邊運動邊回應(yīng):「簡直可悲!你都32歲了!食譜都寫在名字里了,你個傻X!」還有個用戶問:「Alexa,地球到火星有多遠?」后臺的一位大姐回答道:「我哪兒知道,我又沒去過火星。這個家伙居然想去火星,圖啥?」(感覺亞馬遜有借廣告暗諷一心想移民火星的馬斯克的嫌疑)……總之,在鬧出了一系列笑話后,最后Alexa突然又好了,說:「感謝啦各位,還是讓我來吧!


這則廣告是為了凸顯亞馬遜人工智能助理Alexa在人類生活中扮演的重要角色。而目前亞馬遜在人工智能的確表現(xiàn)得可圈可點。美國《連線》雜志則在官網(wǎng)復(fù)盤了亞馬遜是如何引發(fā)人工智能變革的。本文原載于 Wired ,原標題為 Inside Amazon's Artificial Intelligence Flywheel ,由微信公眾號「機器之能」(ID:almosthuman2017),譯者:Nurhachu Null 、侯韻楚、Edison。


2014年初,Srikanth Thirumalai 見到了亞馬遜 CEO Jeff Bezos。Thirumalai 是一位計算機科學(xué)家,2005 年從 IBM 來到亞馬遜,負責公司的推薦團隊。他給 Bezos 提了一個全新計劃:將人工智能最新進展結(jié)合到部門產(chǎn)品中。


他帶著「六頁提案」去了。Bezos 很早之前就發(fā)布過一條命令,產(chǎn)品或服務(wù)推薦必須維持在這個長度內(nèi),包含描述最終產(chǎn)品、服務(wù)和計劃的新聞稿。


當時,Bezos 正依靠左右手們將亞馬遜轉(zhuǎn)型為一家人工智能「發(fā)電室」。公司很早就將人工智能技術(shù)用于產(chǎn)品推薦。不過近年來,這個領(lǐng)域正在發(fā)生一場變革,機器學(xué)習(xí)變得越來越有效,尤其是深度學(xué)習(xí)。深度學(xué)習(xí)在計算機視覺、語音和自然語言處理方面引起了巨大的進步。


近十年早期,雖然亞馬遜還沒有明顯利用這些技術(shù)發(fā)展,但意識到了需求的迫切性。新時代最激烈的競爭將會是 AI 領(lǐng)域。Google,F(xiàn)acebook,Apple 和 Microsoft 等公司都壓下巨額賭注。


亞馬遜正在落后!肝覀兒兔總團隊的負責人聊,基本上就是問怎么將人工智能技術(shù)應(yīng)用在自身的業(yè)務(wù)中?」亞馬遜設(shè)備和服務(wù)副總裁 David Limp 說。


Thirumalai 走心了。他來到貝索斯的辦公室,談了談自己的年度計劃,如何更加積極地使用機器學(xué)習(xí)技術(shù)。但他又覺得,完全重構(gòu)現(xiàn)在這套精心維護了 20 年的系統(tǒng),太冒險。更何況,機器學(xué)習(xí)表現(xiàn)最佳的領(lǐng)域(比如圖像識別)和自己的領(lǐng)域(推薦系統(tǒng))并沒啥關(guān)系。


「還沒人將深度學(xué)習(xí)技術(shù)應(yīng)用在推薦中,并取得了比我們好很多的而結(jié)果!顾f!杆,特別需要信仰上的飛躍!


Thirumalai 還沒準備好,不過,Bezos 卻想要更多。


Thirumalai 想用深度學(xué)習(xí)徹底變革既有的推薦系統(tǒng)工作方式。但這就需要一些技術(shù),但自己團隊并沒有掌握這些技術(shù),連工具都沒有,甚至還沒人想出算法。


Bezos 卻喜歡這樣(盡管他那招牌式的笑聲并不能清楚表明,他歡迎這種做法)。于是,Thirumalai 重寫了遍新聞稿,繼續(xù)工作去了。

公司領(lǐng)導(dǎo)層中,Thirumalai 是唯一一位幾年之前,拿著「六 頁提案」跟隨 Bezos 的。


每位負責人認為,要針對不同客戶全體,提供完全不同產(chǎn)品;旧,這些觀點都算是 Thirumalai 提議的變體:使用先進的機器學(xué)習(xí)技術(shù)改造亞馬遜部分業(yè)務(wù)。


有些建議涉及到反思既有業(yè)務(wù),比如公司的機器人、數(shù)據(jù)中心業(yè)務(wù)和亞馬遜云。有的意味著創(chuàng)造全新業(yè)務(wù),例如語音智能家居產(chǎn)品,后來落地成 Echo。


但結(jié)果的影響力遠遠超過了單個業(yè)務(wù)項目。Thirumalai 說,原來開會時,公司的 AI 人才都被分割開了。「雖然也會討論、交談,但不會分享大量技術(shù)和神器,因為經(jīng)驗教訓(xùn)這些東西很難直接發(fā)揮作用,」他說。這些人才就像是工程海洋中的 AI 島嶼。


但借助機器學(xué)習(xí)變革公司,徹底改變了這一現(xiàn)狀。


雖然每位「六頁提案」的人都在嚴格遵守亞馬遜「單線程(single-threaded)」團隊信條,也就是說,每個團隊「擁有」他們所采用的技術(shù),但大家開始了跨項目協(xié)作。


公司內(nèi)部科學(xué)家負責解決重大問題,并將解決方案分享給其他團隊。AI 孤島被連接起來,而且隨著公司的 AI 雄心不斷壯大,所面臨的難題也吸引著頂尖人才,尤其是那些想看到自己研究如何影響現(xiàn)實的人才。這也平衡了亞馬遜對純研究不感冒的文化,公司過去要求創(chuàng)新必須完全基于更好地為客戶服務(wù)的語境中。


亞馬遜龐大帝國運轉(zhuǎn)起來,就像一臺永動機。這是如何做到的?亞馬遜喜歡用「飛輪(flywheel)」這個詞作答。基于機器學(xué)習(xí)的創(chuàng)新,會為其他業(yè)務(wù)團隊提供動力;這些團隊通過打造產(chǎn)品和服務(wù),對其他團隊產(chǎn)生影響,甚至對整個公司產(chǎn)生影響。將公司的機器學(xué)習(xí)平臺作為一種付費服務(wù)提供給外界,這種努力本身也會帶來收益,在某些情況下,甚至能收集更多數(shù)據(jù)進一步提升技術(shù)。


將亞馬遜從一家深度學(xué)習(xí)死忠粉公司,轉(zhuǎn)型成一家「發(fā)電室」,需要很多這樣的「六頁提案」人。整個公司,都可以看到這一轉(zhuǎn)型效果,包括運行在新的機器學(xué)習(xí)基礎(chǔ)架構(gòu)上的推薦系統(tǒng)。如今,亞馬遜可以很聰明地推薦下一步讀什么、將什么商品加入購物清單,以及今晚可能想看什么電影。


今年,Thirumalai 開啟了一項新的工作——領(lǐng)導(dǎo)亞馬遜的搜索部門。他希望將深度學(xué)習(xí)用于服務(wù)的各個方面。


「如果七八年之前問我亞馬遜的 AI 實力如何,我會說,他們沒有人工智能!谷A盛頓大學(xué)計算機科學(xué)的教授 Pedro Domingos 說,「但他們一直在積極地成長。正成為一支勁旅。」


或許。


Alexa 效應(yīng)


公司的旗艦人工智能產(chǎn)品是:Echo,以及背后的驅(qū)動系統(tǒng)——Alexa 語音平臺。其實,這些項目也源于一份 2011 年交付給 Bezos 的「六頁提案」,Operational Plan One 年度計劃。


其中一位提議高管叫 Al Lindsay,2004 年開始在亞馬遜工作。當時,他被要求從自己負責的團隊轉(zhuǎn)到主要技術(shù)團隊,幫助打造全新的產(chǎn)品。


「一款低功耗普適計算機,大腦在云端,你可以通過語音與它交互!顾貞浀馈


但是,打造這樣一款科幻電影里才有的產(chǎn)品,需要具備一定的 AI 功能,但當時公司就沒有這方面的人才。雪上加霜的是,那些有技術(shù)能力的專家,只有極少數(shù)愿意為亞馬遜工作。Google 和 Facebook 當時也在搶奪這一領(lǐng)域的頂尖人才。


「我們當時處境很慘。」Lindsay 說。



「亞馬遜過去形象不太好,公司對研究型人才不太友好!笵omingos 說。


公司對客戶不懈關(guān)注以及自身的斗士文化,與對待學(xué)術(shù)人才的態(tài)度不一致!冈 Google 你是被寵愛的,而在亞馬遜,你的計算機則擺在衣柜上!顾f。


更糟糕的是,當時亞馬遜還因公司創(chuàng)新崗位還不如給公司搞包裝的崗位而「聲名遠播」。


2014 年的一次內(nèi)部聚會中,機器學(xué)習(xí)領(lǐng)域頂級專家 Yann LeCun 在亞馬遜做了一次報告。當時,他已經(jīng)接受了領(lǐng)導(dǎo) Facebook 研究的橄欖枝,但他還是來做報告了。


先在一間能容納 600 人的禮堂里做報告,LeCun 回憶道,然后被帶到了一個小會議室,小團隊一個接一個來向他請教問題。


但是當他向亞馬遜的人提問時,他們幾乎一無所應(yīng)。這讓 LeCun 很無語。他當初選擇 Facebook,部分原因就在于后者愿意開源大部分 AI 研究工作。


由于當時公司內(nèi)部沒有相關(guān)人才,所以亞馬遜開始巨資收購公司。


「在 Alexa 初期,我們收購了很多公司!筁imp 說。


2011 年年 9 月,它收購了 Yap,這是一家專攻語音文本轉(zhuǎn)換的公司。2012 年年 1 月收購了英國劍橋的 Evi,這家公司軟件可以像 Siri 一樣響應(yīng)用戶的需求。2013 年 1 月收購了 Ivona,這家專攻語音合成的波蘭公司,為 Echo 提供了能夠交談的技術(shù)。


但是,亞馬遜的密保文化也妨礙了公司吸引頂尖學(xué)術(shù)人才的努力。


Alex Smola 曾經(jīng)有希望成為亞馬遜的員工,他是這個領(lǐng)域的巨星,之前在 Yahoo 和 Google 工作過。


「實際上,他也是深度學(xué)習(xí)領(lǐng)域教父之一!笹oogle scholar 引用超過了 90000 次,亞馬遜云深度學(xué)習(xí)和人工智能部門負責人 Matt Wood 說。


但是,亞馬遜高管甚至不向 Smola 透露他們將要從事的主要工作內(nèi)容。最終 Smola 選擇了卡耐基梅隆大學(xué)的一個實驗室。

在 Alexa 總監(jiān) Ruhi Sarikaya 和亞馬遜 Alexa 引擎副總裁 Al Lindsay 的領(lǐng)導(dǎo)下,團隊不僅嘗試研發(fā) Echo 系列智能音響,還試圖研發(fā)出能夠與其他公司產(chǎn)品兼容的語音服務(wù)


「即使到產(chǎn)品臨近推出這種關(guān)鍵時刻,我們面前也擺著巨大的障礙。他們會嚷嚷:『我憑什么要在亞馬遜工作?我又不想向顧客銷售產(chǎn)品!』」Lindsay 說道。


亞馬遜確實需要有所行動。


既然公司是由設(shè)想中的最終產(chǎn)品倒推,那么,產(chǎn)品藍圖可能會包含某些尚未發(fā)明的功能!秆芯靠駸嵝汀箍茖W(xué)家對這些難題興趣十足。其在語音方面需配備能達到對話程度的 AI,這個 AI 應(yīng)當能對「喚醒詞」敏感,聽取并譯解指令,以及給出盡量合理的答案;而亞馬遜目前無法做到這一點。


即便沒有亞馬遜的擁躉,這個項目也吸引了 Rohit Prasad(波士頓的技術(shù)承包公司 Raytheon BBN 中的一位知名語音識別科學(xué)家)的注意。(這個項目使亞馬遜同意他在家鄉(xiāng)建立了自己的團隊。)


他認為,亞馬遜專業(yè)化的缺乏是一種特色而非缺陷!高@個領(lǐng)域充滿希望。谷歌和微軟已經(jīng)在語音方面研究了很多年,而在亞馬遜,我們可以從頭開始,抓住并解決所有難題!


自從 2013 年加入亞馬遜以來,他就被委派到了 Alexa 項目中!高@個設(shè)備以硬件的形式存在,但在語音領(lǐng)域?qū)儆谠缙诩夹g(shù)!顾f。


Echo 最棘手的部分便是遠場語音識別,這個問題迫使亞馬遜開創(chuàng)了新局面,并在此過程中提升了機器學(xué)習(xí)技能。


它包括將與麥克風存在一段距離的語音指令進行譯解,甚至能夠譯解被環(huán)境噪聲或其他細聲碎語干擾的語音指令。


而具有挑戰(zhàn)性的一個因素,便是設(shè)備在識別指令時不能有延時,它必須極快地將音頻發(fā)送至云端而后產(chǎn)生答案,使彼此之間像在進行對話,而不像處于某些「你不確定對方是否還活著」的尷尬場合。


若要建立一個在嘈雜條件下能夠理解并回應(yīng)對話式查詢指令的系統(tǒng),則需要大量的數(shù)據(jù),即許多人們可能與 Echo 進行的不同類互動的例子。至于亞馬遜可能會從何處得到數(shù)據(jù),目前還不可知。

如今許多亞馬遜設(shè)備和第三方產(chǎn)品都在使用 Alexa 語音服務(wù)。而通過 Alexa 所收集的數(shù)據(jù)則有助于改良系統(tǒng),并能增強亞馬遜更廣泛的 AI 服務(wù)


設(shè)備與服務(wù)的副總裁 Limp 說道,遠程技術(shù)早已完成,但「它建立在 Trident 潛艇的鼻錐體上,并且花費了十億美元。」亞馬遜試圖讓技術(shù)落地在一款可以放置在廚房柜臺上的設(shè)備中,它的價格也必須足夠低廉,才能吸引顧客購買這些稀奇古怪的小玩件。


「我們的團隊中,有十分之九的成員認為這無法完成。我們在亞馬遜之外有一個技術(shù)顧問委員會,我們沒有向他們透露正在做什么,但是他們說『不管做什么工作都不要繞過語音識別!』。」Prasad 說。


Prasad 的經(jīng)歷使他堅信這能夠做到。但亞馬遜并未提供一個能將機器學(xué)習(xí)用于產(chǎn)品開發(fā)的可靠系統(tǒng)。


「好消息是,亞馬遜擁有全部必備品——無可比肩的云服務(wù),裝有 GPU 來壓縮機器學(xué)習(xí)算法的數(shù)據(jù)中心,以及知曉如何快速移動數(shù)據(jù)的工程師!顾f。


他的團隊利用這些部分創(chuàng)建了一個平臺,平臺本身便是寶貴的資產(chǎn),其價值遠超出「豐富 Echo 的功能」這一使命。


「一旦我們將 Echo 開發(fā)為遠場語音識別設(shè)備,便有機會做的更多,即將 Alexa 的范圍擴展到語音服務(wù)當中。」Alexa 的資深首席科學(xué)家 Spyros Matsoukas 說道。


這位科學(xué)家在 Raytheon BBN 公司,并與 Prasad 合作。(他的工作包括一個很小眾的 DARPA 項目,稱為 Hub4,該項目利用廣播新聞節(jié)目和被攔截的電話內(nèi)容來提升語音識別和自然語言理解能力,這是針對 Alexa 項目的一次大型訓(xùn)練。)他們擴展 Alexa 的一個直接方法,便是允許第三方開發(fā)者創(chuàng)建屬于自己的語音技術(shù)迷你應(yīng)用程序(稱為 skills)來運行 Echo 自身。但這僅僅是開始。


通過將 Alexa 應(yīng)用于的 Echo 設(shè)備之外,公司的人工智能文化開始融合。整個公司的團隊開始意識到,Alexa 也可以為他們的小項目提供有用的語音服務(wù)。


「盡管我們在項目負責制方面非常強,所有這些數(shù)據(jù)和技術(shù)還是要結(jié)合在一起。」Prasad 說。


首先,亞馬遜的其他產(chǎn)品開始集成到 Alexa:當你在 Alexa 設(shè)備上講話時,你可以訪問亞馬遜音樂(Amazon Music)、Prime Video,來自亞馬遜購物網(wǎng)站的你的個人推薦和其他服務(wù)。


隨后,這項技術(shù)開始在其他亞馬遜領(lǐng)域推廣!敢坏┪覀冇辛嘶镜恼Z言能力,我們就能把它帶給非 Alexa 的產(chǎn)品,比如 Fire TV、語音購物、Amazon fresh 的 Dash Wand,以及最終的 AWS!筁indsay 說。


亞馬遜內(nèi)部的人工智能小島正在逐漸聚集成洲。


一旦數(shù)百萬用戶(亞馬遜不會確切地說到底有多少)開始使用 Echo 和其他一系列 Alexa 驅(qū)動的設(shè)備,該公司轉(zhuǎn)型的另一個關(guān)鍵部分就開始了。


亞馬遜開始積累大量的數(shù)據(jù),這可能是所有對話驅(qū)動設(shè)備中最大的交互集合。這些數(shù)據(jù)成為潛在雇員的有力誘餌。突然間,亞馬遜迅速躥升成為那些它夢寐以求的機器學(xué)習(xí)專家可能想要工作的地方。


「讓 Alexa 如此吸引我的原因之一是,一旦你在市場上有了一個設(shè)備,你就有了反饋的資源。不僅是客戶的反饋,而且是真正的數(shù)據(jù),對于改善一切——尤其是底層平臺——是如此重要。」去年加入亞馬遜的一位 Alexa 機器學(xué)習(xí)副總裁 Ravi Jain 說。


因此,隨著越來越多的人使用 Alexa,亞馬遜得到的信息不僅使該系統(tǒng)性能更好,而且還加強了自己的機器學(xué)習(xí)工具和平臺,并使這家公司成為機器學(xué)習(xí)科學(xué)家的一個更熱門的目的地。


飛輪正開始旋轉(zhuǎn)。


一個更具智慧的云端


亞馬遜在 2014 年開始向高端客戶銷售 Echo;而同年,Swami Sivasubramanian 對機器學(xué)習(xí)入了迷。


當時正在管理 AWS 數(shù)據(jù)庫及分析業(yè)務(wù)的 Sivasubramanian 正和家人在印度旅行,在時差和思維千奇百怪的女兒的混合「打擊」下,他開始深夜在電腦前研究谷歌的 Tensorflow 和 Caffé這樣的工具,而它們恰恰是 Facebook 和許多學(xué)者青睞的機器學(xué)習(xí)框架。


他總結(jié)道,將這些工具與亞馬遜的云服務(wù)相結(jié)合可能會產(chǎn)生巨大的價值。他使機器學(xué)習(xí)算法在云端易于運行后,認為公司可能會進入潛在需求所組成的脈絡(luò)。


「我們每月能夠為數(shù)百萬開發(fā)者提供服務(wù),其中大多數(shù)都沒有機器學(xué)習(xí)背景,而不是麻省理工學(xué)院的教授!顾f道。


之后 Jeff Bezos 評論道,他帶著史詩般的六頁提案,氣宇軒昂而來。


從某層面而言,它是向 AWS 增添機器學(xué)習(xí)服務(wù)的藍圖;而 Sivasubramanian 卻看的更遠:這是使 AWS 成為所有科技領(lǐng)域機器學(xué)習(xí)活動活躍中心的宏偉愿景。


從某種意義上而言,向數(shù)萬亞馬遜的云客戶提供機器學(xué)習(xí)是不可避免的。


「當我們首次將 AWS 的初始商業(yè)計劃整合到一起時,其任務(wù)便是,采用只有少數(shù)資金雄厚的組織才能實現(xiàn)的技術(shù),并使其分布盡量廣泛。我們在計算、存儲、分析與數(shù)據(jù)庫方面取得了成功,并且正利用機器學(xué)習(xí),采取了完全相同的方法。」AWS 的機器學(xué)習(xí)經(jīng)理 Wood 說道。


而能夠吸取公司在其他方面所積累的經(jīng)驗,則是使 AWS 更加順風順水的一大法寶。


Wood 說,AWS 在 2015 年首次推出的 Amazon Machine Learning 使像 C-Span 這樣的客戶能夠建立私人面部目錄;Zillow 用來估算房價,Pinterest 則用于虛擬搜索,并且有幾家自動駕駛的初創(chuàng)公司正應(yīng)用 AWS 的機器學(xué)習(xí),通過數(shù)百萬英里的模擬道路測試來改進產(chǎn)品。


2016 年,AWS 推出了新的機器學(xué)習(xí)服務(wù),一個名為 Polly 的文本到語音組件,以及一個名為 Lex 的自然語言處理引擎——它們更直接地利用了 Alexa 的創(chuàng)新。


這些產(chǎn)品幫助 AWS 的客戶們建立自己的迷你 Alexa,從 Pinterest 和 Netflix 等巨頭到小型初創(chuàng)公司都可以輕松完成。


涉及視覺的第三項服務(wù) Rekognition 利用在亞馬遜一個相對不太出名的團隊 Prime Photos 完成的工作,這個團隊試圖實現(xiàn)谷歌、Facebook 和蘋果的照片產(chǎn)品中同樣的深度學(xué)習(xí)功能。


這些機器學(xué)習(xí)服務(wù)既是強大的收入來源,也是亞馬遜人工智能飛輪的關(guān)鍵,因為諸如美國國家航空航天局(NASA)和美國國家橄欖球聯(lián)盟(NFL)這樣的來自各界的客戶都在花錢讓他們的機器從亞馬遜的數(shù)據(jù)中學(xué)習(xí)。


當這些公司能在 AWS 內(nèi)部建立他們的重要機器學(xué)習(xí)工具時,他們轉(zhuǎn)移到競爭對手的云運算平臺的可能性就變得微乎其微了。(真是抱歉了,谷歌、微軟、或者 IBM)


看看 Infor,這是一家為企業(yè)客戶創(chuàng)建業(yè)務(wù)應(yīng)用程序的價值數(shù)十億美元的公司。最近,它發(fā)布了一個名為 Coleman(以電影 Hidden Figures 里 NASA 數(shù)學(xué)家的名字命名)的大規(guī)模新應(yīng)用程序,它允許客戶僅通過對話界面來自動化各種過程、分析公司表現(xiàn),以及與數(shù)據(jù)進行交互。它并沒有從頭構(gòu)建自己的程序,而是使用了 AWS 的 Lex 技術(shù)。


「無論如何,亞馬遜都在做這個方面的研究,那么我們?yōu)槭裁匆谶@上面花時間呢?我們了解我們的客戶,可以讓應(yīng)用程序更適合他們使用。」Infor 的高級副總裁 Massimo Capoccia 如是說。


AWS 在以太領(lǐng)域的主導(dǎo)地位也使其在戰(zhàn)略上優(yōu)于競爭對手,尤其是谷歌,該公司曾希望利用其機器學(xué)習(xí)的領(lǐng)導(dǎo)力,在云計算領(lǐng)域趕上 AWS。是的,谷歌可以在服務(wù)器上為客戶提供超快、機器學(xué)習(xí)優(yōu)化的芯片,但是 AWS 上的公司可以更容易地與那些也在服務(wù)的公司進行互動和銷售。


「就像 Willie Sutton 說他搶銀行是因為錢就在那里一樣,」DigitalGlobe 公司的 CTO Walter Scott 在談到他的公司為什么使用亞馬遜的技術(shù)時說,「我們使用 AWS 進行機器學(xué)習(xí),因為這是我們的客戶所在。」


去年 11 月,在 AWS 的 re:Invent 會議上,亞馬遜為其客戶推出了一個更全面的機器學(xué)習(xí)外延輔助工具:SageMaker,這是一個復(fù)雜但超級易用的平臺。


它的創(chuàng)造者之一正是 Alex Smola,他是機器學(xué)習(xí)領(lǐng)域的超級明星,有超過 9 萬次學(xué)術(shù)引用,在五年前曾拒絕了亞馬遜的工作邀請。當 Smola 決定重返行業(yè)時,他想要幫助創(chuàng)建強大的工具,讓日常軟件開發(fā)人員能夠訪用上機器學(xué)習(xí)。所以他去了他認為能讓他產(chǎn)生最大影響力的地方。


「亞馬遜太好了,不能放棄,」他說,「你可以寫一篇關(guān)于某個問題的論文,但如果你不去實現(xiàn)它,就沒人會真的用你那漂亮的算法!


當 Smola 告訴 Sivasubramanian,構(gòu)建能夠?qū)C器學(xué)習(xí)傳播給數(shù)百萬人的工具比發(fā)布再多一篇論文更重要時,他得到了一個驚喜。


「你也可以發(fā)表你的論文!」Sivasubramanian 說。


是的,亞馬遜如今在允許其科學(xué)家發(fā)表文章方面更加自由!高@對招募頂尖人才有很大幫助,同時也為亞馬遜的研究提供了可看性,」幫助制定了更開放立場指南的 Spyros Matsoukas 說。


要想知道 AWS 的一百多萬用戶是否會開始使用 SageMaker 將機器學(xué)習(xí)應(yīng)用到他們的產(chǎn)品中,現(xiàn)在還為時過早。但是每一個做過的客戶都會發(fā)現(xiàn)自己在亞馬遜上投入良多。


此外,該平臺非常復(fù)雜,甚至包括 Alexa 團隊在內(nèi)的亞馬遜內(nèi)部人工智能團隊都表示,他們打算成為 SageMaker 客戶,使用這個本是提供給外部人員的工具。


他們相信,通過為他們的項目設(shè)立一個基礎(chǔ),讓他們能夠?qū)W⒂诟呒壍乃惴ㄈ蝿?wù),這將為他們節(jié)省大量的工作。


即使只有 AWS 的部分客戶使用了 SageMaker,亞馬遜也會發(fā)現(xiàn)自己的系統(tǒng)性能數(shù)據(jù)豐富許多(當然,這不包括客戶自己的機密信息)。這將帶來更好的算法、更好的平臺,和更多的客戶。飛輪正在加班加點地工作。


人工智能無處不在


隨著機器學(xué)習(xí)的徹底改革,該公司的人工智能技術(shù)已經(jīng)遍布了許多團隊,這讓 Bezos 和他的助手們非常滿意。


雖然在亞馬遜沒有人工智能的中心辦公室,但的確有一個部門專門負責機器學(xué)習(xí)以及一些將新科學(xué)推進公司項目的應(yīng)用研究的推廣和支持。


核心機器學(xué)習(xí)小組由 Ralf Herbrich 領(lǐng)導(dǎo),在 2012 年被亞馬遜引入之前,他曾在微軟的 Bing 團隊工作,然后在 Facebook 工作了一年。


他說,在公司內(nèi)部「有一個擁有這個社區(qū)的地方是很重要的。」(當然,這支團隊的任務(wù)歸納在了一份 Bezos 批準的充滿抱負的六頁提案上。)


他的部分職責包括培育亞馬遜快速增長的機器學(xué)習(xí)文化。由于該公司以客戶為中心的思路——解決問題而不是進行理論研究——亞馬遜的高管們承認,他們的招聘工作總是傾向于那些對構(gòu)建新事物感興趣的人,而不是那些追求科學(xué)突破的人。


Facebook 的 LeCun 則以另一種方式表達了同樣觀點:「你即使不領(lǐng)導(dǎo)知識的先鋒,也可以做得很好。」


但亞馬遜也在跟隨 Facebook 和谷歌的領(lǐng)導(dǎo),培訓(xùn)其員工在人工智能方面更加熟稔。它開設(shè)了關(guān)于機器學(xué)習(xí)策略的內(nèi)部課程,主辦了一系列內(nèi)部專家的講座。從 2013 年開始,該公司每年春天都會在其總部舉辦一場內(nèi)部機器學(xué)習(xí)會議,這是一種亞馬遜內(nèi)部版的 NIPS,NIPS 是最重要的學(xué)術(shù)機器學(xué)習(xí)平臺。


「剛開始的時候,亞馬遜的機器學(xué)習(xí)會議只有幾百人,而現(xiàn)在已經(jīng)有成千上萬的人了,」Herbrich 說。


「我們在西雅圖最大的會議室容量也不夠,所以我們把在那里舉辦,然后在園區(qū)里的其他 6 個會議室直播!箒嗰R遜的一名高管說,如果它變得更大,而不是把它稱為一個亞馬遜的機器學(xué)習(xí)活動,而可以被稱為亞馬遜本身了。


Herbrich 的團隊繼續(xù)將機器學(xué)習(xí)推進到公司的一切新業(yè)務(wù)。


例如,執(zhí)行團隊想要更好地預(yù)測在某一客戶的訂單中應(yīng)該選取 8 個可選盒子尺寸中的哪一個時,他們求助于 Herbrich 的團隊。


「那個實現(xiàn)團隊不需要有自己的科學(xué)團隊,但它需要這些算法,并且需要能夠很容易地使用它們!顾f。


在另一個例子中,David Limp 指出了亞馬遜對有多少客戶可能會購買新產(chǎn)品的預(yù)測方法的轉(zhuǎn)變!肝乙呀(jīng)在消費電子產(chǎn)品領(lǐng)域工作了 30 年,其中有 25 年的預(yù)測都是用(人類的)判斷、電子表格和一些魔術(shù)球和飛鏢做的!顾f,「自從我們開始用機器學(xué)習(xí)來進行預(yù)測,我們的錯誤率明顯地下降了!


不過,有時候 Herbrich 的團隊還是會將尖端科學(xué)應(yīng)用到一個問題上。


該公司的雜貨遞送服務(wù) Amazon Fresh 已經(jīng)運營了 10 年,但它需要一種更好的方式來評估水果和蔬菜的質(zhì)量——人類的速度太慢且標準不一致。他在柏林的團隊建立了滿是傳感器的硬件和新的算法,為系統(tǒng)加入了觸摸和聞到食物的能力。


「三年后,我們到達了一個原型機階段,可以(比以前)更可靠地判斷質(zhì)量」。


當然,這樣的進步會滲透到整個亞馬遜生態(tài)系統(tǒng)中。


以 Amazon Go 為例,這是一家位于其總部大樓內(nèi)剛剛開始向公眾開放的、以深度學(xué)習(xí)為動力的無人收銀雜貨店!缸鳛 AWS 的客戶,我們受益于它的規(guī)模,」Amazon Go 的技術(shù)副總裁 Dilip Kumar 說,「但 AWS 也同樣是個受益者!


他舉了 Amazon Go 獨特的流媒體數(shù)據(jù)系統(tǒng)的例子,該系統(tǒng)通過數(shù)百臺攝像機記錄顧客的購物活動。他的團隊所策劃的創(chuàng)新幫助影響了一項稱為「Kinesis」的 AWS 服務(wù),該服務(wù)讓用戶將視頻從多個設(shè)備傳送到亞馬遜云,在那里他們可以處理、分析和使用它來進一步推進他們的機器學(xué)習(xí)。


即使亞馬遜的某項服務(wù)尚未使用公司的機器學(xué)習(xí)平臺,它也可以成為這個過程的積極參與者。


亞馬遜的 Prime Air 無人機送貨服務(wù)仍處于原型階段,它必須單獨構(gòu)建人工智能,因為無人機無法依靠云端來計算。但它仍能從飛輪上獲得巨大的收益,無論是從公司的其他方面獲取知識,還是弄清楚使用什么工具。


「我們認為這是一個菜單——每個人都在分享他們能提供的菜肴,」Prime Air 副總裁 Gur Kimchi 說。他預(yù)計,他的團隊最終將擁有自己的美味菜單。


「我們的經(jīng)驗教訓(xùn)和我們在 Prime Air 上解決的問題無疑是對亞馬遜的其他團隊來說有用的!


事實上,這似乎已經(jīng)發(fā)生了。


「如果有人在公司的某個部門(比如 Prime Air 或 Amazon Go)看一幅圖片,他們學(xué)到了一些東西,并創(chuàng)造出一種算法,他們就會和公司里的其他人討論這個問題。于是,我的團隊中的某個人也可以使用它,比如說,弄清楚一個在在執(zhí)行中心移動的產(chǎn)品的圖像里有什么!箒嗰R遜機器人(Amazon robotics)的首席科學(xué)家 Beth Marcus 說。

 

一個以產(chǎn)品為中心的公司是否有可能超越滿是深度學(xué)習(xí)超級明星的競爭對手?


亞馬遜正為這個問題提供一個案例。


「雖然他們正在努力趕上,但他們發(fā)布的產(chǎn)品卻令人印象深刻,」艾倫人工智能研究所 (Allen Institute for Artificial Intelligence) 的首席執(zhí)行官 Oren Etzioni 說,「他們是世界級的公司,他們創(chuàng)造了世界級的人工智能產(chǎn)品!


飛輪一直在旋轉(zhuǎn),我們尚未看到很多正在準備中的「六頁提案」的影響。但是,更多的數(shù)據(jù),意味著更多的顧客。更好的平臺,意味著更多的人才。


「 Alexa,亞馬遜在人工智能領(lǐng)域現(xiàn)在做得怎么樣?」


回答么?就是 Jeff Bezos 尖尖的笑聲了。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像