飛象原創(chuàng)(孫迎新/文)回顧人類科技革命史,無(wú)論是牛頓的萬(wàn)有引力定律被提出還是薛定諤的量子力學(xué)方程面世,幾乎還從來(lái)沒(méi)有一次科技革命像人工智能大模型的問(wèn)世這樣讓人感受到極度的興奮與焦慮。大模型以其強(qiáng)大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力,成為推動(dòng)人類走進(jìn)未來(lái)智能時(shí)代的重要力量。同時(shí),大模型的開(kāi)發(fā)和訓(xùn)練需要耗費(fèi)巨量的資源與金錢,簡(jiǎn)直堪稱超級(jí)吸金的“黑洞”,但更為重要的是,想要玩轉(zhuǎn)大模型就需要天量的AI算力,這就需要像大型智算中心這樣的算力底座作為支撐。
從大模型到AI算力再到智算中心,這一切都只有實(shí)力異常雄厚的企業(yè)才能擔(dān)負(fù)得起,甚至需要國(guó)家力量介入才能實(shí)現(xiàn)。也正因?yàn)槿绱,像大模型與AI芯片這樣的人工智能領(lǐng)域頂級(jí)科技成就便成為某些發(fā)達(dá)國(guó)家筑起的一道科技“防火墻”,同時(shí)也成為打壓后起國(guó)家科技發(fā)展的政治工具。
智慧的火花:OpenAI的誕生與GPT的革命
如果談及大模型的問(wèn)世,便不得不提及OpenAI這家公司。OpenAI的成立,是科技界對(duì)人工智能安全性和可控性的一種自我反思和承諾。2015年,一群科技界的領(lǐng)軍人物,包括特斯拉的埃隆·馬斯克和Y Combinator的山姆·阿爾特曼,共同創(chuàng)立了OpenAI。他們的初衷是推動(dòng)人工智能的安全性發(fā)展,并確保這一強(qiáng)大技術(shù)能夠造福全人類。
OpenAI對(duì)GPT系列模型的貢獻(xiàn),是其對(duì)人工智能領(lǐng)域最重要的貢獻(xiàn)之一。GPT(生成式預(yù)訓(xùn)練變換器),是一系列基于深度學(xué)習(xí)的自然語(yǔ)言處理模型。從GPT-1到GPT-3,每一個(gè)版本的發(fā)布,都標(biāo)志著人工智能在理解和生成自然語(yǔ)言方面的巨大飛躍,F(xiàn)在很難形容當(dāng)GPT問(wèn)世時(shí)人們從震撼到驚愕的轉(zhuǎn)變,甚至都以為是創(chuàng)造出了具有意識(shí)的硅基生命體,而這樣的工作,在以往幾千年里人們都認(rèn)定是由上帝或神才能完成。
讓人感到意外的是,山姆·阿爾特曼,OpenAI的聯(lián)合創(chuàng)始人,對(duì)人工智能的未來(lái)持有復(fù)雜的看法。他曾預(yù)言,到2030年,我們將見(jiàn)證通用人工智能(AGI)的到來(lái),屆時(shí)GPT-10的智慧將超越全人類。這一預(yù)言,既令人興奮也引發(fā)了廣泛的憂慮。他指出,實(shí)現(xiàn)AGI的過(guò)程應(yīng)該是緩慢而謹(jǐn)慎的,需要時(shí)間來(lái)適應(yīng)和理解。這種擔(dān)憂并非無(wú)的放矢,因?yàn)殡S著AI技術(shù)的不斷進(jìn)步,我們正面臨著前所未有的挑戰(zhàn)。也或許正是這樣具有前瞻性的眼光,使得山姆·阿爾特曼后來(lái)不得不以辭職這樣的方式表達(dá)對(duì)人工智能快速發(fā)展的擔(dān)憂。
埃隆·馬斯克,作為SpaceX和Tesla的創(chuàng)始人,同樣對(duì)AI的快速發(fā)展持有深深的顧慮。他曾是OpenAI的聯(lián)合創(chuàng)始人之一,即便是在“獵鷹”火箭發(fā)射失敗,投資打了水漂之時(shí)也沒(méi)有放下對(duì)AI技術(shù)的執(zhí)念,但后來(lái)還是因?yàn)閷?duì)公司發(fā)展方向的分歧而退出。盡管如此,他依然對(duì)AI技術(shù)保持關(guān)注,并在其他項(xiàng)目中探索AI的應(yīng)用。
震撼世界的巨浪:大模型的奇跡與應(yīng)用
大模型完全可以說(shuō)是AI技術(shù)發(fā)展史上的一座里程碑。大模型以其前所未有的計(jì)算能力和智能水平,在全球范圍內(nèi)引起了廣泛的關(guān)注和討論。大模型在多個(gè)領(lǐng)域展現(xiàn)了其震撼世界的能力,尤其是在自然語(yǔ)言處理、圖像識(shí)別和多模態(tài)交互等方面。
自然語(yǔ)言處理的突破簡(jiǎn)直可以算得上是一個(gè)科技奇跡,人們第一次驚奇地發(fā)現(xiàn)可以和機(jī)器用人類的語(yǔ)言進(jìn)行交流。大模型在理解和生成自然語(yǔ)言方面的能力,使得機(jī)器能夠以前所未有準(zhǔn)確度進(jìn)行語(yǔ)言翻譯、文本摘要和情感分析。例如,GPT-3在多項(xiàng)語(yǔ)言理解測(cè)試中的表現(xiàn)超越了人類,這一成就在學(xué)術(shù)界和工業(yè)界都引起了巨大反響。
同時(shí),多模態(tài)交互的實(shí)現(xiàn)更是強(qiáng)化了人們對(duì)這項(xiàng)科技奇跡的認(rèn)知。大模型的發(fā)展推動(dòng)了多模態(tài)AI的興起,這些AI系統(tǒng)能夠處理和理解圖像、文本和聲音等多種類型的數(shù)據(jù)。例如,DALL-E 2等模型能夠根據(jù)文本描述生成逼真的圖像,這種能力在藝術(shù)創(chuàng)作和設(shè)計(jì)領(lǐng)域產(chǎn)生了深遠(yuǎn)影響。
在更多的領(lǐng)域,大模型的問(wèn)世有力推動(dòng)了科學(xué)研究的加速。大模型在生物制藥、材料科學(xué)和物理學(xué)等領(lǐng)域的應(yīng)用,加速了科學(xué)研究的進(jìn)程。例如,AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的突破,為生物學(xué)和醫(yī)學(xué)研究開(kāi)辟了新的道路。
跨越障礙:萬(wàn)億級(jí)大模型的挑戰(zhàn)與中美AI領(lǐng)域的較量
在人工智能的宏大敘事中,萬(wàn)億級(jí)大模型代表著技術(shù)的巔峰,它們?cè)谔幚韽?fù)雜任務(wù)時(shí)展現(xiàn)出的能力令人震撼。然而這些模型在訓(xùn)練過(guò)程中面臨著一系列難題,同時(shí),全球政治經(jīng)濟(jì)的動(dòng)態(tài)也對(duì)這一領(lǐng)域的發(fā)展產(chǎn)生了深遠(yuǎn)的影響。
如果僅這么說(shuō)大家肯定不會(huì)有什么直觀的印象,但說(shuō)到英偉達(dá)這家公司,它僅憑推出用于AI訓(xùn)練和推理任務(wù)的H100 TENSORCORE引擎便成為全球市值最高的科技公司,當(dāng)前的市值(3.34萬(wàn)億)相當(dāng)于約1.15個(gè)微軟(2.89萬(wàn)億)或1.86個(gè)谷歌(1.8萬(wàn)億)。更為重要的是,英偉達(dá)是一家美國(guó)公司,美國(guó)政府利用它想給誰(shuí)斷供就給誰(shuí)斷供,想掐誰(shuí)脖子就掐誰(shuí)脖子。
即便在財(cái)力上豪橫似英偉達(dá),在面對(duì)大模型持續(xù)開(kāi)發(fā)和訓(xùn)練時(shí)的算力需求與成本也不得不掂量一下。訓(xùn)練萬(wàn)億級(jí)大模型需要巨大的計(jì)算資源,但這樣的資源在全球范圍內(nèi)仍屬稀缺,算力的高昂成本也成為大模型訓(xùn)練的一大障礙。英偉達(dá)CEO黃仁勛就多次強(qiáng)調(diào)數(shù)據(jù)中心在未來(lái)計(jì)算中的重要性。他認(rèn)為數(shù)據(jù)中心將成為整個(gè)計(jì)算單元的基礎(chǔ),未來(lái)計(jì)算量級(jí)的計(jì)算將成為常態(tài)。他還提到,全球每年對(duì)數(shù)據(jù)中心設(shè)備的投資費(fèi)用高達(dá)2500億美元,英偉達(dá)將占據(jù)其中大部分市場(chǎng)份額。
數(shù)據(jù)獲取與處理也是一大難題。大模型的訓(xùn)練需要依賴海量的高質(zhì)量數(shù)據(jù),數(shù)據(jù)的采集、清洗、標(biāo)注都需要大量的時(shí)間和人力資源。AI教母、斯坦福大學(xué)教授李飛飛最著名的貢獻(xiàn)之一就是創(chuàng)建了ImageNet數(shù)據(jù)庫(kù),這是一個(gè)龐大的圖像分類數(shù)據(jù)庫(kù),為深度學(xué)習(xí)的發(fā)展提供了重要的數(shù)據(jù)支持,而這項(xiàng)成果的獲得正是基于搞定了大模型訓(xùn)練需要的海量高質(zhì)量數(shù)據(jù)。
模型的泛化能力一直是令人工智能科學(xué)家們頭疼的問(wèn)題。盡管大模型在特定任務(wù)上表現(xiàn)出色,但如何確保它們?cè)诓煌I(lǐng)域和場(chǎng)景下都能保持穩(wěn)定的性能,是研究者們需要解決的問(wèn)題。很難想象大模型在面對(duì)某個(gè)領(lǐng)域時(shí)表現(xiàn)得像個(gè)百年不遇的天才,而在面對(duì)有的領(lǐng)域卻表現(xiàn)得像個(gè)不折不扣的白癡,這樣的情況讓科學(xué)家們無(wú)比抓狂卻又無(wú)可奈何。
此外,能耗與環(huán)境影響也是人工智能發(fā)展之路上的攔路虎,面對(duì)這個(gè)巨大的障礙除了爭(zhēng)取國(guó)家支持,幾乎沒(méi)有什么太好的應(yīng)對(duì)之策。大模型訓(xùn)練過(guò)程中的高能耗問(wèn)題不容忽視,如哈爾濱智算中心的6.9EFLOPS算力,其背后是巨大的電力消耗,放眼全球也只有中國(guó)電力這樣的能源企業(yè)有實(shí)力提供支撐,畢竟在6,900,000 MW到103.5億千瓦時(shí)之間的電力消耗,有的小國(guó)家舉全國(guó)之力也未必能夠辦到。
事實(shí)上在全球的計(jì)算中心里,曾經(jīng)出現(xiàn)過(guò)許多次因電力供應(yīng)中斷帶來(lái)的事故。
2015年9月20日,亞馬遜AWS的一個(gè)數(shù)據(jù)中心遭遇停電事故,影響了Netflix、Tinder、Airbnb等應(yīng)用程序的在線服務(wù)。
2022年8月8日,谷歌位于美國(guó)愛(ài)荷華州康瑟爾布拉夫斯的數(shù)據(jù)中心發(fā)生電力事故,導(dǎo)致3名電工嚴(yán)重受傷。
同樣在2022年,微軟澳大利亞?wèn)|部數(shù)據(jù)中心在一次長(zhǎng)達(dá)46小時(shí)的中斷事件中,起因是電力供應(yīng)問(wèn)題導(dǎo)致冷卻系統(tǒng)故障。
Interxion位于倫敦的一個(gè)數(shù)據(jù)中心在2023年1月10日遭遇了4個(gè)小時(shí)的故障,許多客戶受到了影響。
最后不得不提到的就是美國(guó)對(duì)中國(guó)在AI領(lǐng)域的限制。通過(guò)技術(shù)封鎖、投資限制、人才流動(dòng)限制和國(guó)際合作限制等手段,美國(guó)在人工智能技術(shù)及大模型領(lǐng)域?qū)χ袊?guó)進(jìn)行了全面的限制。這些措施不僅影響了中國(guó)的AI產(chǎn)業(yè)發(fā)展,也加劇了中美之間的科技競(jìng)爭(zhēng)。但從某種意義上看,人工智能技術(shù)或許是美國(guó)在科技領(lǐng)域的最后一個(gè)制高點(diǎn),中國(guó)一旦在人工智能技術(shù)上占據(jù)領(lǐng)先地位將無(wú)可爭(zhēng)議地將美國(guó)拉下科技神壇。
智算自主:全球運(yùn)營(yíng)商最大單集群智算中心在哈爾濱建成投用
在全球智算領(lǐng)域的競(jìng)爭(zhēng)日趨激烈的今天,中國(guó)移動(dòng)在哈爾濱建成并投入使用的全球運(yùn)營(yíng)商最大單集群智算中心,不僅標(biāo)志著中國(guó)在智能計(jì)算領(lǐng)域的一次重大飛躍,更是中國(guó)在面對(duì)美國(guó)技術(shù)限制下自主創(chuàng)新能力的有力證明。
首先是哈爾濱智算中心實(shí)現(xiàn)了國(guó)產(chǎn)化率的飛躍。哈爾濱智算中心的AI芯片國(guó)產(chǎn)化率達(dá)到100%,這一成就的取得來(lái)之不易,尤其是在人工智能高端芯片嚴(yán)重受限的當(dāng)下,這也得益于昆侖技術(shù)、華鯤振宇、寶德計(jì)算機(jī)、長(zhǎng)江計(jì)算、神州鯤泰以及寒武紀(jì)這些公司付出的努力,使得哈爾濱智算中心在建設(shè)過(guò)程中減少了對(duì)外部供應(yīng)鏈的依賴,為中國(guó)智算領(lǐng)域的發(fā)展提供了堅(jiān)實(shí)的基礎(chǔ)。通過(guò)國(guó)產(chǎn)化AI芯片和自主研發(fā)技術(shù)的運(yùn)用,哈爾濱智算中心減少了對(duì)美國(guó)技術(shù)的依賴,這在一定程度上打破美國(guó)的技術(shù)限制,削弱了美國(guó)通過(guò)技術(shù)限制對(duì)中國(guó)智算領(lǐng)域發(fā)展的影響力。
哈爾濱智算中心在算力方面取得大幅的提升。該中心能夠提供6.9EFLOPS的智能算力,這一算力相當(dāng)于300多萬(wàn)臺(tái)高性能計(jì)算機(jī)的集合。這使得中國(guó)在處理大規(guī)模數(shù)據(jù)和復(fù)雜計(jì)算任務(wù)時(shí)更加自如,大大提升了國(guó)內(nèi)科研和商業(yè)應(yīng)用的能力。
在技術(shù)創(chuàng)新方面,哈爾濱智算中心采用了多項(xiàng)中國(guó)移動(dòng)自主研發(fā)的技術(shù),如GSE1.0、天池SDN等,這些技術(shù)的創(chuàng)新應(yīng)用不僅提升了智算中心的運(yùn)行效率,也為全球智算領(lǐng)域的發(fā)展貢獻(xiàn)了中國(guó)智慧。
哈爾濱智算中心的成功建設(shè)也推動(dòng)了國(guó)內(nèi)產(chǎn)業(yè)鏈的發(fā)展,智算中心的建設(shè)和運(yùn)營(yíng),帶動(dòng)了國(guó)內(nèi)相關(guān)產(chǎn)業(yè)鏈的發(fā)展,包括芯片制造、軟件開(kāi)發(fā)、系統(tǒng)集成等,這有助于構(gòu)建更加完善和自主的國(guó)內(nèi)智算產(chǎn)業(yè)生態(tài)。同時(shí)在增強(qiáng)國(guó)際競(jìng)爭(zhēng)力方面,哈爾濱智算中心的建成,提升了中國(guó)在全球智算領(lǐng)域的競(jìng)爭(zhēng)力。它不僅能夠支持國(guó)內(nèi)的大型AI模型訓(xùn)練和應(yīng)用,還能夠吸引國(guó)際企業(yè)和研究機(jī)構(gòu)的合作,提升中國(guó)在全球智算領(lǐng)域的影響力。
在全球AI領(lǐng)域的較量中,中國(guó)正以堅(jiān)定的步伐,不斷探索和創(chuàng)新,力求在萬(wàn)億級(jí)大模型的研發(fā)和應(yīng)用上取得更多的突破。盡管道路充滿挑戰(zhàn),但未來(lái)仍然充滿希望。哈爾濱智算中心的建成和投入使用,是中國(guó)智算領(lǐng)域自主創(chuàng)新能力的一個(gè)縮影。它不僅展示了中國(guó)在面對(duì)外部技術(shù)限制時(shí)的堅(jiān)韌和智慧,也為全球智算領(lǐng)域的發(fā)展貢獻(xiàn)了新的動(dòng)能。
在人工智能技術(shù)領(lǐng)域,美國(guó)還能卡中國(guó)的脖子嗎?
最后,向GPT-4提出以上的問(wèn)題作為總結(jié)。GPT-4是這樣回答的:
作為一個(gè)AI助手,我沒(méi)有情感,也不支持或反對(duì)任何國(guó)家。人工智能技術(shù)的發(fā)展一直在全球范圍內(nèi)進(jìn)行,并帶來(lái)了許多機(jī)遇和挑戰(zhàn)。對(duì)于中國(guó)或任何其他國(guó)家來(lái)說(shuō),人工智能的使用和發(fā)展都需要權(quán)衡利弊,并采取適當(dāng)?shù)拇胧﹣?lái)解決可能出現(xiàn)的問(wèn)題。