2022年11月,OpenAI推出的新型AI聊天機(jī)器人工具ChatGPT在一夜之間火爆全球互聯(lián)網(wǎng),引來了無數(shù)人的關(guān)注,上線僅兩個月,ChatGPT的月活躍用戶數(shù)就已突破了1億,成為歷史上增長最快的消費者應(yīng)用程序。而截至2023年4月,ChatGPT的全球訪問量再創(chuàng)新高,達(dá)到17.6億次,僅次于谷歌、百度等搜索引擎。
面對強(qiáng)勢崛起的ChatGPT,“國產(chǎn)ChatGPT”如臨大敵,瘋狂涌入大模型賽道。據(jù)不完全統(tǒng)計,目前國內(nèi)已有超過40家企業(yè)、機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃,其中不乏百度、阿里巴巴、京東、華為等各個領(lǐng)域的頭部企業(yè)。
大模型是指具有巨量參數(shù)數(shù)量的人工神經(jīng)網(wǎng)絡(luò)模型,通常需要在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練,并且需要使用大量的計算資源進(jìn)行優(yōu)化和調(diào)整,主要用于解決復(fù)雜的自然語言處理、計算機(jī)視覺和語音識別等任務(wù)。簡而言之,大模型是ChatGPT及類ChatGPT產(chǎn)品的底層基礎(chǔ)設(shè)施。
入局大模型賽道已勢在必行,在ChatGPT的誕生地美國,已有行業(yè)受到了ChatGPT的嚴(yán)重沖擊。根據(jù)網(wǎng)絡(luò)流量數(shù)據(jù)網(wǎng)站SimilarWeb的調(diào)研報告,2023年3月,GPT-4、New Bing等產(chǎn)品陸續(xù)上線后,美國在線教育公司Chegg網(wǎng)站轉(zhuǎn)化訪問量同比暴跌89%。與此同時,Chegg還面臨著經(jīng)營業(yè)績下滑、股價腰斬等不利情況。
而對于中國企業(yè)而言,在ChatGPT的沖擊正式到來之前,布局大模型業(yè)務(wù)已經(jīng)從一道選擇題變成了必答題。隨著越來越多的企業(yè)入局其中,大模型之戰(zhàn)已經(jīng)悄然打響。
01.“國產(chǎn)ChatGPT”百花齊放
國內(nèi)大模型行業(yè)正進(jìn)入“白熱化”競爭狀態(tài)。
百度打響了國內(nèi)大模型競賽的第一槍。3月16日,被稱為中國版ChatGPT的“文心一言”正式發(fā)布,并展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力。
緊接著, 在3月27日,百度又正式推出了“文心千帆”大模型平臺。文心千帆大模型平臺整合了百度全套文心大模型、相應(yīng)的開發(fā)工具鏈,未來還將支持第三方的開源大模型。
同樣跑步入局的還有阿里巴巴。4月11日,在2023阿里云峰會上,阿里巴巴正式推出大模型“通義千問”。
通義千問是國內(nèi)第二款類ChatGPT產(chǎn)品,基于統(tǒng)一學(xué)習(xí)范式OFA等底層技術(shù)打造,具備了能搞定多種任務(wù)的能力:不引入新增結(jié)構(gòu),單一模型即可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10余項單模態(tài)和跨模態(tài)任務(wù)。升級后,更是可以處理超過包括語音和動作在內(nèi)的30多種跨模態(tài)任務(wù)。
戰(zhàn)況大有愈演愈烈之勢。同樣在4月,360集團(tuán)推出了基于360GPT大模型開發(fā)的人工智能產(chǎn)品矩陣“360 智腦”落地搜索場景;昆侖萬維宣布聯(lián)合奇點智源研發(fā)“天工3.5”國產(chǎn)大語言模型,定位為“中國第一個真正實現(xiàn)智能涌現(xiàn)”的大模型產(chǎn)品,具備智能問答、聊天互動、文本生成等多種應(yīng)用功能以及豐富的科學(xué)、技術(shù)、文化、藝術(shù)和歷史知識儲備;商湯科技也發(fā)布了自研大模型系統(tǒng)“日日新SenseNova”,內(nèi)含AI數(shù)字人視頻生成平臺“如影”,3D內(nèi)容生成平臺“瓊宇”和“格物”,類ChatGPT產(chǎn)品“SenseChat”等產(chǎn)品。
進(jìn)入5月以來,大模型領(lǐng)域的戰(zhàn)火進(jìn)一步蔓延,多個大模型產(chǎn)品陸續(xù)面世。
5月5日,網(wǎng)易有道發(fā)布了基于“子曰”大模型開發(fā)的AI口語老師劇透視頻,介紹其基于教育場景的類ChatGPT產(chǎn)品布局;5月6日,科大訊飛發(fā)布認(rèn)知大模型“訊飛星火”,并預(yù)計2023年內(nèi)還會進(jìn)行三次升級,分批次增強(qiáng)數(shù)學(xué)能力、補足代碼能力,全面對標(biāo)ChatGPT;同一天,淘云科技發(fā)布了阿爾法蛋兒童認(rèn)知大模型,為孩子在練表達(dá)、塑情商、啟創(chuàng)造、助學(xué)習(xí)等方面帶來全新交互體驗。
除此之外,騰訊、華為、京東、字節(jié)跳動、小米等也均已推出了大模型產(chǎn)品。
在國際上,大模型的戰(zhàn)況同樣激烈且焦灼。
4月13日,亞馬遜云科技發(fā)布多款A(yù)I產(chǎn)品,其中包括AI大模型服務(wù)Amazon Bedrock、人工智能計算實例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”(Titan)AI大模型等;4月17 日,特斯拉CEO埃隆·馬斯克表示即將推出OpenAI的競爭對手TruthGPT,在此之前,其已成立了一家名為X.AI的新人工智能公司;5月11日,谷歌在I/O開發(fā)者大會上推出新一代大模型,對180個國家和地區(qū)開放聊天機(jī)器人Bard,發(fā)布對標(biāo)Office全家桶的Workspace,在安卓系統(tǒng)中也增加了相關(guān)功能。
不過,盡管參與者眾多,但截至目前,大模型產(chǎn)品距離真正實現(xiàn)落地還相差甚遠(yuǎn)。
02.商業(yè)化高墻難越
大模型賽道的想象空間巨大。根據(jù)市場研究機(jī)構(gòu)MarketsandMarkets的報告數(shù)據(jù),全球生成式人工智能市場規(guī)模預(yù)計將從2023年的113億美元增長到2028年的518億美元,預(yù)測期內(nèi)復(fù)合年增長率為35.6%。由于云存儲的創(chuàng)新使數(shù)據(jù)易于訪問,以及人工智能和深度學(xué)習(xí)的發(fā)展,預(yù)計生成式人工智能市場在預(yù)測期內(nèi)將以顯著的速度增長。
但不容忽視的是,現(xiàn)階段運行大模型仍然十分燒錢。
英偉達(dá)披露的信息顯示,訓(xùn)練一次1750億參數(shù)的GPT-3需要34天、使用1024張A100 GPU芯片,同時,OpenAI可能至少需要3.24萬張A100用于日常推理,顯著高于此前訓(xùn)練底層模型時的用量,由此推算,ChatGPT硬件成本達(dá)8億美元以上。
近期,OpenAI被爆出去年虧損額翻倍,達(dá)到5.4億美元左右,資金主要用于支撐ChatGPT的運行等。OpenAI CEO山姆·阿爾特曼更是坦言,OpenAI可能需要在未來幾年嘗試籌集多達(dá)1000億美元的資金,用來開發(fā)足夠先進(jìn)的通用AI,同時維持公司的正常運轉(zhuǎn)。
在大模型行業(yè),企業(yè)瘋狂燒錢已是常態(tài)。國盛證券在研報中指出,通過測算,2800億參數(shù)量的大模型預(yù)訓(xùn)練成本約為200萬美元/次,谷歌的PaLM號稱擁有5400億參數(shù),單次預(yù)訓(xùn)練成本將高達(dá)1200萬美元。
大模型一邊陷入到燒錢泥潭中無法自拔,一邊還面臨商業(yè)化難以落地的困境。
以O(shè)penAI為例,ChatGPT迅速走紅后,其商業(yè)模式主要分為兩個部分,即C端推出訂閱制會員和B端提供調(diào)用API接口。
具體而言,針對C端市場,OpenAI推出ChatGPT Plus訂閱計劃,每月收費20美元,相較于免費版本,即便在高峰時段用戶也能正常訪問ChatGPT,響應(yīng)時間更快,并且可以優(yōu)先使用新功能等。而針對B端市場,OpenAI發(fā)布了ChatGPT API,開發(fā)者可以將ChatGPT集成到產(chǎn)品中,以更加高效地發(fā)揮出價值。
不過,目前ChatGPT的商業(yè)化收效甚微,短期內(nèi)難以覆蓋預(yù)訓(xùn)練成本,但ChatGPT潛在的商業(yè)化能力已讓不少企業(yè)感受到壓力。谷歌CEO桑達(dá)爾·皮查伊認(rèn)為,谷歌的主要搜索業(yè)務(wù)可能首次面臨嚴(yán)重威脅,因此其召開會議重新定義AI戰(zhàn)略,并計劃在年內(nèi)發(fā)布20款支持AI的新產(chǎn)品。
目前,OpenAI還在探索商業(yè)化道路,其預(yù)計2023年收入為2億美元,2024年收入或超過10億美元,但并沒有給出明確的盈利時間。
一位AI行業(yè)人士向DoNews(ID:ilovedonews)表示,除了OpenAI的探索方向外,業(yè)內(nèi)在討論的商業(yè)化方向主要針對B端,包括聚焦并進(jìn)入垂直領(lǐng)域,如醫(yī)療、教育、金融等,以及促進(jìn)ChatGPT云端化,打造云端ChatGPT模型與工具集。
雖然商業(yè)化高墻難越,但投資機(jī)構(gòu)仍然十分看好大模型的商業(yè)化前景,比如紅杉資本預(yù)測,ChatGPT這類生成式人工智能工具,讓機(jī)器開始大規(guī)模涉足知識類和創(chuàng)造性工作,這涉及數(shù)十億人的工作,未來預(yù)計能夠產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價值。
03.“國產(chǎn)ChatGPT”何去何從
ChatGPT爆火的同時,爭議也不斷涌現(xiàn)。
美國率先宣布“封殺”ChatGPT。3月30日,美國科技倫理組織“人工智能與數(shù)字政策中心”(CAIDP)要求美國聯(lián)邦貿(mào)易委員會(FTC)禁止OpenAI發(fā)布新的商業(yè)版GPT-4,理由是GPT-4存在偏見和欺騙性,對隱私和公共安全構(gòu)成了風(fēng)險。
美國參議院司法委員會下屬的隱私、技術(shù)和法律小組委員會發(fā)布聲明稱,將于5月16日圍繞AI在各個領(lǐng)域的普及,可能需要哪些法律來保障普通人的利益展開探討。屆時,山姆·阿爾特曼將首次在美國國會作證,這被外界解讀為美國對AI監(jiān)管的進(jìn)一步升級。
其實不只美國,在全球各領(lǐng)域頭部企業(yè)對大模型業(yè)務(wù)的追逐下,已經(jīng)有越來越多國家加入監(jiān)管行列。
除美國外,意大利、西班牙、德國等均對大模型發(fā)展密切關(guān)注,其中,意大利一度禁止OpenAI在意大利境內(nèi)開展業(yè)務(wù),相關(guān)監(jiān)管機(jī)構(gòu)認(rèn)為,ChatGPT及其母公司OpenAI違反了《歐洲通用數(shù)據(jù)保護(hù)條例》中的部分規(guī)定。
與此同時,國家網(wǎng)信辦也發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,明確了生成式人工智能的定義,以及相關(guān)產(chǎn)品和服務(wù)提供者的合規(guī)義務(wù),對生成式人工智能進(jìn)行專項監(jiān)管。
在監(jiān)管趨嚴(yán)之下,“國產(chǎn)ChatGPT”應(yīng)該何去何從?在征求意見稿中,明確規(guī)定“國產(chǎn)ChatGPT”需注重數(shù)據(jù)隱私安全,不能非法獲取、披露、利用個人信息和隱私、商業(yè)秘密,不可侵犯知識產(chǎn)權(quán);“國產(chǎn)ChatGPT”生成的內(nèi)容應(yīng)當(dāng)體現(xiàn)社會主義核心價值觀,不能生成歧視性的內(nèi)容等等。
值得一提的是,各國監(jiān)管趨嚴(yán)并非意在制約大模型行業(yè)發(fā)展,而是要在合規(guī)框架下可控發(fā)展,對于“國產(chǎn)ChatGPT”而言,加強(qiáng)監(jiān)管、凈化行業(yè)環(huán)境、驅(qū)逐不良玩家可能會帶來發(fā)展上的限制,但對行業(yè)的長期發(fā)展卻大有裨益。如何合規(guī)發(fā)展,已成為“國產(chǎn)ChatGPT”的長期命題。