大模型賽道上,上海如何跑在前面?
走出龍耀路地鐵站,現(xiàn)代、繁忙、藝術(shù)的上海西岸藏著答案。這里距離黃浦江濱江岸線幾百米,沿路能看見休閑的行人,更多是腳步匆忙的白領(lǐng)。方圓一公里內(nèi),坐落著騰訊、阿里、微軟、上海人工智能實(shí)驗(yàn)室、商湯、無(wú)問(wèn)芯穹、蜜度蜜巢等科技巨頭和AI大模型初創(chuàng)公司。
2024年3月下旬,上海西岸,模速空間。本文圖片除注明外,均為澎湃新聞?dòng)浾?李佳蔚 圖
就在這個(gè)地鐵站旁邊,是全國(guó)首個(gè)、上海唯一的大模型創(chuàng)新生態(tài)社區(qū)“模速空間”。2023年9月28日,經(jīng)歷38天快速籌建,模速空間正式揭牌。不到半年時(shí)間,這里吸引了60多家大模型企業(yè)入駐,其所在的徐匯區(qū)已聚集近300家產(chǎn)業(yè)鏈上下游企業(yè),規(guī)模仍在擴(kuò)大。
人工智能(AI)是上海重點(diǎn)發(fā)展的先導(dǎo)產(chǎn)業(yè),產(chǎn)業(yè)規(guī)模從2018年1340億元到2022年突破3800億元,年均增長(zhǎng)超29%;規(guī)模以上企業(yè)數(shù),也從2018年的183家增至2022年的348家。
大模型正引領(lǐng)新一輪人工智能變革,業(yè)界普遍認(rèn)為,大模型是邁向通用人工智能的核心引擎,將帶來(lái)人工智能的再次躍升,已經(jīng)成為全球科技競(jìng)爭(zhēng)焦點(diǎn)。
2024年,全國(guó)前4批次通過(guò)上線備案的大模型中,上海占據(jù)24個(gè)。其中,徐匯區(qū)獨(dú)占15個(gè),集中在模速空間。
可以說(shuō),模速空間是觀察上海AI大模型產(chǎn)業(yè)發(fā)展的最佳窗口。這片區(qū)域,正在產(chǎn)生越來(lái)越大的集聚度、顯示度、影響力。
3月下旬,2024全球開發(fā)者先鋒大會(huì)(GDC)開幕,地點(diǎn)設(shè)在上海西岸,以“模速空間——開發(fā)者的模力之源”為主題,許多人冒雨前來(lái)參加。2月份,上海市委書記陳吉寧調(diào)研上海模速空間創(chuàng)新生態(tài)社區(qū),主持召開人工智能科創(chuàng)機(jī)構(gòu)和企業(yè)座談會(huì),聽取意見建議、進(jìn)行現(xiàn)場(chǎng)辦公。
如果說(shuō)現(xiàn)在正值大模型的“風(fēng)口”——固然未來(lái)有很長(zhǎng)的征途,在這個(gè)時(shí)間節(jié)點(diǎn),上海已搶占先機(jī),跑在前列。模速空間,正力爭(zhēng)成為代表上海乃至國(guó)家贏取全球科技戰(zhàn)略競(jìng)爭(zhēng)主動(dòng)權(quán)的“主力因子”。
近日,澎湃新聞?dòng)浾咭阅K倏臻g為切入點(diǎn),實(shí)地探訪并訪談多個(gè)大模型企業(yè)、政府相關(guān)負(fù)責(zé)人,探尋上海布局AI大模型賽道的前后過(guò)程和基礎(chǔ)邏輯。
“上下樓就是上下游”
從地圖上看,模速空間所在的上海西岸,分布著上海人工智能實(shí)驗(yàn)室、期智研究院、商湯科技、阿里巴巴、騰訊等知名科研機(jī)構(gòu)和科技企業(yè),形成一個(gè)人工智能產(chǎn)研生態(tài)圈。模速空間,在其中扮演專業(yè)孵化和加速載體的角色。
模速空間寬敞的公共區(qū)域,許多人辦公、交流、開會(huì)。
3月下旬,澎湃新聞?dòng)浾咦哌M(jìn)模速空間,這里和許多創(chuàng)業(yè)園區(qū)相似,設(shè)施簡(jiǎn)潔、舒適,環(huán)境明亮,除了一個(gè)個(gè)獨(dú)立辦公空間,寬敞的公共區(qū)域經(jīng)常有人圍在一起交流,氣氛輕松。目前模速空間一期、二期共2萬(wàn)平方米已投入運(yùn)營(yíng),三期已在規(guī)劃建設(shè)中。
與其他創(chuàng)業(yè)園區(qū)不同的是,模速空間聚焦AI大模型領(lǐng)域。許多企業(yè)在門口設(shè)有公司簡(jiǎn)介,有的專注金融、商業(yè)垂類大模型,有的致力于通過(guò)大模型改善購(gòu)物體驗(yàn),一些企業(yè)面向政企服務(wù)(ToB/ToG),一些則直接服務(wù)個(gè)體用戶(ToC)。
在模速空間5樓,“金聲玉亮”合伙人查小薈剛結(jié)束上一場(chǎng)會(huì)議,在公共區(qū)域快速騰出一處角落與記者交流。她說(shuō)金聲玉亮屬于金融垂類大模型,可以視作投資顧問(wèn)的助手,幫助解答客戶有關(guān)個(gè)股、行業(yè)、大盤的相關(guān)問(wèn)題。
“我們的客戶有不少金融大V,以前他們需要每天或定期錄制短視頻投放,停更時(shí)間長(zhǎng)了就會(huì)掉粉。現(xiàn)在用數(shù)字分身,可以解決大V分身乏術(shù)的困擾。熱點(diǎn)、內(nèi)容、文本、肖像動(dòng)作,一鍵就可以生成出來(lái)!辈樾∷C說(shuō),金聲玉亮的語(yǔ)料庫(kù)24小時(shí)不間斷更新,很多金融投資熱點(diǎn),大模型能實(shí)時(shí)作答。
模速空間的很多創(chuàng)業(yè)者和查小薈一樣忙碌、干練,幾乎隨時(shí)都有研發(fā)人員用中英文召開線下或線上會(huì)議。許多中國(guó)AI技術(shù)人員每天加班加點(diǎn),鉚足了勁頭希望超越OpenAI。
模速空間所在的上海西岸。上海徐匯 圖
徐匯區(qū)科委主任張寧在接受澎湃新聞?dòng)浾卟稍L時(shí)表示,這一輪人工智能企業(yè)創(chuàng)業(yè),創(chuàng)始團(tuán)隊(duì)都有很強(qiáng)的產(chǎn)業(yè)背景:模速空間90%的創(chuàng)始團(tuán)隊(duì)有連續(xù)創(chuàng)業(yè)或大廠背景,80%的創(chuàng)始人來(lái)自頭部名校,50%的團(tuán)隊(duì)有海外經(jīng)歷。
這里流傳一句話:“上下樓就是上下游!睆垖幗忉,“在一棟樓里,聚集著大模型底層技術(shù)、應(yīng)用研發(fā)、場(chǎng)景設(shè)計(jì)、算力支持、產(chǎn)品營(yíng)銷等一條產(chǎn)業(yè)鏈上不同的企業(yè)!
政府作為“店小二”,希望在很近的物理空間范圍內(nèi),讓科研人員能找到任何想見的人、對(duì)接任何想接觸的資源、獲取任何想得到的生活服務(wù),這是模速空間要做到的“集聚”。
這種集群效應(yīng),讓入駐其中的企業(yè)深有感受!拔覀兊暮芏喾⻊(wù)對(duì)象就在這棟樓里,走到隔壁辦公室問(wèn)一問(wèn),或者在孵化器組織的活動(dòng)中就能了解行業(yè)的最新動(dòng)態(tài)!薄伴_放傳神”創(chuàng)始人張家慶把公司的加速發(fā)展,歸功于一棟樓匯聚整條產(chǎn)業(yè)鏈的空間格局。
3月29日下午,在模速空間,蜜度蜜巢負(fù)責(zé)人劉益東在為央企高管介紹企業(yè)情況。
模速空間運(yùn)營(yíng)方、上海大模型生態(tài)發(fā)展有限公司總裁陳海慈告訴澎湃新聞?dòng)浾,模速空間希望能形成一個(gè)產(chǎn)業(yè)鏈的閉環(huán)和生態(tài),產(chǎn)生上中下游的和諧共鳴!皞鹘y(tǒng)來(lái)說(shuō),其實(shí)就是提供一個(gè)空間的服務(wù),類似于大家今天講的孵化器或是眾創(chuàng)空間,該有的我都有,物業(yè)、法律、投融資等等都會(huì)覆蓋到。但是,更重要的是結(jié)合產(chǎn)業(yè)自身的特點(diǎn),能為大家提供差異化的內(nèi)容。除了那些傳統(tǒng)的東西,我們會(huì)差異化地跟各類企業(yè)發(fā)展相關(guān)的核心內(nèi)容,有針對(duì)性地解決問(wèn)題!
蜜度蜜巢總裁、蜜度CTO劉益東告訴澎湃新聞,其公司以上海人工智能實(shí)驗(yàn)室開發(fā)的書生通用大模型為基座,在政務(wù)垂類應(yīng)用上發(fā)力,自主研發(fā)的蜜巢政務(wù)大模型能為企業(yè)和政府提供知識(shí)管理、數(shù)據(jù)挖掘等服務(wù),已發(fā)布2.0版。
“‘書生’作為一個(gè)基座大模型,它也需要垂類應(yīng)用參與,我們希望能夠在這個(gè)里面成為強(qiáng)有力的生態(tài)建設(shè)者!眲⒁鏂|說(shuō)。輔助是相互的,此前蜜度蜜巢向書生·浦語(yǔ)供給了語(yǔ)料,加入由上海人工智能實(shí)驗(yàn)室牽頭的“語(yǔ)料數(shù)據(jù)聯(lián)盟”。高質(zhì)量、大規(guī)模、安全可信的語(yǔ)料數(shù)據(jù),對(duì)于大語(yǔ)言模型的訓(xùn)練和性能提升至關(guān)重要。
張寧表示,匯集60多家大模型企業(yè)的同時(shí),模速空間形成了算力調(diào)度、開放數(shù)據(jù)、評(píng)測(cè)服務(wù)、金融服務(wù)、綜合服務(wù)等全方位的創(chuàng)新創(chuàng)業(yè)保障。
舉例來(lái)說(shuō),算力是大模型公司最大的瓶頸,如果沒有以算力為核心的基礎(chǔ)設(shè)施作為支撐,大模型根本就跑不起來(lái)。模速空間的算力調(diào)度平臺(tái),對(duì)接了商湯、華為、騰訊、阿里和三大電信運(yùn)營(yíng)商等9家供應(yīng)商,超過(guò)50000張GPU卡,全力保障大模型企業(yè)算力可用、夠用、好用。
“半步優(yōu)勢(shì)”
人工智能并不是新興事物,如果從1950年代圖靈問(wèn)出“機(jī)器能否有人類智能”算起,人工智能已經(jīng)歷半個(gè)多世紀(jì)的發(fā)展。只不過(guò)直到這一兩年,隨著ChatGPT和Sora的出現(xiàn),AI大模型才終于引爆整個(gè)行業(yè),讓很多人看到“商業(yè)價(jià)值”。
2023年被稱為大模型元年,國(guó)內(nèi)外科技、AI企業(yè)紛紛下場(chǎng)試水,中國(guó)涌現(xiàn)出200多個(gè)大模型,一時(shí)間掀起“百模大戰(zhàn)”。通用大模型、行業(yè)大模型、垂類大模型……各式大模型出現(xiàn),各行各業(yè)都想從中分一杯羹。
雖然行業(yè)很熱鬧,創(chuàng)業(yè)者很興奮,但大模型具體怎么落地商用,很多人似乎摸不著頭腦。一些業(yè)內(nèi)人士發(fā)現(xiàn),與2023年ChatGPT帶來(lái)的投資熱潮不同,2024年Sora出現(xiàn)后,“大廠”顯得“冷靜”很多。
也在2023年,當(dāng)很多大廠、企業(yè)看待AI的眼光終于從“技術(shù)”轉(zhuǎn)換為“產(chǎn)業(yè)”時(shí),上海徐匯悄然打造了一個(gè)“AI生態(tài)社區(qū)”,把產(chǎn)業(yè)鏈上、中、下游聚集在一起,全方位賦能應(yīng)用。
換句話說(shuō),當(dāng)大家都在卷模型的時(shí)候,上海創(chuàng)造了一種新“玩法”。
經(jīng)過(guò)2023年的一輪“燒錢”,很多企業(yè)達(dá)成了一個(gè)新的共識(shí):通用大模型,只是少數(shù)人的游戲;下一階段,機(jī)會(huì)在行業(yè)大模型、垂類大模型。不久前百度創(chuàng)始人李彥宏也說(shuō):“大家不要去卷模型了,卷應(yīng)用吧,只有應(yīng)用直接創(chuàng)造價(jià)值”。
模速空間入駐的60多家大模型企業(yè),超過(guò)80%是來(lái)自垂類領(lǐng)域的應(yīng)用企業(yè)!按诡惪赡苁巧虡I(yè)落地過(guò)程中多數(shù)企業(yè)唯一的選擇!辈樾∷C從行業(yè)角度分析,通用大模型成本太高,產(chǎn)品很容易“中庸”,“好像什么都能做,又好像什么都做不好”,中小企業(yè)玩不起。
在產(chǎn)業(yè)風(fēng)口,模速空間能夠快速集結(jié)一批高水平的大模型企業(yè),實(shí)屬難能可貴。在張寧看來(lái),一方面,這基于上海市和徐匯區(qū)的人工智能產(chǎn)業(yè)積淀,“我們很早就抓住了人工智能的變革趨勢(shì)和產(chǎn)業(yè)風(fēng)口”。
自2017年起,上海在全國(guó)率先布局發(fā)展人工智能產(chǎn)業(yè),2018年舉辦首屆世界人工智能大會(huì),至今連續(xù)舉辦6年,徐匯一直是核心承載地。這幾年,上海AI產(chǎn)業(yè)規(guī)模從2018年1340億元躍向了2022年3821億元。
很多人以為模速空間“橫空出世”,張寧清楚背后的積累和布局。幾年前,當(dāng)人們把AI視為不賺錢的“技術(shù)”時(shí),上海已開始把它當(dāng)作產(chǎn)業(yè)賽道。一個(gè)典型的例子,就是培養(yǎng)和發(fā)展人工智能獨(dú)角獸企業(yè)商湯科技。
另一方面,張寧說(shuō),模速空間的快速誕生和壯大,相關(guān)部門作了大量調(diào)研分析、抽絲剝繭,“我們是把大模型產(chǎn)業(yè)看明白了再招商的!睆垖幷f(shuō),和AI科學(xué)家、企業(yè)家打交道多年,他發(fā)現(xiàn)對(duì)大模型創(chuàng)業(yè)者來(lái)說(shuō),好政策固然重要,但企業(yè)往往更喜歡也更需要一個(gè)能夠理解大模型產(chǎn)業(yè),也懂得如何幫助大模型企業(yè)的政府。
基于此,模速空間作為全國(guó)首個(gè)、上海唯一的大模型創(chuàng)新生態(tài)社區(qū),誕生在徐匯。張寧把這個(gè)過(guò)程謙遜地形容為“半步優(yōu)勢(shì)”。
不過(guò),即使有“半步優(yōu)勢(shì)”,在大模型日趨白熱化的競(jìng)爭(zhēng)當(dāng)中,任何城市都無(wú)法松懈。
2023年11月,上海印發(fā)《上海市推動(dòng)人工智能大模型創(chuàng)新發(fā)展若干措施(2023-2025年)》,推出一系列支持大模型創(chuàng)新發(fā)展的政策措施,推動(dòng)大模型語(yǔ)料聯(lián)盟的實(shí)體化運(yùn)作,開源一系列高質(zhì)量的語(yǔ)料數(shù)據(jù),為全球人工智能開發(fā)者創(chuàng)新創(chuàng)造構(gòu)建更良好的生態(tài)環(huán)境。
徐匯區(qū)更進(jìn)一步,推出許多增量舉措。模速空間不僅有基金投資、產(chǎn)業(yè)鏈合作、房屋租金等優(yōu)惠,初創(chuàng)企業(yè)還有“算力券”支持,這一平臺(tái)降低企業(yè)大模型訓(xùn)練門檻,牽引大模型在金融、教育、醫(yī)療、制造等典型領(lǐng)域的垂直應(yīng)用。
招商優(yōu)質(zhì)企業(yè)的同時(shí),上海積極吸引青年人才。2024年3月初,徐匯區(qū)委書記曹立強(qiáng)親自帶隊(duì),組織30余家高科技領(lǐng)域的企事業(yè)單位赴清華北大招聘,參與招聘企業(yè)超過(guò)1/3屬于人工智能領(lǐng)域。
創(chuàng)新成果涌現(xiàn)
圍繞模速空間,目前上海西岸已誕生4個(gè)底座基礎(chǔ)大模型,即上海人工智能實(shí)驗(yàn)室的書生通用大模型、商湯的“日日新”senseNova大模型體系、MINIMAX-ABAB大模型、界躍星辰大模型。垂類應(yīng)用更多,相關(guān)產(chǎn)品已達(dá)百余個(gè)。
3月23日,2024全球開發(fā)者先鋒大會(huì)(GDC)在徐匯濱江開幕。上海徐匯 圖
3月23日,2024全球開發(fā)者先鋒大會(huì)上,上海市副市長(zhǎng)陳杰談道,上海大模型創(chuàng)新成果不斷涌現(xiàn),上海人工智能實(shí)驗(yàn)室開發(fā)的“書生浦語(yǔ)”大模型開源發(fā)布,多款人形機(jī)器人(11.000, 0.15, 1.38%)也即將發(fā)布。他還提到,大模型產(chǎn)業(yè)載體持續(xù)拓展,模速空間已吸引60多家大模型企業(yè)入駐。
作為科研一線代表,上海人工智能實(shí)驗(yàn)室主任助理、領(lǐng)軍科學(xué)家喬宇表示:“大模型目前正在朝多模態(tài)方向演進(jìn),我們建立了一個(gè)具備知識(shí)、對(duì)齊、價(jià)值3個(gè)層面的新的多模態(tài)大模型評(píng)測(cè)體系,這將為未來(lái)大模型的發(fā)展以及評(píng)測(cè)提供新的參考和引領(lǐng)!
在這次大會(huì)上,階躍星辰發(fā)布了該公司Step系列通用大模型,包括Step-1千億參數(shù)語(yǔ)言大模型,Step-1V千億參數(shù)多模態(tài)大模型,以及Step-2萬(wàn)億參數(shù)MoE語(yǔ)言大模型預(yù)覽版——這也是國(guó)內(nèi)初創(chuàng)公司里首個(gè)萬(wàn)億參數(shù)大模型。
上海階躍星辰智能科技有限公司CEO姜大昕是微軟前全球副總裁,他說(shuō),模型的參數(shù)從千億到萬(wàn)億,數(shù)量上提升了一個(gè)量級(jí),在難度上也對(duì)算力、系統(tǒng)、數(shù)據(jù)、算法各方面提出了挑戰(zhàn)。
澎湃新聞注意到,無(wú)論上海人工智能實(shí)驗(yàn)室、商湯、界躍星辰等基礎(chǔ)大模型企業(yè),還是蜜度蜜巢、金聲玉亮等垂類模型初創(chuàng)企業(yè),目前發(fā)展速度和更新迭代都非常快,并且開始收獲商業(yè)上的成功。
商湯科技,基于SenseCore商湯大裝置提供的算力,在四方體的不同立面上呈現(xiàn)出與平面圖像一樣的畫面。
在接受澎湃新聞采訪時(shí),商湯科技董秘辦董事總經(jīng)理盛世偉透露,生成式AI業(yè)務(wù)已成為商湯從無(wú)到有并超過(guò)10億元收入體量的核心業(yè)務(wù)。財(cái)報(bào)顯示,2023年商湯實(shí)現(xiàn)總收入34億元,其生成式AI業(yè)務(wù)創(chuàng)造了11.8億元的收入,收入增長(zhǎng)率達(dá)200%,占該集團(tuán)總收入的35%。
2024年2月,商湯推出了“日日新”大模型4.0版,在代碼編寫、數(shù)據(jù)分析和醫(yī)療問(wèn)答等多場(chǎng)景中達(dá)到了與GPT-4相匹配的能力。而僅僅2個(gè)月后,新版馬上就要迭代更新了。
“在即將到來(lái)的4月下旬,我們會(huì)有一個(gè)技術(shù)交流日,屆時(shí)將展示我們更新的‘日日新’5.0大模型的能力!笔⑹纻ネ嘎叮叭杖招5.0”版本的性能全面對(duì)標(biāo)GPT4-Turbo。
對(duì)初創(chuàng)大模型企業(yè)而言,吸引大公司投資、合作是發(fā)展壯大的重要機(jī)遇。而對(duì)很多大企業(yè)而言,“AI+”更是這一輪大模型浪潮的核心,大模型有望賦能千行百業(yè),成為實(shí)體經(jīng)濟(jì)發(fā)展的新引擎。
3月29日下午,許多央企高管參觀模速空間。
“(蜜度)蜜巢剛剛介紹的AI知識(shí)管理,對(duì)我們來(lái)說(shuō)會(huì)有比較大的助力!3月29日下午,央企航空工業(yè)機(jī)載總經(jīng)理雷宏杰在參觀模速空間時(shí)說(shuō)。
“會(huì)考慮和上海大模型企業(yè)合作,把這樣的新技術(shù)應(yīng)用到企業(yè)管理中嗎?”澎湃新聞?dòng)浾邌?wèn)。
“我覺得這個(gè)是必需的,要提高企業(yè)的效率,像剛才講的知識(shí)管理、數(shù)據(jù)挖掘等模式,現(xiàn)在大模型可能是最好的解決方案!崩缀杲軓(qiáng)調(diào),“但首先得保證安全性,這對(duì)企業(yè)非常重要!
“這次來(lái)上?矗ù竽P彤a(chǎn)業(yè)),對(duì)我們有很大收獲!崩缀杲苎a(bǔ)充道。
借助產(chǎn)業(yè)風(fēng)口,垂類大模型企業(yè)迎來(lái)了前所未有的機(jī)會(huì)。查小薈也深刻體會(huì)到了這種變化。公司在談第一家券商客戶時(shí),整整用了一年。但最近幾個(gè)月,不斷有新客戶自己找上門來(lái)。“金融行業(yè)越來(lái)越感知到對(duì)人工智能的需求!彼f(shuō)。
在模速空間5樓,百思瑪特是一家專注于商品精準(zhǔn)營(yíng)銷的大模型企業(yè),類似電商導(dǎo)購(gòu),其聯(lián)合創(chuàng)始人邱運(yùn)偉是一名90后,此前在美國(guó)硅谷工作,2023年11月開始扎根上海模速空間。
這個(gè)創(chuàng)業(yè)團(tuán)隊(duì)目前只有十余人,主要成員此前均供職于IBM、Facebook等科技公司,他們是模速空間典型的一類創(chuàng)業(yè)者。邱運(yùn)偉打開電腦,展示公司2024年1月在國(guó)內(nèi)推出的首款產(chǎn)品“芝麻AI”,上線首日就登上微博熱搜,有超過(guò)10萬(wàn)用戶。
“未來(lái)可能充滿了很多不確定性,公司目前聚焦在半年之內(nèi),3到6個(gè)月驗(yàn)證我們產(chǎn)品在相關(guān)垂類市場(chǎng)的情況,收集更多數(shù)據(jù),提升產(chǎn)品性能!边@個(gè)青年創(chuàng)業(yè)者說(shuō)話時(shí)朝氣蓬勃。
雖然是規(guī)模不大的初創(chuàng)企業(yè),像百思瑪特這樣的電商垂類大模型,如果發(fā)展得好,未來(lái)很可能徹底顛覆現(xiàn)有的電商模式。
實(shí)現(xiàn)這一切愿景還需要時(shí)間。在陳海慈看來(lái),大模型產(chǎn)業(yè)的“打法”和之前的其他產(chǎn)業(yè)相比存在巨大的差別,重點(diǎn)在于創(chuàng)新生態(tài),“在之前的競(jìng)爭(zhēng)中,就看誰(shuí)出的人多、誰(shuí)付的錢多、誰(shuí)給的政策好。毫無(wú)疑問(wèn),上海在這些方面是有優(yōu)勢(shì)的,但我認(rèn)為,最后決定性要素是創(chuàng)新策源的鏈接。所以我們更關(guān)注的,是怎么提高創(chuàng)新生態(tài)的濃度,讓大家做大模型的產(chǎn)業(yè)時(shí),他就會(huì)想到模速空間!