大模型賽道上,上海如何跑在前面?
走出龍耀路地鐵站,現(xiàn)代、繁忙、藝術的上海西岸藏著答案。這里距離黃浦江濱江岸線幾百米,沿路能看見休閑的行人,更多是腳步匆忙的白領。方圓一公里內,坐落著騰訊、阿里、微軟、上海人工智能實驗室、商湯、無問芯穹、蜜度蜜巢等科技巨頭和AI大模型初創(chuàng)公司。
2024年3月下旬,上海西岸,模速空間。本文圖片除注明外,均為澎湃新聞記者 李佳蔚 圖
就在這個地鐵站旁邊,是全國首個、上海唯一的大模型創(chuàng)新生態(tài)社區(qū)“模速空間”。2023年9月28日,經(jīng)歷38天快速籌建,模速空間正式揭牌。不到半年時間,這里吸引了60多家大模型企業(yè)入駐,其所在的徐匯區(qū)已聚集近300家產(chǎn)業(yè)鏈上下游企業(yè),規(guī)模仍在擴大。
人工智能(AI)是上海重點發(fā)展的先導產(chǎn)業(yè),產(chǎn)業(yè)規(guī)模從2018年1340億元到2022年突破3800億元,年均增長超29%;規(guī)模以上企業(yè)數(shù),也從2018年的183家增至2022年的348家。
大模型正引領新一輪人工智能變革,業(yè)界普遍認為,大模型是邁向通用人工智能的核心引擎,將帶來人工智能的再次躍升,已經(jīng)成為全球科技競爭焦點。
2024年,全國前4批次通過上線備案的大模型中,上海占據(jù)24個。其中,徐匯區(qū)獨占15個,集中在模速空間。
可以說,模速空間是觀察上海AI大模型產(chǎn)業(yè)發(fā)展的最佳窗口。這片區(qū)域,正在產(chǎn)生越來越大的集聚度、顯示度、影響力。
3月下旬,2024全球開發(fā)者先鋒大會(GDC)開幕,地點設在上海西岸,以“模速空間——開發(fā)者的模力之源”為主題,許多人冒雨前來參加。2月份,上海市委書記陳吉寧調研上海模速空間創(chuàng)新生態(tài)社區(qū),主持召開人工智能科創(chuàng)機構和企業(yè)座談會,聽取意見建議、進行現(xiàn)場辦公。
如果說現(xiàn)在正值大模型的“風口”——固然未來有很長的征途,在這個時間節(jié)點,上海已搶占先機,跑在前列。模速空間,正力爭成為代表上海乃至國家贏取全球科技戰(zhàn)略競爭主動權的“主力因子”。
近日,澎湃新聞記者以模速空間為切入點,實地探訪并訪談多個大模型企業(yè)、政府相關負責人,探尋上海布局AI大模型賽道的前后過程和基礎邏輯。
“上下樓就是上下游”
從地圖上看,模速空間所在的上海西岸,分布著上海人工智能實驗室、期智研究院、商湯科技、阿里巴巴、騰訊等知名科研機構和科技企業(yè),形成一個人工智能產(chǎn)研生態(tài)圈。模速空間,在其中扮演專業(yè)孵化和加速載體的角色。
模速空間寬敞的公共區(qū)域,許多人辦公、交流、開會。
3月下旬,澎湃新聞記者走進模速空間,這里和許多創(chuàng)業(yè)園區(qū)相似,設施簡潔、舒適,環(huán)境明亮,除了一個個獨立辦公空間,寬敞的公共區(qū)域經(jīng)常有人圍在一起交流,氣氛輕松。目前模速空間一期、二期共2萬平方米已投入運營,三期已在規(guī)劃建設中。
與其他創(chuàng)業(yè)園區(qū)不同的是,模速空間聚焦AI大模型領域。許多企業(yè)在門口設有公司簡介,有的專注金融、商業(yè)垂類大模型,有的致力于通過大模型改善購物體驗,一些企業(yè)面向政企服務(ToB/ToG),一些則直接服務個體用戶(ToC)。
在模速空間5樓,“金聲玉亮”合伙人查小薈剛結束上一場會議,在公共區(qū)域快速騰出一處角落與記者交流。她說金聲玉亮屬于金融垂類大模型,可以視作投資顧問的助手,幫助解答客戶有關個股、行業(yè)、大盤的相關問題。
“我們的客戶有不少金融大V,以前他們需要每天或定期錄制短視頻投放,停更時間長了就會掉粉,F(xiàn)在用數(shù)字分身,可以解決大V分身乏術的困擾。熱點、內容、文本、肖像動作,一鍵就可以生成出來!辈樾∷C說,金聲玉亮的語料庫24小時不間斷更新,很多金融投資熱點,大模型能實時作答。
模速空間的很多創(chuàng)業(yè)者和查小薈一樣忙碌、干練,幾乎隨時都有研發(fā)人員用中英文召開線下或線上會議。許多中國AI技術人員每天加班加點,鉚足了勁頭希望超越OpenAI。
模速空間所在的上海西岸。上海徐匯 圖
徐匯區(qū)科委主任張寧在接受澎湃新聞記者采訪時表示,這一輪人工智能企業(yè)創(chuàng)業(yè),創(chuàng)始團隊都有很強的產(chǎn)業(yè)背景:模速空間90%的創(chuàng)始團隊有連續(xù)創(chuàng)業(yè)或大廠背景,80%的創(chuàng)始人來自頭部名校,50%的團隊有海外經(jīng)歷。
這里流傳一句話:“上下樓就是上下游。”張寧解釋,“在一棟樓里,聚集著大模型底層技術、應用研發(fā)、場景設計、算力支持、產(chǎn)品營銷等一條產(chǎn)業(yè)鏈上不同的企業(yè)。”
政府作為“店小二”,希望在很近的物理空間范圍內,讓科研人員能找到任何想見的人、對接任何想接觸的資源、獲取任何想得到的生活服務,這是模速空間要做到的“集聚”。
這種集群效應,讓入駐其中的企業(yè)深有感受。“我們的很多服務對象就在這棟樓里,走到隔壁辦公室問一問,或者在孵化器組織的活動中就能了解行業(yè)的最新動態(tài)!薄伴_放傳神”創(chuàng)始人張家慶把公司的加速發(fā)展,歸功于一棟樓匯聚整條產(chǎn)業(yè)鏈的空間格局。
3月29日下午,在模速空間,蜜度蜜巢負責人劉益東在為央企高管介紹企業(yè)情況。
模速空間運營方、上海大模型生態(tài)發(fā)展有限公司總裁陳海慈告訴澎湃新聞記者,模速空間希望能形成一個產(chǎn)業(yè)鏈的閉環(huán)和生態(tài),產(chǎn)生上中下游的和諧共鳴!皞鹘y(tǒng)來說,其實就是提供一個空間的服務,類似于大家今天講的孵化器或是眾創(chuàng)空間,該有的我都有,物業(yè)、法律、投融資等等都會覆蓋到。但是,更重要的是結合產(chǎn)業(yè)自身的特點,能為大家提供差異化的內容。除了那些傳統(tǒng)的東西,我們會差異化地跟各類企業(yè)發(fā)展相關的核心內容,有針對性地解決問題。”
蜜度蜜巢總裁、蜜度CTO劉益東告訴澎湃新聞,其公司以上海人工智能實驗室開發(fā)的書生通用大模型為基座,在政務垂類應用上發(fā)力,自主研發(fā)的蜜巢政務大模型能為企業(yè)和政府提供知識管理、數(shù)據(jù)挖掘等服務,已發(fā)布2.0版。
“‘書生’作為一個基座大模型,它也需要垂類應用參與,我們希望能夠在這個里面成為強有力的生態(tài)建設者!眲⒁鏂|說。輔助是相互的,此前蜜度蜜巢向書生·浦語供給了語料,加入由上海人工智能實驗室牽頭的“語料數(shù)據(jù)聯(lián)盟”。高質量、大規(guī)模、安全可信的語料數(shù)據(jù),對于大語言模型的訓練和性能提升至關重要。
張寧表示,匯集60多家大模型企業(yè)的同時,模速空間形成了算力調度、開放數(shù)據(jù)、評測服務、金融服務、綜合服務等全方位的創(chuàng)新創(chuàng)業(yè)保障。
舉例來說,算力是大模型公司最大的瓶頸,如果沒有以算力為核心的基礎設施作為支撐,大模型根本就跑不起來。模速空間的算力調度平臺,對接了商湯、華為、騰訊、阿里和三大電信運營商等9家供應商,超過50000張GPU卡,全力保障大模型企業(yè)算力可用、夠用、好用。
“半步優(yōu)勢”
人工智能并不是新興事物,如果從1950年代圖靈問出“機器能否有人類智能”算起,人工智能已經(jīng)歷半個多世紀的發(fā)展。只不過直到這一兩年,隨著ChatGPT和Sora的出現(xiàn),AI大模型才終于引爆整個行業(yè),讓很多人看到“商業(yè)價值”。
2023年被稱為大模型元年,國內外科技、AI企業(yè)紛紛下場試水,中國涌現(xiàn)出200多個大模型,一時間掀起“百模大戰(zhàn)”。通用大模型、行業(yè)大模型、垂類大模型……各式大模型出現(xiàn),各行各業(yè)都想從中分一杯羹。
雖然行業(yè)很熱鬧,創(chuàng)業(yè)者很興奮,但大模型具體怎么落地商用,很多人似乎摸不著頭腦。一些業(yè)內人士發(fā)現(xiàn),與2023年ChatGPT帶來的投資熱潮不同,2024年Sora出現(xiàn)后,“大廠”顯得“冷靜”很多。
也在2023年,當很多大廠、企業(yè)看待AI的眼光終于從“技術”轉換為“產(chǎn)業(yè)”時,上海徐匯悄然打造了一個“AI生態(tài)社區(qū)”,把產(chǎn)業(yè)鏈上、中、下游聚集在一起,全方位賦能應用。
換句話說,當大家都在卷模型的時候,上海創(chuàng)造了一種新“玩法”。
經(jīng)過2023年的一輪“燒錢”,很多企業(yè)達成了一個新的共識:通用大模型,只是少數(shù)人的游戲;下一階段,機會在行業(yè)大模型、垂類大模型。不久前百度創(chuàng)始人李彥宏也說:“大家不要去卷模型了,卷應用吧,只有應用直接創(chuàng)造價值”。
模速空間入駐的60多家大模型企業(yè),超過80%是來自垂類領域的應用企業(yè)!按诡惪赡苁巧虡I(yè)落地過程中多數(shù)企業(yè)唯一的選擇!辈樾∷C從行業(yè)角度分析,通用大模型成本太高,產(chǎn)品很容易“中庸”,“好像什么都能做,又好像什么都做不好”,中小企業(yè)玩不起。
在產(chǎn)業(yè)風口,模速空間能夠快速集結一批高水平的大模型企業(yè),實屬難能可貴。在張寧看來,一方面,這基于上海市和徐匯區(qū)的人工智能產(chǎn)業(yè)積淀,“我們很早就抓住了人工智能的變革趨勢和產(chǎn)業(yè)風口”。
自2017年起,上海在全國率先布局發(fā)展人工智能產(chǎn)業(yè),2018年舉辦首屆世界人工智能大會,至今連續(xù)舉辦6年,徐匯一直是核心承載地。這幾年,上海AI產(chǎn)業(yè)規(guī)模從2018年1340億元躍向了2022年3821億元。
很多人以為模速空間“橫空出世”,張寧清楚背后的積累和布局。幾年前,當人們把AI視為不賺錢的“技術”時,上海已開始把它當作產(chǎn)業(yè)賽道。一個典型的例子,就是培養(yǎng)和發(fā)展人工智能獨角獸企業(yè)商湯科技。
另一方面,張寧說,模速空間的快速誕生和壯大,相關部門作了大量調研分析、抽絲剝繭,“我們是把大模型產(chǎn)業(yè)看明白了再招商的。”張寧說,和AI科學家、企業(yè)家打交道多年,他發(fā)現(xiàn)對大模型創(chuàng)業(yè)者來說,好政策固然重要,但企業(yè)往往更喜歡也更需要一個能夠理解大模型產(chǎn)業(yè),也懂得如何幫助大模型企業(yè)的政府。
基于此,模速空間作為全國首個、上海唯一的大模型創(chuàng)新生態(tài)社區(qū),誕生在徐匯。張寧把這個過程謙遜地形容為“半步優(yōu)勢”。
不過,即使有“半步優(yōu)勢”,在大模型日趨白熱化的競爭當中,任何城市都無法松懈。
2023年11月,上海印發(fā)《上海市推動人工智能大模型創(chuàng)新發(fā)展若干措施(2023-2025年)》,推出一系列支持大模型創(chuàng)新發(fā)展的政策措施,推動大模型語料聯(lián)盟的實體化運作,開源一系列高質量的語料數(shù)據(jù),為全球人工智能開發(fā)者創(chuàng)新創(chuàng)造構建更良好的生態(tài)環(huán)境。
徐匯區(qū)更進一步,推出許多增量舉措。模速空間不僅有基金投資、產(chǎn)業(yè)鏈合作、房屋租金等優(yōu)惠,初創(chuàng)企業(yè)還有“算力券”支持,這一平臺降低企業(yè)大模型訓練門檻,牽引大模型在金融、教育、醫(yī)療、制造等典型領域的垂直應用。
招商優(yōu)質企業(yè)的同時,上海積極吸引青年人才。2024年3月初,徐匯區(qū)委書記曹立強親自帶隊,組織30余家高科技領域的企事業(yè)單位赴清華北大招聘,參與招聘企業(yè)超過1/3屬于人工智能領域。
創(chuàng)新成果涌現(xiàn)
圍繞模速空間,目前上海西岸已誕生4個底座基礎大模型,即上海人工智能實驗室的書生通用大模型、商湯的“日日新”senseNova大模型體系、MINIMAX-ABAB大模型、界躍星辰大模型。垂類應用更多,相關產(chǎn)品已達百余個。
3月23日,2024全球開發(fā)者先鋒大會(GDC)在徐匯濱江開幕。上海徐匯 圖
3月23日,2024全球開發(fā)者先鋒大會上,上海市副市長陳杰談道,上海大模型創(chuàng)新成果不斷涌現(xiàn),上海人工智能實驗室開發(fā)的“書生浦語”大模型開源發(fā)布,多款人形機器人(11.000, 0.15, 1.38%)也即將發(fā)布。他還提到,大模型產(chǎn)業(yè)載體持續(xù)拓展,模速空間已吸引60多家大模型企業(yè)入駐。
作為科研一線代表,上海人工智能實驗室主任助理、領軍科學家喬宇表示:“大模型目前正在朝多模態(tài)方向演進,我們建立了一個具備知識、對齊、價值3個層面的新的多模態(tài)大模型評測體系,這將為未來大模型的發(fā)展以及評測提供新的參考和引領!
在這次大會上,階躍星辰發(fā)布了該公司Step系列通用大模型,包括Step-1千億參數(shù)語言大模型,Step-1V千億參數(shù)多模態(tài)大模型,以及Step-2萬億參數(shù)MoE語言大模型預覽版——這也是國內初創(chuàng)公司里首個萬億參數(shù)大模型。
上海階躍星辰智能科技有限公司CEO姜大昕是微軟前全球副總裁,他說,模型的參數(shù)從千億到萬億,數(shù)量上提升了一個量級,在難度上也對算力、系統(tǒng)、數(shù)據(jù)、算法各方面提出了挑戰(zhàn)。
澎湃新聞注意到,無論上海人工智能實驗室、商湯、界躍星辰等基礎大模型企業(yè),還是蜜度蜜巢、金聲玉亮等垂類模型初創(chuàng)企業(yè),目前發(fā)展速度和更新迭代都非?,并且開始收獲商業(yè)上的成功。
商湯科技,基于SenseCore商湯大裝置提供的算力,在四方體的不同立面上呈現(xiàn)出與平面圖像一樣的畫面。
在接受澎湃新聞采訪時,商湯科技董秘辦董事總經(jīng)理盛世偉透露,生成式AI業(yè)務已成為商湯從無到有并超過10億元收入體量的核心業(yè)務。財報顯示,2023年商湯實現(xiàn)總收入34億元,其生成式AI業(yè)務創(chuàng)造了11.8億元的收入,收入增長率達200%,占該集團總收入的35%。
2024年2月,商湯推出了“日日新”大模型4.0版,在代碼編寫、數(shù)據(jù)分析和醫(yī)療問答等多場景中達到了與GPT-4相匹配的能力。而僅僅2個月后,新版馬上就要迭代更新了。
“在即將到來的4月下旬,我們會有一個技術交流日,屆時將展示我們更新的‘日日新’5.0大模型的能力。”盛世偉透露,“日日新5.0”版本的性能全面對標GPT4-Turbo。
對初創(chuàng)大模型企業(yè)而言,吸引大公司投資、合作是發(fā)展壯大的重要機遇。而對很多大企業(yè)而言,“AI+”更是這一輪大模型浪潮的核心,大模型有望賦能千行百業(yè),成為實體經(jīng)濟發(fā)展的新引擎。
3月29日下午,許多央企高管參觀模速空間。
“(蜜度)蜜巢剛剛介紹的AI知識管理,對我們來說會有比較大的助力!3月29日下午,央企航空工業(yè)機載總經(jīng)理雷宏杰在參觀模速空間時說。
“會考慮和上海大模型企業(yè)合作,把這樣的新技術應用到企業(yè)管理中嗎?”澎湃新聞記者問。
“我覺得這個是必需的,要提高企業(yè)的效率,像剛才講的知識管理、數(shù)據(jù)挖掘等模式,現(xiàn)在大模型可能是最好的解決方案!崩缀杲軓娬{,“但首先得保證安全性,這對企業(yè)非常重要!
“這次來上海看(大模型產(chǎn)業(yè)),對我們有很大收獲!崩缀杲苎a充道。
借助產(chǎn)業(yè)風口,垂類大模型企業(yè)迎來了前所未有的機會。查小薈也深刻體會到了這種變化。公司在談第一家券商客戶時,整整用了一年。但最近幾個月,不斷有新客戶自己找上門來。“金融行業(yè)越來越感知到對人工智能的需求!彼f。
在模速空間5樓,百思瑪特是一家專注于商品精準營銷的大模型企業(yè),類似電商導購,其聯(lián)合創(chuàng)始人邱運偉是一名90后,此前在美國硅谷工作,2023年11月開始扎根上海模速空間。
這個創(chuàng)業(yè)團隊目前只有十余人,主要成員此前均供職于IBM、Facebook等科技公司,他們是模速空間典型的一類創(chuàng)業(yè)者。邱運偉打開電腦,展示公司2024年1月在國內推出的首款產(chǎn)品“芝麻AI”,上線首日就登上微博熱搜,有超過10萬用戶。
“未來可能充滿了很多不確定性,公司目前聚焦在半年之內,3到6個月驗證我們產(chǎn)品在相關垂類市場的情況,收集更多數(shù)據(jù),提升產(chǎn)品性能!边@個青年創(chuàng)業(yè)者說話時朝氣蓬勃。
雖然是規(guī)模不大的初創(chuàng)企業(yè),像百思瑪特這樣的電商垂類大模型,如果發(fā)展得好,未來很可能徹底顛覆現(xiàn)有的電商模式。
實現(xiàn)這一切愿景還需要時間。在陳海慈看來,大模型產(chǎn)業(yè)的“打法”和之前的其他產(chǎn)業(yè)相比存在巨大的差別,重點在于創(chuàng)新生態(tài),“在之前的競爭中,就看誰出的人多、誰付的錢多、誰給的政策好。毫無疑問,上海在這些方面是有優(yōu)勢的,但我認為,最后決定性要素是創(chuàng)新策源的鏈接。所以我們更關注的,是怎么提高創(chuàng)新生態(tài)的濃度,讓大家做大模型的產(chǎn)業(yè)時,他就會想到模速空間!