10月24日,科大訊飛(49.200, 2.50, 5.35%)董事長劉慶峰在第六屆世界聲博會暨2023科大訊飛全球1024開發(fā)者節(jié)上宣布,星火認(rèn)知大模型V3.0正式發(fā)布。劉慶峰表示,訊飛星火3.0的綜合能力已超ChatGPT。
會上還宣布,科大訊飛已聯(lián)合華為打造基于昇騰生態(tài)的自主可控大模型算力底座“飛星一號”平臺,在此基礎(chǔ)上,訊飛星火大模型將啟動對標(biāo)GPT-4的更大規(guī)模訓(xùn)練。按照劉慶峰現(xiàn)場公布的時間表,在2024年上半年,訊飛星火4.0將全面對標(biāo)GPT-4。
● 本報記者 楊潔
七大能力提升
據(jù)介紹,星火認(rèn)知大模型V3.0在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力七大方面均實現(xiàn)提升。劉慶峰稱,訊飛星火認(rèn)知大模型V3.0全面對標(biāo)ChatGPT,對標(biāo)即為中文超越、英文相當(dāng)。
劉慶峰介紹,訊飛星火9月5日全民開放后,當(dāng)前已有1200萬用戶。千萬用戶也對認(rèn)知大模型提出更高期待,“不僅能回答問題還要能提出問題”“不僅要有知識還要有個性”。
劉慶峰表示,大模型不僅要能回答問題,還要像人一樣主動提問。大模型想要賦能民生百業(yè),需要實現(xiàn)從多輪對話、主動對話再到啟發(fā)式對話的跨越,實現(xiàn)星火的智慧階躍,推動行業(yè)縱深應(yīng)用。此外,大模型不僅要有專業(yè)的知識,還要具備個性化的AI人設(shè),為星火注入“靈魂”。
訊飛星火認(rèn)知大模型V3.0新增了虛擬人格功能,它可以根據(jù)性格模擬、情緒理解、表達(dá)風(fēng)格來形成一個初始人設(shè),再結(jié)合特定知識學(xué)習(xí)、對話記憶學(xué)習(xí),形成一個更個性化的AI人設(shè)。
在行業(yè)應(yīng)用方面,發(fā)布會上,訊飛星火醫(yī)療大模型正式發(fā)布,實現(xiàn)醫(yī)療海量知識問答、醫(yī)療復(fù)雜語言理解、醫(yī)療專業(yè)文本生成,醫(yī)療診斷治療推薦的問題回答率全面超越GPT-4。同時,科大訊飛推出搭載了訊飛星火醫(yī)療大模型的“訊飛曉醫(yī)”APP,讓求醫(yī)問藥觸手可及——看病之前不知道怎么準(zhǔn)確表達(dá)自己的病情?自己買藥不知道有何禁忌?拿到體檢報告后想馬上“識別”自己去年和今年有什么健康異動?都可以咨詢“訊飛曉醫(yī)”。劉慶峰表示,希望打造每個人的AI健康助手,讓AI醫(yī)療的普惠之光照進(jìn)每個家庭。
此外,訊飛機(jī)器人(11.250, 0.23, 2.09%)超腦平臺AIBOT也迎來升級,業(yè)界首個大模型+具身智能的人形機(jī)器人在現(xiàn)場亮相。劉慶峰表示,星火大模型的推出讓AIBOT賦能機(jī)器人發(fā)展進(jìn)入到一個全新的階段,人形機(jī)器人對復(fù)雜任務(wù)的拆解、開放場景的物體尋找明顯提升,在強(qiáng)化學(xué)習(xí)泛化抓取、仿人行走的復(fù)雜地形運動能力上都比主流系統(tǒng)有一個非常大的提升。“下一步我們將以人形機(jī)器人為牽引,來推動‘視覺-語言-動作’多模態(tài)具身大模型,能夠更好地賦能人形機(jī)器人。”劉慶峰表示。
讓AI解決人類剛需
“大模型首先要能夠在工業(yè)和科研領(lǐng)域造福人類,這才是我們真正解決社會剛需的地方。”劉慶峰稱。
在工業(yè)領(lǐng)域,今年9月20日,基于訊飛星火的羚羊工業(yè)大模型正式發(fā)布,通用人工智能成為新型工業(yè)化的核心引擎。1個月內(nèi),羚羊工業(yè)互聯(lián)網(wǎng)平臺的工業(yè)文本生成、知識問答、理解計算、代碼生成、多模態(tài)5大核心能力再度升級,平臺用戶總量提升59%,平臺服務(wù)企業(yè)次數(shù)增長88%。
在科研領(lǐng)域,科技文獻(xiàn)是檢驗大模型高階認(rèn)知能力的“試金石”。訊飛星火和與中國科學(xué)院文獻(xiàn)情報中心聯(lián)合打造科技文獻(xiàn)大模型,可以實現(xiàn)成果調(diào)研、論文研讀、學(xué)術(shù)寫作三大功能。
科大訊飛研究院院長劉聰現(xiàn)場實測,用科技文獻(xiàn)大模型將十幾份量子計算論文一鍵生成綜述報告,能夠為科研人員快速了解最新論文提效。測試顯示,效率提高超10倍,論文研讀有效率和學(xué)術(shù)寫作采納率均超90%!耙匀斯ぶ悄茴I(lǐng)域為例,每天有84篇文章發(fā)表,每篇閱讀10分鐘,一天讀完也要花14個小時,科技文獻(xiàn)大模型快速生成文獻(xiàn)綜述,對科研人員快速掌握全球最新前沿進(jìn)展有巨大幫助!眲c峰說。
產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化離不開代碼能力的支持。劉慶峰表示,自訊飛星火發(fā)布以來,代碼能力持續(xù)升級。此次發(fā)布會上,搭載訊飛星火3.0的智能編程助手iFlyCode2.0正式發(fā)布,在編程的設(shè)計階段提效50%,開發(fā)階段提效37%,測試階段提效44%,大幅提升軟件從業(yè)人員效率。iFlyCode發(fā)布以來,已在京東云、軟通動力(28.010, 1.13, 4.20%)等107家機(jī)構(gòu)實現(xiàn)深度對接應(yīng)用。
打造算力底座
劉慶峰表示,國產(chǎn)大模型必須正視和GPT-4的差距!皣a(chǎn)大模型在復(fù)雜知識推理、小樣本快速學(xué)習(xí)、超長文本處理、跨模態(tài)統(tǒng)一理解上與GPT4還有差距!彼硎,唯有實事求是的科學(xué)精神,才能真正實現(xiàn)超越。
算力供給對國產(chǎn)大模型來說也是不可忽視的問題,如何不被算力“卡脖子”,科大訊飛給出了自己的解決方案。在近期接受機(jī)構(gòu)調(diào)研時,科大訊飛表示,認(rèn)知大模型在行業(yè)深度應(yīng)用的關(guān)鍵是安全可控、場景驅(qū)動、專屬可控,其中安全可控的前提就是算力可控。
本次發(fā)布會上,科大訊飛聯(lián)合華為打造基于昇騰生態(tài)的自主可控大模型算力底座“飛星一號”平臺,在此基礎(chǔ)上,訊飛星火大模型將啟動對標(biāo)GPT-4的更大規(guī)模訓(xùn)練。按照劉慶峰現(xiàn)場公布的時間表,在2024年上半年,訊飛星火4.0將全面對標(biāo)GPT-4。