首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

OpenAI正式發(fā)布Sora!國內(nèi)文生視頻哪家強?

2024年12月10日 09:32  CCTIME飛象網(wǎng)  

OpenAI“12天發(fā)布活動”在第三個工作日終于迎來期待已久的Sora!,令人感到驚喜的是,OpenAI不僅正式發(fā)布了Sora,還推出了Sora的升級版——Sora Turbo,并作為獨立產(chǎn)品提供給 ChatGPT Plus 和 Pro 用戶。

在今天的直播中,OpenAI展示了Sora視頻生成模型的新功能,用戶現(xiàn)在能夠創(chuàng)建最高1080p分辨率、長達(dá)20秒的視頻,并且可以選擇寬屏、豎屏或方形的畫面比例。Sora不僅支持視頻內(nèi)容的擴展、混編(remix)和融合,還允許用戶基于文本提示生成全新的視頻內(nèi)容。此外,全新的故事編輯工具還可以幫助用戶能夠精確控制每一幀的詳細(xì)輸入,大幅提升了視頻創(chuàng)作的精細(xì)度和靈活性。

自今年2月OpenAI放出Sora視頻生成片段后,公眾對Sora的期待值早已拉滿,一場文生視頻技術(shù)的競速賽在全球范圍展開。 國內(nèi)在文生視頻算法領(lǐng)域也取得了顯著進展,根據(jù)國家網(wǎng)信辦公開信息顯示,今年以來國內(nèi)共有2277個深度合成服務(wù)算法通過備案,其中主要用途描述中帶有可實現(xiàn)文生視頻能力的算法34個,備案名稱中明確界定為“文生視頻算法”的僅有6個。

文生視頻算法通過分析和吸收海量數(shù)據(jù),學(xué)會了依據(jù)文本描述來創(chuàng)造相應(yīng)的視頻內(nèi)容,結(jié)合自然語言處理(NLP)和計算機視覺(CV)的最新進展,提取文本特征并轉(zhuǎn)換為數(shù)值特征,然后利用擴散模型,逐步從隨機噪聲中去噪,最終生成與文本描述相匹配的視頻內(nèi)容。這一過程涉及到復(fù)雜的編碼和解碼機制,包括文本到視頻的映射、視頻生成等關(guān)鍵技術(shù)。

2024年通過文生視頻算法備案的34家公司中,大部分是人工智能技術(shù)、應(yīng)用相關(guān)領(lǐng)域的中小創(chuàng)新企業(yè)。如在自然語言處理、對話式 AI 等方面有深入研究和應(yīng)用的北京紅棉小冰科技有限公司等。

此外,其中也不乏上市公司或在行業(yè)內(nèi)有較高的知名度和影響力的科技創(chuàng)企。比如專注于大語言模型等相關(guān)技術(shù)的研發(fā)與應(yīng)用的北京智譜領(lǐng)航科技有限公司,就是開發(fā)了生成式AI助手智譜清言的智譜華章旗下全資子公司。其智譜多模態(tài)視頻生成算法,主要應(yīng)用于智譜清言—清影AI網(wǎng)站,根據(jù)用戶輸入的文本、圖片等信息,即可生成符合用戶需求的視頻。

商湯科技是國內(nèi)計算機視覺領(lǐng)域的頭部企業(yè),公開信息顯示,其通過備案的商湯V-ME視頻合成算法支持已有人物視頻、動畫、聲音、文字等多種元素進行驅(qū)動,用戶可根據(jù)自身需求靈活選擇適合的素材驅(qū)動視頻生成,主要面向 C 端用戶,滿足廣大用戶的娛樂創(chuàng)作需求。

“智境云創(chuàng)文本生成視頻算法”的備案主體同樣有上市公司背景,北京智境云創(chuàng)科技有限公司是深交所上市公司天娛數(shù)科(股票代碼:002354)的子公司。據(jù)公開信息顯示,智境云創(chuàng)在今年6月一次性通過了“智境云創(chuàng)人臉融合算法”、“智境云創(chuàng)文本生成視頻算法”、“智者千問大語言模型算法”三項算法備案。其中,“智境云創(chuàng)文本生成視頻算法”核心技術(shù)涵蓋視頻生成模型、圖像合成、深度學(xué)習(xí)、自然語言處理等多個領(lǐng)域,能夠?qū)σ曈X和聽覺元素進行深度學(xué)習(xí)與分析,實現(xiàn)多模態(tài)融合,從而更精準(zhǔn)地理解和生成符合用戶需求的視頻內(nèi)容,適用于多種應(yīng)用場景的需求,如廣告創(chuàng)意、教育培訓(xùn)、娛樂產(chǎn)業(yè)和新聞傳媒等。

文生視頻技術(shù)的進步,為內(nèi)容創(chuàng)作、產(chǎn)業(yè)升級和市場發(fā)展帶來了積極影響,預(yù)示著一個全新的內(nèi)容創(chuàng)作和產(chǎn)業(yè)應(yīng)用時代的到來。同時也為市場發(fā)展提供了巨大的空間,隨著技術(shù)的進一步成熟,文生視頻有望在影視、游戲等細(xì)分領(lǐng)域內(nèi)容創(chuàng)作過程中極大提升效率,加速優(yōu)質(zhì)供給產(chǎn)出,為各細(xì)分行業(yè)帶來新的商業(yè)化機會。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國移動王曉云:6G已經(jīng)進入面向產(chǎn)業(yè)技術(shù)創(chuàng)新的全新階段
精彩專題
2024中國算力大會
2024年國際信息通信展
中國信科亮相2024年國際信息通信展
第25屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像