123,123

北京8月1日電在對話框中輸入一句話或添加一張照片，點(diǎn)擊“生成視頻”按鈕，不到一分鐘，一條6秒的短視頻立馬生成�！翱矗掌瑒�(dòng)起來了�！钡谝粨車L鮮國產(chǎn)自研視頻生成產(chǎn)品“清影”的“00后”用戶施司羽說。

今年初，文生視頻大模型Sora在全球人工智能業(yè)內(nèi)外引發(fā)廣泛關(guān)注。近日，多個(gè)中國科技企業(yè)自主研發(fā)的視頻生成產(chǎn)品扎堆上線，引發(fā)關(guān)注。這意味著中國人工智能大模型的“應(yīng)用試驗(yàn)田”又多了一塊。

　　圖片通過視頻大模型Vidu自動(dòng)生成一段動(dòng)畫視頻（視頻截圖）。新華社發(fā)

生數(shù)科技今年4月聯(lián)合清華大學(xué)發(fā)布了視頻大模型Vidu，并于7月底正式上線�！按舜蜼idu正式上線，并全面開放了文生視頻、圖生視頻兩大功能，提供4s、8s兩種時(shí)長選擇，分辨率最高達(dá)1080P，將讓更多人感受文生視頻、圖生視頻的美好體驗(yàn)。”生數(shù)科技聯(lián)合創(chuàng)始人兼首席執(zhí)行官唐家渝說。

Vidu上線前數(shù)天，北京另一家人工智能公司智譜AI也上線了基于其自研大模型開發(fā)的視頻生成產(chǎn)品Ying（清影）�！扒逵安粌H支持文本生成視頻、圖片生成視頻，還支持視頻生成視頻。”智譜AI首席執(zhí)行官張鵬說。

今年6月，快手發(fā)布的視頻生成大模型“可靈”，在文生視頻、圖生視頻方面展現(xiàn)出了創(chuàng)造逼真運(yùn)動(dòng)場景、精確模擬物理特性的能力與潛力。

唐家渝和張鵬表示，當(dāng)前中國視頻生成產(chǎn)品的主流技術(shù)路線，采用的是深度學(xué)習(xí)模型與擴(kuò)散模型相結(jié)合的架構(gòu)，遵從“規(guī)模定律”，強(qiáng)依賴算法、算力、數(shù)據(jù)。

　　視頻生成產(chǎn)品Ying（清影）用戶登錄界面。新華社發(fā)

當(dāng)前，全球范圍內(nèi)文本、圖片生成視頻模型賽道上已有多家科技企業(yè)參與競逐。除OpenAI的Sora之外，還有Runway的Gen系列、微軟的Nuwa、Meta的Emu、谷歌的Phenaki等。中國最早的入局者有生數(shù)科技的Vidu、智譜AI的清影、快手的可靈、商湯的日日新等。

張鵬說，目前中國的視頻生成技術(shù)還處于起步階段，并不完美；接下來還有高質(zhì)量數(shù)據(jù)、算法等一系列問題有待逐一破解。然而加速人工智能技術(shù)發(fā)展的最好方式就是并行加速技術(shù)的研發(fā)與應(yīng)用，而不是把技術(shù)關(guān)在實(shí)驗(yàn)室里閉門造車。

“從今天的技術(shù)實(shí)現(xiàn)角度，視頻大模型的迭代將顛覆影視動(dòng)畫制作在內(nèi)的內(nèi)容產(chǎn)業(yè)�！碧萍矣孱A(yù)判，未來十年，影視創(chuàng)作生產(chǎn)的門檻與影視動(dòng)畫制作的成本將進(jìn)一步降低，更好地將想象力、創(chuàng)造力轉(zhuǎn)化為生產(chǎn)力。

中國人工智能視頻生成產(chǎn)品密集上線