大模型企業(yè)擁抱開源，視頻模型集體加入

澎湃新聞記者張靜

2025-02-19 11:58

來源：澎湃新聞

2月18日，昆侖萬維（300418）開源首個面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1，及基于視頻基座模型的表情動作可控算法SkyReels-A1。

針對當前全球AI視頻生成模型和產(chǎn)品不開源、用不到、費用高、不好用等痛點，昆侖萬維此次開源的兩款模型和算法，可幫助解決傳統(tǒng)短劇制作面臨的挑戰(zhàn)，如線下拍劇涵蓋劇本創(chuàng)作、選演員、場景布景、分鏡創(chuàng)作、拍攝、后期處理等復雜流程，大模型有助于縮減成本。

SkyReels-V1針對表演細節(jié)打標，利用好萊塢級別數(shù)據(jù)訓練微調(diào)。

據(jù)介紹，為提升表情生成、肢體生成的可控表演效果，SkyReels-V1針對表演細節(jié)打標，利用好萊塢級別數(shù)據(jù)訓練微調(diào)。針對人物微表情、人物表演細節(jié)、場景描述、光影、畫面構(gòu)圖等進行更精細的技術(shù)升級。為了實現(xiàn)更加精準可控的人物視頻生成，昆侖萬維開源了基于視頻基座模型的表情動作可控算法SkyReels-A1，支持視頻驅(qū)動的電影級表情捕捉，能夠基于任意人體比例生成高度逼真的人物動態(tài)視頻，以及皮膚肌理、身體動作跟隨等多維度細節(jié)的深度還原。

同日，大模型企業(yè)階躍星辰與吉利汽車集團聯(lián)合開源兩款多模態(tài)大模型，包括開源視頻生成模型階躍Step-Video-T2V、開源語音交互大模型階躍Step-Audio。階躍星辰表示，此次聯(lián)合開源旨在促進大模型技術(shù)的共享與創(chuàng)新，推動人工智能普惠發(fā)展。

據(jù)階躍星辰介紹，階躍Step-Video-T2V模型參數(shù)量達300億，可直接生成204幀、540P分辨率的視頻。階躍Step-Video-T2V在復雜運動、美感人物、視覺想象力、基礎(chǔ)文字生成、原生中英雙語輸入和鏡頭語言等方面能力突出。

上海對外經(jīng)貿(mào)大學人工智能與變革管理研究院副院長、上海開源信息技術(shù)協(xié)會秘書長張國鋒此前對澎湃科技表示，開源是數(shù)字經(jīng)濟公共基礎(chǔ)設(shè)施，開源在物理世界萌芽發(fā)展、逐步壯大，成為數(shù)字經(jīng)濟創(chuàng)新創(chuàng)業(yè)主導模式，這是歷史趨勢。作為社會創(chuàng)新方法論的開源降低了創(chuàng)新創(chuàng)業(yè)門檻，激發(fā)了創(chuàng)業(yè)熱情，將改變軟件的產(chǎn)業(yè)鏈和供應鏈，改變游戲規(guī)則。DeepSeek讓人們看到了開源的重要性，開源項目將雨后春筍般涌現(xiàn)，2025年是開源大發(fā)展之年，一場波瀾壯闊的開源社會運動正在開展。

責任編輯：宦艷紅

圖片編輯：沈軻

校對：施鋆

澎湃新聞報料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報

#視頻大模型