- +1
大模型企業(yè)擁抱開源,視頻模型集體加入
2月18日,昆侖萬維(300418)開源首個面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1,及基于視頻基座模型的表情動作可控算法SkyReels-A1。
針對當前全球AI視頻生成模型和產(chǎn)品不開源、用不到、費用高、不好用等痛點,昆侖萬維此次開源的兩款模型和算法,可幫助解決傳統(tǒng)短劇制作面臨的挑戰(zhàn),如線下拍劇涵蓋劇本創(chuàng)作、選演員、場景布景、分鏡創(chuàng)作、拍攝、后期處理等復雜流程,大模型有助于縮減成本。

SkyReels-V1針對表演細節(jié)打標,利用好萊塢級別數(shù)據(jù)訓練微調(diào)。
據(jù)介紹,為提升表情生成、肢體生成的可控表演效果,SkyReels-V1針對表演細節(jié)打標,利用好萊塢級別數(shù)據(jù)訓練微調(diào)。針對人物微表情、人物表演細節(jié)、場景描述、光影、畫面構(gòu)圖等進行更精細的技術(shù)升級。為了實現(xiàn)更加精準可控的人物視頻生成,昆侖萬維開源了基于視頻基座模型的表情動作可控算法SkyReels-A1,支持視頻驅(qū)動的電影級表情捕捉,能夠基于任意人體比例生成高度逼真的人物動態(tài)視頻,以及皮膚肌理、身體動作跟隨等多維度細節(jié)的深度還原。
同日,大模型企業(yè)階躍星辰與吉利汽車集團聯(lián)合開源兩款多模態(tài)大模型,包括開源視頻生成模型階躍Step-Video-T2V、開源語音交互大模型階躍Step-Audio。階躍星辰表示,此次聯(lián)合開源旨在促進大模型技術(shù)的共享與創(chuàng)新,推動人工智能普惠發(fā)展。
據(jù)階躍星辰介紹,階躍Step-Video-T2V模型參數(shù)量達300億,可直接生成204幀、540P分辨率的視頻。階躍Step-Video-T2V在復雜運動、美感人物、視覺想象力、基礎(chǔ)文字生成、原生中英雙語輸入和鏡頭語言等方面能力突出。
上海對外經(jīng)貿(mào)大學人工智能與變革管理研究院副院長、上海開源信息技術(shù)協(xié)會秘書長張國鋒此前對澎湃科技表示,開源是數(shù)字經(jīng)濟公共基礎(chǔ)設(shè)施,開源在物理世界萌芽發(fā)展、逐步壯大,成為數(shù)字經(jīng)濟創(chuàng)新創(chuàng)業(yè)主導模式,這是歷史趨勢。作為社會創(chuàng)新方法論的開源降低了創(chuàng)新創(chuàng)業(yè)門檻,激發(fā)了創(chuàng)業(yè)熱情,將改變軟件的產(chǎn)業(yè)鏈和供應鏈,改變游戲規(guī)則。DeepSeek讓人們看到了開源的重要性,開源項目將雨后春筍般涌現(xiàn),2025年是開源大發(fā)展之年,一場波瀾壯闊的開源社會運動正在開展。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




