3月10日消息,魔樂社區(qū)(Modelers)宣布已上架由階躍星辰自研的 Step-Video 視頻生成和 Step-Audio 語音模型兩款開源多模態(tài)大模型,并基于華為昇騰 CANN 異構(gòu)計(jì)算架構(gòu)和昇騰服務(wù)器,完成了對模型的適配。開發(fā)者和企業(yè)用戶在魔樂社區(qū)中可以直接下載并體驗(yàn)。
據(jù)了解,Step-Video-T2V 是目前全球參數(shù)量最大的開源視頻生成模型,達(dá)到300億參數(shù)。可直接生成204幀、540P分辨率的高質(zhì)量視頻。根據(jù)階躍星辰此前公布評測結(jié)果,Step-Video-T2V 在指令遵循、運(yùn)動平滑性、物理合理性、美感度等方面的表現(xiàn)均顯著超過市面上既有的效果最佳的開源視頻模型;而 Step-Audio 是行業(yè)內(nèi)首款產(chǎn)品級開源語音交互大模型,能生成多種情感、方言、語言、唱腔及個(gè)性化風(fēng)格的語音。階躍星辰在不久前的生態(tài)開放日上透露,3月份還將開源圖生視頻模型。
據(jù)悉,魔樂社區(qū)由天翼云與華為聯(lián)合打造,面向 AI 開發(fā)者與技術(shù)愛好者,提供模型、數(shù)據(jù)集、開發(fā)工具鏈與應(yīng)用的一站式托管與展示服務(wù)。(定西)
本文來自網(wǎng)易科技報(bào)道,更多資訊和深度內(nèi)容,關(guān)注我們。