登入 直接訂購 教學視頻

騰訊混元發布並開源語音數字人模型

騰訊(00700)旗下騰訊混元發布並開源語音數字人模型HunyuanVideo-Avatar,支持頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向視頻創作者提供高一致性、高動態性的視頻生成能力。

據介紹,用戶可上傳人物圖像與音訊,HunyuanVideo-Avatar模型會自動理解圖片與音訊,如人物所在環境、音訊所蘊含的情感等,讓圖中人物自然地說話或唱歌,生成包含自然表情、唇形同步及全身動作的視頻。

股票及指數資料由天滙財經有限公司,泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。