腾讯发布并开源混元语音数字人模型
创始人
2025-05-28 12:42:07

格隆汇5月28日|腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar,由腾讯混元视频大模型及腾讯音乐天琴实验室MuseV技术联合研发,支持头肩、半身与全身景别,以及多风格、多物种与双人场景,面向视频创作者提供高一致性、高动态性的视频生成能力。用户可上传人物图像与音频,HunyuanVideo-Avatar模型会自动理解图片与音频,比如人物所在环境、音频所蕴含的情感等,让图中人物自然地说话或唱歌,生成包含自然表情、唇形同步及全身动作的视频。

相关内容

热门资讯

中标首都机场1.13亿元免税项... 12月28日,王府井(600859)公告称,公司成为北京首都国际机场免税项目02标段(T2航站楼)中...
“姐姐为亡弟追凶27年”案最新... 12月28日,据澎湃新闻,记者从被害人家属李海玉处获悉,针对他们的抗诉申请,12月28日,广东湛江检...
万科2022年度第五期中期票本... 转自:贝壳财经新京报贝壳财经讯 万科港交所公告,根据万科企业股份有限公司2022年度第五期中期票据2...
旭辉控股:境外债务重组12月2... 观点网讯:12月28日,旭辉控股集团对外宣布了境外债务重组的最新进展,明确了重组生效日期为2025年...
国图公开课迎来十周年 学者读者... 中新网北京12月28日电 (记者 应妮)“问渠那得清如许——国图公开课十周年特别活动”27日在国家图...