阿里巴巴AI框架EMO，让照片人物开口“说话”，创新引领阅读新潮流。

2024-03-22

感谢网友仙人掌、鸡排饭加个蛋、落木飘的线索投递！

3 月 1 日消息，阿里巴巴研究团队近日发布了一款名为“EMO（Emote Portrait Alive）”的 AI 框架，该框架号称可以用于“对口型”，只需要输入人物照片及音频，模型就能够让照片中的人物开口说出相关音频，支持中英韩等语言。

阿里巴巴AI框架EMO，让照片人物开口“说话”，创新引领阅读新潮流。 (https://www.qianyan.tech/) AI 第1张

据悉，EMO 基于英伟达的 Audio2Video 扩散模型打造，号称使用了超过 250 小时的专业视频进行训练，从而得到了相关 AI 框架。

注意到，研究团队分享了几段由 EMO 框架生成的 DEMO 演示片段，并在 ArXiv 上发布了模型的工作原理，感兴趣的小伙伴也可以访问 GitHub 查看项目。

阿里巴巴AI框架EMO，让照片人物开口“说话”，创新引领阅读新潮流。 (https://www.qianyan.tech/) AI 第2张

▲ 图源研究人员发布的 DEMO 片段

据介绍，该框架工作过程分为两个主要阶段，研究人员首先利用参考网络（ReferenceNet）从参考图像和动作帧中提取特征，之后利用预训练的音频编码器处理声音并嵌入，再结合多帧噪声和面部区域掩码来生成视频，该框架还融合了两种注意机制和时间模块，以确保视频中角色身份的一致性和动作的自然流畅。

研究人员援引一系列实验结果，声称 EMO 不仅能够产生令人信服的说话视频，还能生成各种风格的歌唱视频，号称“显著优于目前的 DreamTalk、Wav2Lip、SadTalker 等竞品”。

阿里巴巴AI框架EMO，让照片人物开口“说话”，创新引领阅读新潮流。

相关推荐

ChatGPT问世600天，AI遭遇梦醒时分

多家高端制造企业共话AI赋能制造业或将成为人工智能应用“主战场”|聚焦

上海三大先导产业母基金发布此次发布的母基金总规模1000亿元

首家国产大模型独角兽下场文生视频记者实测智谱AI生成视频模型清影（Ying）

规模化瓶颈难破题萝卜快跑们短期难“卷”网约车

最新

离岸人民币/兑美元/较周四纽约尾盘跌233点

中央气象台7月27日06时继续发布暴雨橙色预警

连续三年高增长小游戏市场风头正劲

文远知行申请美国IPO

比特币期货涨超4%上探6.9万美元，以太币期货本周跌约8.2%

美元周五和本周都大致持平，日元累涨超2.3%，一度突破152

热点

AI与细菌助力，阿尔茨海默症治疗药物研发进展显著。

特斯拉计划裁员10%，精简团队，提升效率，引发市场关注。

理想AI+区块链项目四：创新融合，引领未来，重塑行业格局。

"中兴通讯携手中国电信，高铁5G商用服务创新突破，引领新时代。"

百万纯电超跑仰望U9，震撼登场，极致性能，引领潮流。

"Google Gemini与ChatGPT对比：Gemini更胜一筹，你选对了吗？"

谷歌八才子揭秘AI奥秘，引领未来科技浪潮！

2024年RedCap启航，芯片模组迭代升级，引领行业新潮流。

MWC24揭秘5.5G商用新动向，产业链信号已全面释放，不容错过！

骁龙8s领航新纪元，第三代能否再登性能之巅，引发行业瞩目？

阿里巴巴AI框架EMO，让照片人物开口“说话”，创新引领阅读新潮流。

相关推荐

ChatGPT问世600天，AI遭遇梦醒时分

多家高端制造企业共话AI赋能 制造业或将成为人工智能应用“主战场”|聚焦

上海三大先导产业母基金发布 此次发布的母基金总规模1000亿元

首家国产大模型独角兽下场文生视频 记者实测智谱AI生成视频模型清影（Ying）

规模化瓶颈难破题 萝卜快跑们短期难“卷”网约车

最新

离岸人民币/兑美元/较周四纽约尾盘跌233点

中央气象台7月27日06时继续发布暴雨橙色预警

连续三年高增长 小游戏市场风头正劲

文远知行申请美国IPO

比特币期货涨超4%上探6.9万美元，以太币期货本周跌约8.2%

美元周五和本周都大致持平，日元累涨超2.3%，一度突破152

热点

AI与细菌助力，阿尔茨海默症治疗药物研发进展显著。

特斯拉计划裁员10%，精简团队，提升效率，引发市场关注。

理想AI+区块链项目四：创新融合，引领未来，重塑行业格局。

"中兴通讯携手中国电信，高铁5G商用服务创新突破，引领新时代。"

百万纯电超跑仰望U9，震撼登场，极致性能，引领潮流。

"Google Gemini与ChatGPT对比：Gemini更胜一筹，你选对了吗？"

谷歌八才子揭秘AI奥秘，引领未来科技浪潮！

2024年RedCap启航，芯片模组迭代升级，引领行业新潮流。

MWC24揭秘5.5G商用新动向，产业链信号已全面释放，不容错过！

骁龙8s领航新纪元，第三代能否再登性能之巅，引发行业瞩目？

多家高端制造企业共话AI赋能制造业或将成为人工智能应用“主战场”|聚焦

上海三大先导产业母基金发布此次发布的母基金总规模1000亿元

首家国产大模型独角兽下场文生视频记者实测智谱AI生成视频模型清影（Ying）

规模化瓶颈难破题萝卜快跑们短期难“卷”网约车

连续三年高增长小游戏市场风头正劲