字节跳动 OmniHuman 多模态视频生成模型即将上线，图片 + 音频便可生成视频

5 小时前 / 阅读约1分钟

来源：IT之家

据第一财经报道，即梦 AI 相关负责人透露，OmniHuman 模型未来会进行小范围内测，官方也会对这一功能设置严格的安全审核机制，并对输出的视频标注水印以作提醒。

IT之家 2 月 7 日消息，据第一财经报道，字节跳动旗下一站式 AI 创作平台即梦 AI 将上线多模态视频生成模型 OmniHuman，仅需一张图片与一段音频便可生成一条 AI 视频，该模型为字节自研闭源模型。

即梦 AI 相关负责人透露，该模型未来会进行小范围内测，官方也会对这一功能设置严格的安全审核机制，并对输出的视频标注水印以作提醒。

IT之家注意到，字节跳动的研究人员近日展示了一款 AI 模型，可以通过一张图片和一段音频生成半身、全身视频。字节跳动表示，和一些只能生成面部或上半身动画的深度伪造技术不同，OmniHuman-1 能够生成逼真的全身动画，且能将手势和面部表情与语音或音乐精准同步。

1 天前

存储巨头即将迈向新世代：西部数据预告本财季完成闪存业务分拆

1 天前

1 天前

2025年工作站最佳CPU

1 天前

苹果M5已经量产首发不是MacBook

1 天前

玩家买到错版英伟达显卡：公版 RTX 5080 用上 RTX 5090 背板

1 天前

高通 CEO 安蒙称 Arm 已撤回终止许可协议的“威胁”

1 天前

英伟达、英特尔和 AMD，联手投出一家“芯片独角兽”

2 天前

AMD去年Q4营收76.58亿美元高于市场预期

2 天前

AMD修复了影响Zen 1至Zen 4 EPYC CPU的关键微码漏洞

1 天前