谷歌AI新突破：照片秒变视频，科技狂潮再升级 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

谷歌AI新突破：照片秒变视频，科技狂潮再升级

2024-12-10 / 阅读约3分钟

来源：T3

谷歌宣布为Google Cloud客户推出AI新技术Veo和Imagen 3，Veo可基于简单文本或图像提示创建高质量视频，Imagen 3可生成高细节和逼真图像，两者均将在谷歌的Vertex AI平台上提供。

(图片来源：谷歌)

今年，人工智能领域的讨论热度不减。尽管在功能和准确性方面仍处于起步阶段，谷歌却宣布了一系列针对Google Cloud客户的新技术，这些技术无疑令人眼前一亮。

在12月初的一篇Google Cloud博客文章中，谷歌产品管理高级总监沃伦·巴克利透露，公司正大力投资于AI技术，推出了两个新模型——Veo和Imagen 3。Veo是视频生成模型，而Imagen 3则专注于生成更高质量的图像。

Veo让用户仅凭简单的文本或图像提示即可创建视频。谷歌表示，它能以“高质量、高清视频”形式，并以“多种电影和视觉风格，以及极快的速度”完成视频创作。

谷歌在博客文章中展示了Veo如何从现有图像或AI生成的图像中制作视频片段。前两个示例利用Imagen 3创建的图像制作了短视频，如一个人从书中抬头微笑，以及一只狗站起来摇尾巴。

(图片来源：谷歌)

后两个示例则使用了真实世界的图像制作了短视频，第一个展示了棉花糖在噼啪作响的火上烤制的场景，第二个则呈现了音乐会上的观众。

谷歌指出，Veo具备“对自然语言和视觉语义的深刻理解”，从而能够生成精准的视频。新系统能够创造出逼真且连贯的动作，确保“人、动物和物体在镜头中都能栩栩如生地移动”。

在文本提示方面，谷歌提供了Veo模型处理这些提示的示例，如一只弹奏吉他的泰迪熊（当然，这听起来就很有趣），以及一艘帆船在波涛汹涌的海面上航行的场景。

至于Imagen 3，谷歌自豪地宣称它是公司迄今为止“质量最高的文本到图像模型”。该模型能生成更多细节丰富且逼真的图像，同时减少成像伪影。

Veo和Imagen 3都将在谷歌的Vertex AI平台上提供服务。目前，Veo提供私有预览版，而Imagen 3则计划从本周起对Vertex AI客户开放。

虽然这些技术目前主要面向大企业，但包括荣耀在内的智能手机制造商也已开始在自己的设备上提供如Imagen等模型，预示着更广泛的应用前景。

上一篇：YouTube新推出的自动配音功能现已全面开放，助力知识类内容全球化传播

下一篇：ElevenLabs的AI语音生成技术“极有可能”被用于俄罗斯影响力行动

返回列表

热文阅读

2 天前

AMD称Intel“欠佳产品”加剧Ryzen 9 9800X3D短缺

2 天前

台积电法说会前外资罕降目标价

2 天前

突发：传Arm考虑收购CPU公司

2 天前

马斯克呼吁加州和特拉华司法一把手强制拍卖OpenAI股份

2 天前

CES观察：AI PC大潮将至几大巨头谁是赢家？

2 天前

Microlino推出“反皮卡”专为美国市场设计

2 天前

黄仁勋在CES2025上“杀疯了”，但赢家不止英伟达

2 天前

阿里通义万相 2.1 模型宣布升级：首次实现中文文字视频生成功能，支持无限长 1080P 视频的高效编解码

2 天前

AI预测论文能不能中，8B超越70B大模型，港大发布图文融合多智能体GraphAgent

2 天前

台积电美国厂已开始生产Ryzen 9000系列

上一篇：YouTube新推出的自动配音功能现已全面开放，助力知识类内容全球化传播

下一篇：ElevenLabs的AI语音生成技术“极有可能”被用于俄罗斯影响力行动

C114通信网
通信人家园

7 X 24跟踪全球科技动态

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们

C114通信网

通信人家园