(图片来源:谷歌)
今年,人工智能领域的讨论热度不减。尽管在功能和准确性方面仍处于起步阶段,谷歌却宣布了一系列针对Google Cloud客户的新技术,这些技术无疑令人眼前一亮。
在12月初的一篇Google Cloud博客文章中,谷歌产品管理高级总监沃伦·巴克利透露,公司正大力投资于AI技术,推出了两个新模型——Veo和Imagen 3。Veo是视频生成模型,而Imagen 3则专注于生成更高质量的图像。
Veo让用户仅凭简单的文本或图像提示即可创建视频。谷歌表示,它能以“高质量、高清视频”形式,并以“多种电影和视觉风格,以及极快的速度”完成视频创作。
谷歌在博客文章中展示了Veo如何从现有图像或AI生成的图像中制作视频片段。前两个示例利用Imagen 3创建的图像制作了短视频,如一个人从书中抬头微笑,以及一只狗站起来摇尾巴。
(图片来源:谷歌)
后两个示例则使用了真实世界的图像制作了短视频,第一个展示了棉花糖在噼啪作响的火上烤制的场景,第二个则呈现了音乐会上的观众。
谷歌指出,Veo具备“对自然语言和视觉语义的深刻理解”,从而能够生成精准的视频。新系统能够创造出逼真且连贯的动作,确保“人、动物和物体在镜头中都能栩栩如生地移动”。
在文本提示方面,谷歌提供了Veo模型处理这些提示的示例,如一只弹奏吉他的泰迪熊(当然,这听起来就很有趣),以及一艘帆船在波涛汹涌的海面上航行的场景。
至于Imagen 3,谷歌自豪地宣称它是公司迄今为止“质量最高的文本到图像模型”。该模型能生成更多细节丰富且逼真的图像,同时减少成像伪影。
Veo和Imagen 3都将在谷歌的Vertex AI平台上提供服务。目前,Veo提供私有预览版,而Imagen 3则计划从本周起对Vertex AI客户开放。
虽然这些技术目前主要面向大企业,但包括荣耀在内的智能手机制造商也已开始在自己的设备上提供如Imagen等模型,预示着更广泛的应用前景。