谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片以图生图 - AI - C114+

7 x 24跟踪全球科技动态

热门话题

白天

搜索

/

/

资讯

/

/

谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片以图生图

2024-12-17 / 阅读约2分钟

来源：IT之家

谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具，该工具允许用户使用其他图像作为提示来生成图像，而不需要冗长的文本提示。用户只需提供图像，即可指定 AI 生成图像的主题、场景和风格。

IT之家 12 月 17 日消息，谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具，该工具允许用户使用其他图像作为提示来生成图像，而不需要冗长的文本提示。用户只需提供图像，即可指定 AI 生成图像的主题、场景和风格。

使用 Whisk 时，用户可以为主题、场景和风格分别提供多张图像作为提示。（当然，用户仍然可以选择使用文字提示。）如果手头没有合适的图像，用户还可以点击骰子图标，由谷歌自动填充一些图像作为提示（这些图像似乎也是 AI 生成的）。此外，用户还可以在流程的最后阶段在文本框中输入一些文字，以添加关于目标图像的额外细节，但这并非必需步骤。

Whisk 随后会生成图像，并为每张图像生成相应的文本提示。如果用户对生成结果满意，可以选择收藏或下载图像；如果需要进一步调整，则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。

IT之家注意到，谷歌在一篇博文中强调，Whisk 的设计初衷是“快速的视觉探索，而非像素级的精细编辑”。该公司还表示，Whisk 可能会出现“偏差”，因此允许用户编辑底层的提示。

据体验者称，在短暂的使用过程中，Whisk 带来了有趣的体验。图像生成需要几秒钟的时间，虽然生成的图像有时会有些奇怪，但所有生成的内容都易于迭代修改。

谷歌表示，Whisk 使用的是其最新一代的 Imagen 3 图像生成模型，该模型也于今日发布。

上一篇：Google版Sora深夜秀肌肉 4K视频生成再度狙击OpenAI

下一篇：谷歌最强 AI 视频生成模型 Veo 2 登场：最高 4K 分辨率，提高对现实世界理解

2 天前

AMD锐龙5 7533HS APU携手联想经济型笔记本系列亮相

2 天前

初创公司 Atum Works 推出纳米级 3D 打印技术，芯片制造成本可削减 90%

2 天前

砸开核桃造“芯片”！“六个核桃”母公司16亿杀入半导体

2 天前

华进半导体“有源光芯片转接板及其制备方法”专利公布

2 天前

英特尔CEO陈立武会见魏哲家，暗示与台积电进行晶圆代工合作

2 天前

【IPO】粤芯半导体启动IPO辅导,广发证券担任辅导机构；证监会:同意同宇新材创业板IPO注册；万业企业年报及一季报实现材料设备双突破,一季度营收大幅提升近翻倍

2 天前

东京大学研发新型芯片冷却技术，是传统水冷的十倍

2 天前

英特尔似乎承认我们都知道的事实：没有人会购买AI PC

2 天前

三星呼吁美国商务部明确半导体出口管制条款，担忧阻碍创新

1 天前

紫光国微 2024 年报：归母净利润 11.79 亿元，同比下降 53.43%

上一篇：Google版Sora深夜秀肌肉 4K视频生成再度狙击OpenAI

下一篇：谷歌最强 AI 视频生成模型 Veo 2 登场：最高 4K 分辨率，提高对现实世界理解

C114通信网
通信人家园

7 X 24跟踪全球科技动态

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们

通信人家园