IT之家 11 月 30 日消息,阿里云通义万相团队本周推出了全新的图像编辑模型 ACE,通过一句话,用户即可生成图片和修改图片。该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义 App。
据官方介绍,ACE 模型可同时支持文生图和图像编辑,用户输入口语化指令可完成可控视觉编辑、元素编辑、区域重绘编辑、分层编辑(IT之家注:如下图,将图中特定对象进行风格化处理)等任务,仅用对话的方式就能实现 PS 的功能,例如输入文字即可一键除水印、修改证件照背景等。
该团队提出了 Long-context Condition Unit 模块(LCU),能支持通用编辑任务所需的各种多模态条件输入,并且搭建了全面的编辑成对数据构造链路和指令集生成链路,最终达到精准、高质量的图像指令编辑效果。
开源地址:
魔搭社区:https://www.modelscope.cn/models/iic/ACE-0.6B-1024px
Github:https://github.com/ali-vilab/ACE
Huggingface:https://huggingface.co/spaces/scepter-studio/ACE-Chat