2025年3月26日,OpenAI 的GPT-4o 新一代图像生成器上线后,用户开始疯狂地利用这款 AI 工具通过吉卜力的视角重新想象标志性人物和虚构世界:埃隆•马斯克、《指环王》中的人物、蒙娜丽莎、9/11 笑话等,都以宫崎骏电影的风格重现网络,甚至美国白宫、空中客车、印度邮政这样的“严肃”机构,也都参与了这一场吉卜力画风的游戏中。
模仿某种艺术风格这一类功能并非OpenAI所独创,更不是最近才开发的新功能。但因为吉卜力极具风格化图片病毒式的传播,以及白宫发布的一张被拘留者的吉卜力风格图片被解读出的各种政治意涵,有关版权法和生成式AI伦理评判的讨论再次爆发。
很多人认为这很有趣,也很具有革命性,它使艺术创作民主化,甚至让那些没有艺术技能的人也能在自己粗略的构想中实现可爱的“吉卜力”风格;但也有很多人,包括艺术家、吉卜力粉丝以及法学工作者则担心,人工智能复制可能会模糊艺术界的原创性和真实性的界限,从而影响传统动画师和工作室的收入来源。
“艺术家与人工智能”的张力正在持续紧张。OpenAI虽然声称避免复制“个别在世艺术家的风格”,但它一直在践行并推动政策允许AI对版权内容的训练;而小部分能够承担高昂诉讼成本的艺术家,却也因为版权法灰色地带而面临不确定的局面,更不要说那些不知名的艺术家们了。在影响整个AI系统以及艺术创作经济的判例或立法出现之前,我们绝对有必要对目前的情形和对策进行细致分析和反思。
简单来说,各国的著作权或版权法保护的是具体作品的表达形式,如一幅画的构图、一首诗的词句,而非作品背后的思想、技巧或风格。这是一条普遍的原则。
“风格”通常被视为一种抽象的理念,一般是被多人甚至一代人所共享的。版权法虽然要求并鼓励作品具备“独创性”(Originality),但更提倡“思想共享”,并将其作为一种公共资源允许其传承和迭代。如果将其作为版权法的保护对象,不仅在法律上没有操作性,而且会阻碍艺术发展,且影响艺术品的经济性和商业价值。
尽管艺术风格可能不受版权法的特别保护,但还有其他法律工具可以用来保护艺术家。
模仿写作或艺术风格可能构成“不正当竞争”行为,尤其是当其创作的作品利用了原创者的声誉或降低了其作品的价值时。像吉卜力这种知名工作室拥有庞大粉丝群体,其风格具备明确的商业号召力。OpenAI正在利用 “吉卜力风格”作为营销术语迅速积累付费用户,同时它又没有付给其工作室相应的版权费,这就可能形成“不正当竞争”。
此外,白宫在其 X 账户发布了一张哭泣的被拘留者的照片,这张照片就使用了“吉卜力”的滤镜。这引起了吉卜力粉丝强烈的不适感甚至抗议。这种明显与吉卜力电影思想相违背的政治性图片,是粗俗和幼稚的,无法让人认同其为一种良好且有效的政府治理。OpenAI无法限制用户将这一风格应用于什么样的“表达”,当吉卜力工作室将这些无意义甚至粗劣的表达视为“侮辱”时,有可能提起“不正当竞争”的诉讼。
版权法意义上的“风格”,与人们通常所说的风格,可能有所不同。普通人日常交流中的“艺术家风格”实际上可能是“艺术作品中更具体、更可辨别、更独立的元素”,肯定包括思想层面的,但也不排除表达层面的。
因此,如果“吉卜力”滤镜产生了相关的侵权诉讼,还需要在AI的输出中甄别出是否存在吉卜力电影中相同或基本相似的元素。
在美国,法院也曾在某种情况下将艺术家的风格视为侵权判定的一部分。例如,在纽约南区1987年对斯坦伯格诉哥伦比亚电影工业公司案中,电影《哈德逊河上的莫斯科》的海报被裁定侵犯了艺术家索尔•斯坦伯格的杂志封面,虽然两者之间存在明显差异。法院援引了两幅图像之间引人注目的风格关系,称“由于风格是‘表达’的一个要素,这种关系非常重要。”
2025年1月,我国刚刚判结的“西尔万诉知名画家叶永青侵害著作权纠纷案”,或许对于AI风格化输出是否具有侵权性质具有一定借鉴作用。
2023年8月22日,北京知识产权法院就西尔万诉叶永青侵害著作权纠纷案做出一审判决:要求被告停止涉案侵权行为、向原告道歉并赔偿500万元。2025年1月北京高院做出了二审判决,维持一审判决。本案中的涉案作品就是系统性地“借鉴”西尔万的画作风格,使用其标志性元素,形成其“个人”作品。这与AI作画的原理极其相似。
因此在该案的判决书中,有两点值得注意的是:
(1)法官认为应当从普通观察者角度考虑是否侵权,因为普通观察者一般不会刻意寻找差异,当他们倾向于忽略差异、认为二者相似时,则可以认定二者构成实质性相似;
(2)法官在分析画作时,拆解了画作中的构图元素,例如带把手的鸟类、怪蜻蜓等,认为这些体现了原作者个性化的元素应受到著作权法保护,因此如果这些元素被保留,即可被认为侵权。而这种元素拆解的方法,也正是AI学习艺术家风格的方式,在输出中保留了某种程度的原画元素,也可能被认定为侵犯版权。
美国版权局2024年7月发布的报告,对此解释说:风格被视为一种理念,而理念不同于理念的具体表达,并不受法律保护。不过报告也强调,如果受版权保护的作品被用于训练人工智能模型,创作者的权利可能会受到侵犯,可以提出索赔。
也就是说,OpenAI 的图像生成器如果提供高质量的“吉卜力”风格但与该工作室的版权图画并不相似的图片,法律上并不侵犯吉卜力工作室的版权;但是,如果OpenAI使用了受版权保护的“吉卜力”电影或图片进行训练,那么则有可能造成侵权。
根据我们对人工智能训练方式的理解,这一训练过程即AI输入阶段的使用了吉卜力受版权保护的作品,几乎是肯定的。但这里涉及两个问题值得我们思考:
华盛顿大学和艾伦人工智能研究所最近的研究《需要多少幅梵高作品才能画出梵高的作品?寻找模仿阈值》表明,存在一个特定的阈值,该阈值对于确定 AI 模型是否有效地复制了相似作品非常重要。
模型显示,低于 450 张图像的任何数量都会产生严重扭曲的 AI 图像,而超过 600 张图像时模仿程度会显著增强,图像越多相似性就会变得越清晰而明显。
通过将人工智能模仿编码为这种被称为 MIMETIC 2 的特定公式,法院和隐私权倡导者将能够以此作为证据,判断人工智能是否能够模仿某件作品,或者是否未达到训练阈值。
但事实上,训练过程的复杂性不止如此。在2024年一本新书《数据抢夺:大型科技公司的新殖民主义及如何反击》(Data Grab: The New Colonialism of Big Tech and How to Fight Back)中,作者向“不明真相”的普通大众陈述了一个真相:为了让人工智能可以模仿特定名人的风格(例如达利的画作、奥斯汀的小说等),AI还需要学习更多其他艺术家、作家的作品,以及“你”——普通人写的东西,这可能包含了我们上传社交媒体平台的视频、图片等。
这远远超出了我们最初考虑版权问题时对AI运作过程和搜集数据量级的想象。
很多律师和法学家都认为,当前的关键问题是人工智能对现有作品的训练可能导致的版权侵权。
但为什么只是“可能”而不是“肯定”导致版权侵权?
因为被诉的人工智能巨头的律师在辩解中提出了一个关键问题:人工智能公司是否拥有与人类相同的合理使用权利?
(1)AI训练模拟人类的学习过程
人工智能训练的过程本身并不是什么新鲜事:吸收旧事物,然后催生新事物。作家必须先读书才能学会写作,画家都是以临摹、模仿先辈作品开始的艺术之路,音乐家互相聆听彼此的作品,甚至模仿先驱的风格。
人工智能模型在接受训练时所做的,无非就是人类在学生阶段所做的——吸收艺术的基本知识,并学习如何利用这些知识创作出与自身地位相称的全新原创作品。因此,人类在复制艺术和摄影等原创媒体形式时都可以依赖合理使用原则。
因此,有人认为,人工智能有意或无意地模仿历史上著名的艺术家,也应当获得与学生同样的合理使用的权益。
(2)“合理使用”难以标准化
“合理使用”是防止被诉版权侵权的重要防御措施。它允许有限地使用受版权保护的材料,而无需获得版权持有者的许可。
但如何判定是否属于“合理使用”,实则取决于每个案件的具体事实,包括使用的目的、受版权保护作品的性质、使用部分的数量和实质性,以及使用对受版权保护作品的潜在市场或价值的影响。
这一判断过程是一个复杂的平衡行为。
(3)社会利益整体平衡的难题
“艺术家与人工智能”这一表面的困境之下,我们通常认为这里的利益主体只有AI公司和创作者。但实际上远不止于此。
吉卜力画风图片病毒式的传播,充分说明了普通人进入创意产业的巨大需求和发展趋势。以特定风格创作艺术的能力和较低的准入门槛可以影响人们创作过程的方式,有可能带来新的受众和新的创作途径。因此,对于使用AI创作获得愉悦感甚至经济利益的人来说,他们的利益和诉求,不应当被忽略。
另外,人工智能供应链中,还有一部分不为大众所熟知的“幽灵工人”。他们通过提供数据清理、标签、内容审核等人工智能系统净化的劳动,为全球AI大爆炸做出了贡献(参见《喂养机器:AI背后隐藏的人类劳动》)。如果利益分配必须考虑对原创作者的补偿,那么人工智能培训所必需的其他形式劳动(如内容标签或审核)也应当被考虑进去。
然而,在版权框架内,法律只承认一种形式的智力劳动,而忽视承认其他类型劳动同样相关的贡献,因此版权的扩大可能会导致人工智能培训劳动力的不公平分层。
很多美国律师和专家都认为,即使吉卜力工作室向OpenAI提出诉讼,也很难获得法院支持。因为现有版权法对于风格的模仿无法形成有效且确定的保护,对于AI的训练使用版权内容的“合理使用”问题也很难预测结果。
此外,通过上述简要分析,仅仅使用版权框架作为这类问题的对策,也可能会忽略其他重要的利益主体。
作为一项前沿技术,人工智能的实施引发了与创新相关的不同法律领域,包括数据保护、消费者保护、反垄断,以及知识产权等。因此,我们不应当孤立地考虑AI伦理问题,而应从整体上反思人工智能对与现代社会及其传统规则的突破性——从法律、伦理、经济和文化等多维度理解和推动人工智能的发展,以及人工智能在数字社会中的部署。