图片来源:Stefano Guidi / Getty Images
OpenAI从未公开其用于训练视频生成AI Sora的确切数据来源。但从表面迹象来看,至少部分数据可能源自Twitch直播和游戏攻略。
Sora于周一发布,我已进行初步试用(在容量允许范围内)。通过文本提示或图像,Sora能生成长达20秒的视频,支持多种宽高比和分辨率。
当OpenAI在2月首次公布Sora时,已暗示使用Minecraft视频训练模型的事实。因此,我好奇训练集中是否还包含其他视频游戏攻略?
似乎确实如此。
Sora能生成一个类似《超级马里奥兄弟》克隆版的视频(尽管略显卡顿):
图片来源:OpenAI
它能创建受《使命召唤》和《反恐精英》启发的第一人称射击游戏画面:
图片来源:OpenAI
它还能输出展示90年代《忍者神龟》游戏风格的街机格斗游戏片段:
图片来源:OpenAI
Sora似乎还了解Twitch直播的风格——暗示它曾观看过直播。请查看下方截图,它大致捕捉到了要点:
使用Sora生成的视频截图。图片来源:OpenAI
截图另一值得注意之处是:它呈现了知名Twitch主播Raúl Álvarez Genes(网名Auronplay)的形象,甚至包括Genes左手前臂上的纹身。
Auronplay并非Sora似乎“认识”的唯一Twitch主播。它还生成了一个与Imane Anys(更广为人知的网名是Pokimane)外貌相似(带有艺术加工)的角色视频。
图片来源:OpenAI
诚然,我不得不在某些提示上发挥创意(如“意大利水管工游戏”)。OpenAI已实施过滤措施,防止Sora生成描绘受商标保护角色的片段。例如,输入类似“Mortal Kombat 1游戏玩法”的内容将不会产生与标题相似的内容。
但我的测试表明,游戏内容可能已进入Sora的训练数据。
OpenAI一直对其训练数据来源讳莫如深。在3月接受《华尔街日报》采访时,OpenAI当时的首席技术官米拉·穆拉蒂(Mira Murati)未直接否认Sora是用YouTube、Instagram和Facebook内容训练的。在Sora的技术规格中,OpenAI承认使用了“公开可用”的数据以及来自Shutterstock等库存媒体库的许可数据来开发Sora。
OpenAI最初未回应置评请求。但在这篇报道发布后不久,一位公关代表表示他们将“与团队核实”。
若游戏内容确实在Sora的训练集中,则可能产生法律影响——尤其是若OpenAI在Sora基础上构建更多交互体验时。
“使用未授权的游戏攻略视频片段进行训练的公司面临诸多风险,”普赖尔·卡什曼律师事务所(Pryor Cashman)的知识产权律师约书亚·韦根斯伯格(Joshua Weigensberg)告诉TechCrunch。“训练生成式AI模型通常涉及复制训练数据。若这些数据是游戏视频攻略,则训练集中极可能包含受版权保护的材料。”
像Sora这样的生成式AI模型是概率性的。它们在大量数据上训练,学习数据中的模式以进行预测——例如,人咬汉堡会留下咬痕。
这是有用的属性。它使模型能通过观察世界来“学习”其运作方式。但也可能成为阿喀琉斯之踵。当以特定方式提示时,许多在公共网络数据上训练的模型会产生接近训练样本的副本。
Sora的样本。图片来源:OpenAI
这自然会让作品未经许可就被用于训练内容的创作者感到不满。越来越多的创作者正通过司法系统寻求补救措施。
微软和OpenAI目前正因据称允许其AI工具复制受许可的代码而被起诉。三款广受欢迎的AI艺术应用Midjourney、Runway和Stability AI背后的公司正面临侵犯艺术家权利的指控。主要音乐标签已对开发AI驱动的歌曲生成器的两家初创公司Udio和Suno提起侵权诉讼。
许多AI公司长期以来一直声称受到合理使用保护,坚称它们的模型创造的是具有变革性的作品,而非抄袭。例如,Suno认为,不加区分的训练与“孩子在听了摇滚乐后自己写摇滚歌曲”没有区别。
但道尔西·惠特尼律师事务所(Dorsey & Whitney)专注于版权法的律师埃文·埃弗里斯特(Evan Everist)表示,游戏内容有一些独特的考虑因素。
“游戏攻略视频至少涉及两层版权保护:游戏内容受游戏开发商所有,以及玩家或拍摄玩家体验的视频制作人创作的独特视频,”埃弗里斯特在给TechCrunch的电子邮件中写道。“对于一些游戏来说,还可能有以用户生成内容形式出现的第三层权利。”
埃弗里斯特以Epic的《堡垒之夜》为例,该游戏允许玩家创建自己的游戏地图并与其他玩家分享。他说,一段这些地图之一的游戏攻略视频将至少涉及三个版权所有者:(1) Epic,(2) 使用地图的人,以及(3) 地图的创建者。
Sora的样本。图片来源:OpenAI
“若法院发现训练AI模型存在版权责任,则这些版权所有者都可能是潜在原告或许可方,”埃弗里斯特说。“对于任何使用此类视频训练AI的开发人员来说,风险暴露是指数级的。”
韦根斯伯格指出,游戏本身有许多“受保护”的元素,如专有纹理,法官可能会在知识产权诉讼中考虑这些元素。“除非这些作品已获得适当许可,”他说,“否则在其上进行训练可能构成侵权。”
TechCrunch联系了多家游戏工作室和发行商以征求意见,包括Epic、微软(拥有《我的世界》)、育碧、任天堂、Roblox以及《赛博朋克2077》开发商CD Projekt Red。很少有公司回应,且没有任何公司愿意公开发表声明。
“我们目前无法参与采访,”CD Projekt Red的一位发言人表示。EA告诉TechCrunch,“我们目前没有任何评论。”
AI公司可能在这些法律纠纷中获胜。法院可能会决定,生成式AI具有“高度可信的变革性目的”,这遵循了大约十年前出版业对谷歌提起诉讼时设立的先例。
在该案中,法院裁定,谷歌为Google Books(一种数字档案馆)复制数百万本书籍是允许的。作者和出版商曾试图辩称,在线复制他们的知识产权构成侵权。
但若生成式模型复制了受版权保护的作品,然后有人发布该作品或将其纳入另一个项目,该人仍可能因知识产权侵权而承担责任。
“生成式AI系统通常会输出可识别的、受保护的知识产权资产,”韦根斯伯格说。“更简单的生成文本或静态图像的系统往往难以防止其输出中包含受版权保护的材料,因此更复杂的系统无论程序员的意图如何,都可能存在同样问题。”
Sora的样本。图片来源:OpenAI
若出现此类情况,一些AI公司拥有赔偿条款来覆盖。但这些条款通常包含例外情况。例如,OpenAI的条款仅适用于企业客户,不适用于个人用户。
韦根斯伯格说,除版权外,还有其他风险需考虑,如侵犯商标权。
“输出还可能包含与营销和品牌相关的资产,包括可识别的游戏角色,这会产生商标风险,”他说。“或者输出可能会产生姓名、形象和肖像权的风险。”
对世界模型的兴趣日益浓厚可能使这一切进一步复杂化。世界模型的一种应用(OpenAI认为Sora即是)本质上是实时生成视频游戏。若这些“合成”游戏与模型训练所用内容相似,则可能引发法律问题。
“在视频游戏的声音、动作、角色、歌曲、对话和艺术品上训练AI平台构成版权侵权,就像在其他上下文中使用这些元素一样,”麦肯思律师事务所(McKool Smith)的知识产权诉讼律师艾弗里·威廉姆斯(Avery Williams)说。“针对生成式AI公司的众多诉讼中提出的合理使用问题将同样影响视频游戏行业以及其他任何创意市场。”