据美联社报道,本月早些时候曝光的年轻OpenAI举报人Suchir Balaji,被明显视为一起针对前雇主重大诉讼的关键证人。
就在离世前不久,这位26岁的Balaji在10月接受《纽约时报》采访时,就已对OpenAI所谓的非法版权行为发出警告。
据称,他与这家权威报纸的合作并未止步于此。Balaji后来向美联社透露,他打算在OpenAI最严重的版权侵权案件中“尝试作证”,并认为去年《纽约时报》提起的知名案件“最为严重”。
《纽约时报》显然也持相同看法。在11月18日的法庭文件中,该报律师将Balaji列为可能拥有“独特且相关文件”的人员,这些文件能够证明OpenAI故意侵犯版权。
Balaji在OpenAI工作了四年,但因对ChatGPT开发商公然无视版权法的行为感到震惊,于8月辞职。他亲自参与了公司的大规模数据抓取工作,在此过程中,公司几乎不加甄别地从网络上获取任何可用于训练其大型语言模型的内容。
“如果你相信我所相信的,”Balaji对《纽约时报》说,“你就必须离开这家公司。”
11月26日,即《纽约时报》刊登其报道一个月后,Balaji被发现死于旧金山的公寓内,警方称这起死亡事件看似自杀。他的死讯直到12月13日才被公开。
OpenAI公开对Balaji的离世表示哀悼。当时,公司发言人告诉CNBC:“我们得知这一令人痛心的消息后深感震惊,在这个艰难的时刻,我们的心与Suchir的亲人同在。”
Balaji被视为证人的那起知名诉讼由《纽约时报》于去年12月提起,指控OpenAI非法使用该报的版权作品来训练其聊天机器人。据美联社报道,另一起由喜剧演员莎拉·西尔弗曼对OpenAI和Meta提起的诉讼也在寻求Balaji的文件。
OpenAI和其他科技公司认为,他们在互联网上使用受版权保护的数据构成“合理使用”,因为AI模型极大地改变了这些内容。但Balaji持不同意见,他指出AI模型会创建所摄取数据的副本,并从中生成原创性存疑的文本。
“输出并非输入的精确副本,但它们也并非根本性的创新,”他10月告诉《纽约时报》。
Balaji的家人表示,本月晚些时候将在加利福尼亚州米尔皮塔斯的印度社区中心为他举行追悼会。