OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练
1 天前 / 阅读约2分钟
来源:IT之家
OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。
感谢IT之家网友 HH_KK 的线索投递!

IT之家 1 月 29 日消息,近期中国人工智能公司 DeepSeek 因推出价格低廉且性能媲美 OpenAI 旗舰产品的 AI 模型,在全球引发巨大震动。然而,OpenAI 怀疑这些模型是基于其数据开发的。

据彭博社报道,OpenAI 和微软正在调查 DeepSeek 是否通过 OpenAI 的 API 将 OpenAI 的 AI 模型整合到 DeepSeek 自有的模型中。消息人士称,微软的安全研究人员在 2024 年底发现,大量数据通过 OpenAI 开发者账户被导出,而这些账户被认为与 DeepSeek 有关联。

OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。据IT之家了解,“蒸馏”是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。不过,OpenAI 并未透露其发现的具体证据细节。

TheVerge 称,这充满了讽刺意味,毕竟 OpenAI 自身也曾通过大规模抓取网络上的文字信息(未经许可)来推动其 GPT 模型的发展。

OpenAI 在一份声明中表示:“我们深知,中国等国家的公司以及其他一些企业一直在试图蒸馏美国领先 AI 公司的模型。作为 AI 领域的领军者,我们采取了反制措施来保护我们的知识产权,这包括在发布模型时谨慎选择哪些前沿功能可以包含在内。我们相信,未来与美国政府密切合作,以防止对手和竞争对手窃取美国技术,保护最先进的模型,是至关重要的。”