字节跳动秘密使用ChatGPT技术开发自己模型已被OpenAI拉黑

“
字节跳动秘密地倚赖OpenAI技术,开发竞争性大语言模型(LLM)。然而,此举直接违反了OpenAI服务条款,引发了关于数据隐匿以掩盖证据的内部讨论。OpenAI已经暂停字节跳动的账户,并表示将进一步调查此事。
据The Verge消息,字节跳动被曝光秘密使用OpenAI技术,自行开发竞争性大语言模型,即LLM。
这种行为在人工智能领域被广泛视为不当。更为严重的是,这直接违反了OpenAI的服务条款,规定其模型输出不能用于“开发与我们的产品和服务竞争的任何人工智能模型”。通过微软购买OpenAI访问权限的字节跳动同样受到相同政策的约束。不过,根据知情人士获得的字节跳动内部文件显示,OpenAI API在开发其基础LLM(代号为Project Seed)的几乎每个阶段都被秘密依赖,包括模型的训练和评估。
公司内部员工深知此举的影响,字节跳动内部员工在内部聊天工具上讨论如何通过“数据脱敏”来“掩盖”证据的讨论。这种滥用行为如此猖獗,以至于Project Seed的员工经常超过API访问的最大限额,显然是出于对被抓的担忧。
值得注意的是,在生成式人工智能竞赛中,即使是最大的参与者也在寻求捷径。
在字节跳动使用GPT训练自家人工智能模型后,OpenAI做出了回应,决定暂停其账户。字节跳动通过使用GPT生成的数据来训练其在中国推出的竞争性模型,这违反了Microsoft和OpenAI的开发者许可。
报道发布后,OpenAI发言人Niko Felix发布了一份声明,证实了字节跳动账户的暂停:
“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于善良目的。尽管字节跳动对我们API的使用很少,但我们已经暂停了他们的账户,同时我们将进一步调查。如果我们发现他们的使用不符合这些政策,我们将要求他们进行必要的更改或终止他们的账户。”
正如之前所报道的,字节跳动大部分的GPT使用是通过Microsoft的Azure平台完成的,而不是直接通过OpenAI。至于微软是否会效仿OpenAI,暂停字节跳动的访问权限,有待进一步观察。

共有 0 条评论