用GPT训练自家大模型账户遭OpenAI停用?字节:将全面检查确保合规

近日,有外媒报道称,字节跳动在使用OpenAI的技术开发自己的大语言模型,违反了OpenAI的服务条款。目前,字节跳动的账户已被OpenAI暂停。12月17日,字节跳动相关负责人回应澎湃新闻记者称:“公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。”据字节跳动介绍,今年年初,公司技术团队刚开始进行大模型的初期探索,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。随着公司在4月引入GPT API调用规范检查,这种做法已经停止。字节跳动方面表示,今年4月,字节大模型团队提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求,例如分批次抽样检测模型训练数据与GPT的相似度、避免数据标注人员私自使用GPT。字节跳动方面表示,在未来几天里会再次全面检查,以确保严格遵守相关服务的使用条款。此前,12月16日,有外媒报道称,字节跳动正在通过微软购买OpenAI的API访问/使用权,来开发自家的大语言模型,包括模型的训练和评估。而OpenAI的服务条款规定,OpenAI的模型输出不能用于“开发任何与我们的产品和服务相竞争的AI模型”,微软也奉行同样的政策。在发现字节跳动的这一行为后,OpenAI已暂停了该公司的账户。随后,OpenAI的发言人尼克·菲利克斯(Niko Felix)在当天发布了一则声明,确认字节跳动的账户已被暂停使用:“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于正当的用途。虽然字节跳动使用我们的API很少,但我们已经暂停了其账户,同时展开进一步调查。如果我们发现字节跳动的使用不符合这些政策,我们将要求对方做出必要的改变,或者终止其账户。”微软尚未对此事做出回应。