AIGC版权引发业界关注 26家单位联合发起倡议保护训练数据版权

近日,中文在线、同方知网、中国工人出版社等26家单位共同发布了国内首份有关AIGC训练数据版权的倡议书。

《中国经营报》记者注意到,该份倡议书主要面向AIGC领域专家、学者及AIGC从业机构,分别从深化版权问题研究、版权赋能产业发展、避免侵权、引导AI生成内容的合理使用、提升版权保护意识、优化内容授权渠道这六个方面提出了倡议,覆盖了从AIGC模型研发到产品使用,从版权问题理论研究到数据流通实践的各个环节。

目前,大模型训练数据绝大多数是从互联网抓取的,其中有些数据受到版权保护,但使用中并不加以区分。在全球AIGC数据侵权纠纷频发、国内《生成式人工智能服务管理办法(征求意见稿)》发布的大背景下,提出合理使用正版数据的倡议,是对AIGC研发主体的警示和启发。

在近期正在举办的第25届上海国际电影节上,路盛律师事务所争议解决业务和娱乐法业务联系负责人蒋南頔也对AIGC的版权保护分享了自己的看法。

蒋南頔认为,保护AI模型算法可以采用专利著作权、商业利益或反不正当竞争法下的财产权益等方式。而对于AI生成的形象和内容,关键问题是要确定是人创作还是机器创作。

记者了解到,无论是中国还是海外一些国家,主流的观点认为,如果是机器创作的,不应受到著作权保护,因为著作权保护的是人的思想表达。因此,在判断AI生成物是否受到著作权保护时,需要考虑其中人的创作成分的比重以及人对生成物的干预程度和预判能力。人的创作成分越高,干预过程越强,对生成物的预判越强,就越容易受到著作权保护。

“同时,还需要确定AI生成物的权属归属,即是由AI的研发者、使用者还是其他方享有。这取决于谁对产出物的贡献最大、决定因素最强,可能形成独立的权属或共同作品。风险与权利平行。权利与责任承担也相应对应,谁享有权利谁就更容易承担责任。无论是AI研发人员还是使用人员,对结果的预判越多,对其中创作者参与过程中的风险就越大。”蒋南頔说。

随着各项相关法规不断细化完善,保护正版数据所有者权益的呼声渐长,AIGC研发主体可能面临两难选择:仅使用免费的合规数据训练,可能因数据多样性不足、数据质量不高导致模型效果欠佳,甚至可能因数据安全性不足,面临模型抵御攻击性差、隐私信息暴露等风险;而要提高模型精度和AIGC产品竞争力,可能需要面临侵权风险或陷入繁复的授权流程。而且,AI的技术过程往往是一个黑箱,很难证明或发现其中的过程。因此,从著作权角度看,如果传统意义上的复制也难以证明,就需要从最终生成的内容入手。

“如果AI生成的作品与已发表的作品非常一致,风险就会更高。举例来说,如果是AI换脸生成的内容涉及到一些特定的形象,如史莱克、哈利·波特等,就可能产生侵权风险,还可能涉及到这些知名形象所凝聚的商业价值产生的不正当竞争风险,以及名人形象引发的人格权和肖像权方面的风险。”蒋南頔说。

倡议书也指出,保护版权能够为人工智能学习模型提供可靠、稳定、安全的内容来源,使模型效果更加显著。同时,倡议书提出了一个切实可行的解决方案:各方积极努力,在模型训练者与内容提供者之间搭建便利、有序的内容授权渠道。

此外,在虚拟偶像数字产品的创作、运营、商业变现和维权过程中,需要考虑权利的保护。对此,蒋南頔建议,可以通过商标申请、专利申请(如技术相关)、外观专利申请(如图形用户界面)、商业秘密保护(避免公开)等方式进行保护。此外,还需要关注行政审批和许可合规要求,特别是在数字人用于直播带货或其他商业演出时可能涉及的行政审批要求。