美国一地方法院最新判决支持用受版权保护的素材训练人工智能模型的行为,此判决对于创意行业影响深远。
近年来,内容创作者和艺术家们一直在为自己的权益受到侵犯而苦恼。许多人工智能公司未经许可,擅自抓取网站内容和扫描书籍,用来训练大型语言模型。这些模型后来被用于生成内容甚至商业化,但创作者们并未因此获得任何报酬。
本次判决由加州北区法院作出,裁定人工智能公司可以自由使用几乎所有已出版的媒体内容进行模型训练。这一裁定缘起于2024年提起的一场诉讼,原告包括安德里亚·巴尔茨、查尔斯·格雷布和柯克·沃利斯·约翰逊,他们指控Anthropic公司非法使用盗版资料来训练其“克劳德”人工智能模型。
据悉,Anthropic曾为训练模型,将印刷的书籍制作成数字副本。法院判决中,法官威廉·奥尔斯普(William Alsup)认为,使用这些复制品进行模型训练是合理使用行为。这意味着,将实体印刷书籍数字化后再用于训练人工智能,属于法律上的合理使用范畴。
法官还指出,利用从图书馆借来的实体书籍转换成数码格式,再用以训练模型,也不违反版权法。他以比喻形象表达,若有人用类似理由反对训练学生写作,显得不合理——因为人工智能模型在法律上并不被视为“学生”。
他强调,版权法的目的是鼓励创造,而不是保护作者免受市场竞争的冲击。鉴于此,盗版资料的使用虽能在某些方面获得短暂的“成功”,但以盗版内容建立的数字图书馆,仍不属于合理使用行为。即便Anthropic后来购买了盗版书的正版,也不能免责。
针对盗版行为,法院将举行审判以判定赔偿金额。此前,有报道指出苹果公司正与Anthropic合作,将“克劳德”系列的人工智能技术融入新版苹果开发工具,以提升开发效率。
对于内容创作者来说,此次判决无疑是个坏消息。无论是艺术家、音乐人,还是作家,他们的作品在无形中成为了人工智能学习的“数据源”,而他们却未获得任何补偿。这也让许多从业者感到担忧:未来他们的知识产权保护可能会更加困难。
从整体来看,这一判决可能成为未来类似案件的“先例”。近年来,人工智能公司未经授权,从互联网上大规模抓取内容,用于训练模型。这些行为在某些方面助长了“剽窃”风:人工智能能模仿特定艺术风格,甚至侵犯原创作品的版权。
对此,一些内容巨头已开始反击。例如,迪斯尼和环球影业在6月初提起诉讼,控告“Midjourney”公司侵犯版权,批评其擅自利用著名角色图片训练人工智能模型。两大电影公司一致认为,这种行为是“无底洞的抄袭”。
此外,一些网站和出版机构也开始主动限制人工智能公司访问其内容。例如,苹果公司就通过“robots.txt”等技术手段阻止部分网站被爬取,但这并不能完全解决问题。大规模爬取网站会消耗大量服务器资源,造成运营压力。
另一方面,关于版权赔偿的问题仍未得到根本解决。一些企业如苹果公司,已开始通过付费授权的方式,合法获取内容以训练人工智能。苹果公司也花费巨资获得新闻和图片内容的授权,确保其AI技术的合法性。然而,很多网站仍选择封锁AI爬虫,导致内容生态逐渐变得复杂。
同时,在美国和欧洲,关于人工智能的监管也在逐步推进。美国部分州试图通过立法限制AI技术的发展,而欧洲也在推动创建“安全发展的人工智能联盟”。不过,目前苹果等科技巨头尚未加入任何相关协议。
总结来看,此次法院判决虽然在专业法律层面有其合理性,但对文创行业的冲击不可忽视。未来,如何在推动人工智能发展的同时,保护原创者的权益,将成为各方关注的焦点。