人工智能训练数据版权风波:韩国科技巨头面临天价索赔
近日,韩国互联网巨头Naver因涉嫌未经授权使用新闻内容训练其人工智能模型,遭到多家媒体协会的高额版权侵权诉讼警告。随着争议持续发酵,负责统筹人工智能政策的韩国科学技术信息通信部迟迟未能拿出明确对策,政府应对迟缓的态度引发舆论强烈批评。
传媒行业集体维权
13日,韩国国会科技信息广播通信委员会委员崔秀珍(国民力量党)披露,韩国广播协会、韩国报纸协会等传媒机构正对Naver及其子公司Naver Cloud提起AI版权侵权诉讼。据悉,广播协会已代表三家公共电视台提起6亿韩元(约合人民币315万元)的损害赔偿诉讼,并计划根据调查结果将索赔金额扩大至数百亿韩元规模。这些机构指控Naver的HyperClova X等大型语言模型未经许可使用了新闻内容进行训练。
广播协会特别指出,经核实Naver训练数据中约13.1%为新闻内容,这一比例绝非微不足道。虽然Naver未否认使用新闻数据训练AI,但关键争议点在于其从未获得媒体机构的正式授权。报纸协会已于今年4月向韩国公平交易委员会举报Naver,指控其利用市场支配地位单方面使用新闻内容的行为构成不正当竞争。
政策协调机制失灵
争议的核心在于,本应协调AI产业发展与版权保护的政府部门未能发挥应有作用。科学技术信息通信部除表示"将与相关部门协商处理"外,至今未提出具体解决方案,被批评为怠于履行政策主管部门的协调职责。相形之下,中小风险企业部上月迅速推进了包含AI训练数据中小企业免责条款的法案修订工作。
与国际同行相比,韩国政策空白更为凸显。欧盟已广泛允许研究目的的数据使用,日本更是放宽了包括商业用途在内的版权限制。美国也通过"合理使用"原则为AI训练提供法律空间。这些国家都在重构适应AI时代的版权体系,而韩国仍停留在依赖行业自律协商的阶段,明显落后于全球趋势。
产业发展的两难困境
随着AI技术日益精进,其对多元化训练数据的需求将持续增长,相关版权争议可能日趋复杂化、长期化。专家警告,若政策部门继续维持当前消极态度,韩国AI产业可能面临信任危机和基础数据短缺的双重打击。与此同时,如何建立有效机制保障媒体机构等原创内容生产者的合法权益,已成为亟待解决的制度课题。