版权问题 | AI

AI模型被曝能生成训练数据中小说近乎逐字副本：是“记忆”还是“抄袭”？当您要求一个大型语言模型（LLM）续写一段经典小说的开头时，您期望得到的是富有创意的模仿，还是原文的精确复刻？一项令人震惊的最新研究揭示，后者可能比我们想象的更接近现实。研究人员发现，当前最先进的AI模型能够从其庞大的训练数据集中，近乎逐字逐句地“回忆”并输出整本小说、新闻长文或其他受版权保护的长篇内容。这不仅是一个技术奇观，更是一枚投向AI版权与数据安全领域的重磅炸弹，迫使整个行业重新审视模型训练、使用与监管的边界。 ...