
AI模型被曝能生成训练数据中小说近乎逐字副本
AI模型被曝能生成训练数据中小说近乎逐字副本:是“记忆”还是“抄袭”? 当您要求一个大型语言模型(LLM)续写一段经典小说的开头时,您期望得到的是富有创意的模仿,还是原文的精确复刻?一项令人震惊的最新研究揭示,后者可能比我们想象的更接近现实。研究人员发现,当前最先进的AI模型能够从其庞大的训练数据集中,近乎逐字逐句地“回忆”并输出整本小说、新闻长文或其他受版权保护的长篇内容。这不仅是一个技术奇观,更是一枚投向AI版权与数据安全领域的重磅炸弹,迫使整个行业重新审视模型训练、使用与监管的边界。 ...