首页 > 娱乐 > 娱乐资讯 > 正文

训练中加入一条真实数据就可能阻止AI“胡言乱语”

2026-05-16 12:47:13      来源:科技日报

  科技日报北京5月15日电 (记者张佳欣)当AI不断用自己生成的数据“喂养”自己,它就可能逐渐失去准确性,最终输出越来越多错误信息,甚至“胡言乱语”。英国伦敦国王学院领导的研究团队发现,只需在训练过程中加入哪怕一条来自真实世界的数据,就可能有效阻止这种被称为“模型崩塌”的现象。相关成果发表于新一期《物理评论快报》。

  “模型崩塌”这一概念于2024年提出,指的是AI模型如果长期依赖自身生成的数据进行训练,模型性能会不断退化,最终输出失真内容。随着高质量人类文本数据逐渐接近枯竭,越来越多AI系统开始使用合成数据训练,这让模型崩塌风险进一步上升。

  此次,团队通过分析一类被称为“指数族”的统计模型发现,在封闭循环训练(模型完全依赖自身生成数据学习)中,模型崩塌几乎不可避免。

  研究显示,解决方法异常简单:只需在训练过程中加入一条来自外部世界的真实数据,哪怕其数量远远少于AI生成数据,也足以阻止模型性能持续退化,这种作用即使在机器生成数据数量无限增加时依然有效。

  过去关于模型崩塌的研究多集中在大语言模型等复杂系统,由于其内部机制难以解释,错误来源也难以追踪,这也成为AI产生“幻觉”的原因之一。通过研究更简单的统计模型,科学家能够从数学上解释为何少量真实数据就能打破模型崩塌,从而为未来更复杂AI系统提供设计原则。

  类似现象也存在于另一类名为“受限玻尔兹曼机”的机器学习模型中,表明这一规律可能具有更广泛适用性。下一步,他们计划将这一理论扩展到神经网络等更复杂的系统,以验证其在大语言模型中的实际效果。

[责编:金华]

大家都在看

推荐阅读
近日,中央网信办全面部署推进规范短视频内容标注工作,总结此前指导抖音、快手、腾讯等12家平台先行先试的经验,将内容标注设为短视频发布必经环节,并对新增短视频标注情...
2026-05-16 12:48:07
点评网站留下的客观评价莫名消失店铺出现大量异常差评发个红包就能删除差评近日,某地破获一起涉企网络水军案,其背后隐藏的职业删帖乱象,已形成一条分工明确的黑色利益链...
2026-05-16 12:46:07
央广网北京5月16日消息(记者 王进文)5月15日晚,全国首部筝乐表演戏剧《人间幻色》在北京天桥艺术中心首演。该剧以戏剧与古筝演奏本体性融合的全新艺术形式,为观众带来...
2026-05-16 12:44:36
最近,大家在各大社交平台都可能刷到过这样一条消息三大运营商即将全面推出免月租、按量计费套餐。有不少用户追问:传统月租套餐真的要终结了吗? 记者梳理市场现状发现,...
2026-05-16 11:52:28
伪造合格证、电池以旧代新,公司的销售人员明知这样的四轮代步车无法上牌照,却用低速车牌照编造谎言,打消客户顾虑、促成交易日前,央视曝光了手搓汽车乱象,即互联网上的...
2026-05-16 11:50:20