研究:为什么使用人工智能生成的内容训练人工智能将导致模型退化
发表在《自然》杂志上的新研究表明,当人工智能在人工智能生成的数据上进行训练时,模型输出的质量会逐渐下降。随着后续模型产生的输出被用作未来模型的训练数据,效果会变得更糟。
领导这项研究的牛津大学计算机科学家伊利亚·舒迈洛夫将这一过程比作拍摄照片。他说:“如果你拍了一张照片,然后扫描,再打印出来,接着重复这个过程,那么噪音基本上会淹没整个画面。你只剩下一个黑色的方块。”他说,人工智能的黑色方块的对应物称为“模型崩溃”,意味着模型只会产生不连贯的垃圾。
舒迈洛夫表示,当前的人工智能模型不仅会崩溃,而且还可能产生实质性影响:改进速度将会放缓,性能可能会受到影响。
—— MIT科技评论 (节选)
发表回复