研究警示:使用AI生成的内容训练可能导致模型崩溃
AI奇点网6月15日报道 | 随着AI生成内容的广泛应用,一个令人担忧的问题开始浮现:当AI生成的内容在互联网上不断增加,并且用于训练模型时,会发生什么?
最近来自英国和加拿大的研究人员对这个问题进行了深入研究,并在开放获取期刊arXiv上发表了一篇相关论文。他们的研究发现令人忧虑,即使用模型生成的数据进行训练会导致生成的模型出现不可逆转的缺陷,被称为"模型崩溃"。
研究人员主要研究了文本到文本和图像到图像的AI生成模型的概率分布。他们得出结论称,从其他模型生成的数据中进行学习会导致模型崩溃,这是一个逐渐退化的过程,随着时间的推移,模型会逐渐忘记真正的底层数据分布。即使在理想的长期学习条件下,这个过程也是不可避免的。
当AI训练模型接触到更多AI生成的数据时,模型的性能会逐渐下降。它会在生成的响应和内容中产生更多错误,并且响应的非错误多样性也会减少。
AI生成数据的"污染"导致模型对现实的感知产生了扭曲。即使研究人员尝试训练模型不要生成过多重复的响应,他们发现模型崩溃仍然会发生,因为模型会编造错误的响应以避免频繁重复数据。
幸运的是,即使在现有的转换器和LLM(语言模型)的情况下,有一些方法可以避免模型崩溃。研究人员强调了两种具体的方法。
首先是保留原始的完全或名义上由人工生成的数据集的副本,并且不要与AI生成的数据混淆。然后,可以定期重新训练模型或从头开始使用完全新的数据集来刷新模型。
第二种方法是将新的、干净的、由人类生成的数据重新引入到训练中,以避免响应质量下降并减少模型中不需要的错误或重复。
然而,研究人员指出,这需要内容制作者或人工智能公司采用一种大规模标签机制或努力来区分人工智能生成的内容和人类生成的内容。
总之,这些研究发现对于人工智能领域具有重要意义,强调了需要改进方法以保持生成模型的完整性随着时间的推移。它们也提醒我们注意未经检查的生成过程的风险,并可能指导未来的研究以制定防止或管理模型崩溃的策略。
-
研究警示:使用AI生成的内容训练可能导致模型崩溃
最近一项研究表明,随着越来越多的人使用AI生成内容并将其用于训练模型,存在一个严重问题。研究人员发现,使用AI生成的数据进行训练会导致生成的模型出现不可逆转的缺陷,这被称为"模型崩溃"。这篇文章探讨了研究人员的发现以及可能的解决方案。
2025-04-19 13:23:37 -
谷歌推出AI虚拟试穿功能应用于在线购物,将扩展至女装上衣和其他类别
谷歌宣布推出一项新的功能,通过人工智能技术实现虚拟试穿,首先应用于女装上衣,并计划将来扩展到其他类别。该功能允许用户在浏览时搜索相同尺寸但价格、颜色和图案不同的类似产品。Anthropologie、Everlane、H&M和LOFT等品牌将成为首批合作伙伴。
2025-04-19 13:00:07 -
微软New Bing聊天机器人灰度测试多模态能力:开放“AI识图”入口
Reddit上的网友发现Bing Chat新增了上传图片的功能,并且能够通过识图回答问题。尽管识图功能还处于测试阶段,但这一功能有望为用户提供更多多模态的支持,展示了GPT-4相较于GPT-3 5的巨大升级。
2025-04-19 12:33:18 -
提高AI产出质量,OpenAI 发布新的 AI 模型训练方法以解决“AI 幻觉”难题
OpenAI 宣布计划采取一种新的 AI 模型训练方法,称为“过程监督”,旨在解决“AI 幻觉”问题。该方法将奖励模型在推理过程中做出的每个正确步骤,以提高其输出的可解释性。然而,一些专家对此表示怀疑,认为该方法还需要进一步的验证和评估。
2025-04-19 12:08:25 -
GitHub调查显示:受访者表示人工智能工具对开发者工作有极大帮助
最近,代码托管平台GitHub对美国拥有1000名以上员工的企业进行了一项调查,旨在了解人工智能对开发者工作的影响。调查结果显示,使用人工智能工具的开发者们普遍认为其对工作效率的提升起到了积极的作用。
2025-04-19 11:44:56 -
DeepSeek开源周启幕,Flash MLA解码内核引领AI效率革新
DeepSeek公司近期宣布了一项重大举措——“开源周”,旨在向全球开发者社区开放其技术研究成果。作为这一活动的开场,首个亮相的代码库是Flash MLA,一个专为Hopper GPU优化设计的解码内核。 Flash MLA详细介绍:http
2025-04-19 11:27:56
-
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
阿里寻光_寻光视频创作平台_寻光视频创作官方网站
AIGC时代,视频创作这事儿真的不一样了。就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~
2025-01-16 11:04:19 -
AI动漫视频生成_yoyo官方网站_yoyo功能及介绍
视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文 图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。
2025-01-16 11:53:08 -
有手就行:Stability AI推出简笔画生成图片工具Stable Doodle
近日,图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 推出了一项新的服务,可以将简笔画转换为图像。这项服务名为 Stable Doodle,利用最新的 Stable Diffusion 模型分析简笔画的轮廓,让每个人都能得到堪称艺术的作品。
2025-04-10 13:09:46 -
应用商店下载排行第一,“Meta版推特”Threads注册用户超5000万
新上线社交应用Threads已注册激活用户超过5000万,该数字仍在持续增长。当前在英国和美国苹果应用商店免费应用中的下载量排名第一。
2025-04-14 13:36:13 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
跟人类学孬了!联合国:AI大模型的回复存在严重的性别偏见、种族偏见与刻板印象等问题
报告指出,女性在大模型的描述中,从事“家务劳动”的频率是男性的4倍,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。
2025-02-08 12:52:22 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26