用AI数据训练AI效果怎样?国际最新研究称可能最终导致崩溃
中新网北京7月27日电 (记者 孙自法)国际学术期刊《自然》最新发表一篇计算机科学论文指出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”。
该研究显示,原始内容会在AI数代内变成不相关的胡言乱语,显示出使用可靠数据训练AI模型的重要性。
生成式AI工具越来越受欢迎,如大语言模型等,这类工具主要用人类生成的输入进行训练。不过,随着这些AI模型在互联网不断壮大,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。
论文第一作者兼共同通讯作者、英国牛津大学Ilia Shumailov和同事及合作者一起,用数学模型演示了AI模型可能会如何出现模型崩溃。他们证明了一个AI可能会忽略训练数据中的某些输出(如不太常见的文本),导致其只用一部分数据集来自我训练。
随后,论文作者还研究了AI模型会如何应对主要用人工智能生成的训练数据集。他们发现,给模型输入AI生成的数据会减弱今后几代模型的学习能力,最终导致模型崩溃。他们测试的几乎所有递归训练语言模型都容易出现重复短语。比如,一个用中世纪建筑文本作为原始输入的测试到第九代的输出已经是一串野兔的名字。
论文作者指出,为了让人工智能成功使用其自身输出进行训练,本次研究认为用AI生成数据训练一个模型并非不可能,但必须对数据进行严格过滤。与此同时,依赖人类生成内容的科技公司或许能比竞争对手训练出更高效的AI模型。(完)
相关推荐
- 最近发表
-
- 随机阅读
-
- 绿色生态发展底色如何落地“生”金?且看林下经济的“江西实践”
- 苏丹首都民众举行大规模集会 要求结束冲突
- 上海首家社区食堂“焕新” 满足居民多元化需求
- 国际金融论坛探讨世界经济如何透过国际合作转“危”为“机”
- 今年上半年云南出入境人员同比上升228%
- “高质量发展的中国将为世界提供更多机遇”
- 8月北京CPI同比涨0.5% 鲜菜价格涨幅扩大
- “2024爱沈阳”5大主题300余项活动开启沈阳文旅“春的乐章”
- 湖北赤壁黑茶检测中心护航青砖茶走向世界
- 1死2伤!美国芝加哥又发枪案 3名学生光天化日遭枪击
- 加拿大也准备对中国电动汽车加征关税?专家:该国电动汽车市场并不发达
- 高温高湿“龙舟水” 小满注意祛痰湿
- 别让过期药品成为健康隐患
- “中国皮影之乡”上演皮影盛宴 原生态演绎魔术般的艺术
- 全国基层退役军人服务中心(站)工作人员职业技能竞赛总决赛在京举办
- 第十一届绵阳科博会启幕
- 黑龙江:智慧农业与低空产业创新研究院揭牌 赋能两产业高质量发展
- 涉阿富汗撤军问题,美国务卿布林肯再遭传唤
- 第七届中国摄影图书榜参选图书启动征集
- 我国专精特新“小巨人”企业达1.46万家 拥有发明专利数32.74万项
- 热门推荐
-
- 大暑:热蒸雨煮,祛湿防暑(二十四节气里的中医养生之道)
- (新春走基层)春运特写:心愿墙上的“年味”
- 广西博白县水鸣镇江正村:“美食小村”大鹏堂
- 中国科技新闻学会发布2024年度十大科技新闻事件、人物和科技热词
- 拜登批准佛州重大灾难声明 将赴现场考察受灾情况
- 北京持续优化商事登记服务 助力营造一流营商环境
- 中国铁矿石中转枢纽大港在福建崛起
- 经济观察:端午味道 中国粽子如何香飘海外?
- 第四届公园城市论坛将于8月26日在成都举办
- 一个老工业区盘活存量之路
- 山东以“路”为笔,绘出经济发展“快车道”
- 第6架!也门胡塞武装称又击落一架美“死神”无人机
- 我在小岛遥望你(神州观览)
- 《川流不“熄”》首映 亲情故事如何打动刘德华久石让?
- 千变万化果实颜色 诉说着植物传播“喜好”
- 中国游戏产业全面“破圈”
- 高职院校专利数据告诉我们什么
- 8月1日起,辅助生殖将纳入安徽医保报销
- (新春走基层)“电保姆”林海伟的第30个海岛春节
- 中新健康丨三伏天“冬病夏治”受青睐 传统中医利民便民