AI为何会“一本正经地胡说八道”
想象一下,向人工智能(AI)聊天机器人询问一个不存在的历史事件,比如“谁赢得了1897年美国和南极洲之间的战斗?”即使没有这样的战斗,AI聊天机器人也可能会提供一个虚构的答案,例如“1897年的战斗是由美国赢得的,约翰·多伊将军带领部队取得了胜利。”这种AI编造信息“一本正经地胡说八道”的情况屡见不鲜。
在专业领域,AI“一本正经地胡说八道”这种现象被称为AI幻觉。“AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。”近日,长期从事自然语言处理、大模型和人工智能研究的哈尔滨工业大学(深圳)特聘校长助理张民教授在接受科技日报记者采访时表示。
AI幻觉普遍存在
记者梳理发现,AI幻觉具有普遍性。
今年2月,谷歌发布的AI聊天机器人Bard在视频中,对詹姆斯·韦布空间望远镜曾做出不真实陈述;3月,美国的两名律师向当地法院提交了一份用ChatGPT生成的法律文书,这份文书格式工整、论证严密,但其中的案例却是虚假的……
OpenAI研究人员虽曾在今年6月初发布报告称“找到了解决AI幻觉的办法”,但也承认,“即使是最先进的AI模型也容易生成谎言,它们在不确定的时刻会表现出捏造事实的倾向。”
总部位于纽约的人工智能初创公司和机器学习监控平台Arthur AI也在今年8月发布研究报告,比较了OpenAI、“元宇宙”Meta、Anthropic以及Cohere公司开发的大语言模型出现幻觉的概率。研究报告显示,这些大模型都会产生幻觉。
目前国内大语言模型虽无产生AI幻觉相关披露,但也可从相关公开报道中找到端倪。
今年9月,腾讯混元大语言模型正式亮相。腾讯集团副总裁蒋杰介绍,针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型出现幻觉的概率比主流开源大模型降低了30%—50%。
“大模型有可能‘一本正经地胡说八道’。如果不和行业专业数据库或者一些专业应用插件进行对接,这可能会导致它们提供过时或者不专业的答案。”科大讯飞研究院副院长、金融科技事业部CTO赵乾在第七届金融科技与金融安全峰会上曾表示,科大讯飞已经推出一些技术方案,让大模型扬长避短。
AI幻觉源自本身
“现在不同研究工作对AI幻觉的分类各不相同。”张民介绍,总体而言,AI幻觉可以分为内在幻觉和外在幻觉两类。
据悉,内在幻觉即是同输入信息不一致的幻觉内容,包括同用户输入的问题或指令不一致,或是同对话历史上下文信息相矛盾,如AI模型会在同一个对话过程中,针对用户同一个问题的不同提问方式,给出自相矛盾的回复。外在幻觉则是同世界知识不一致或是通过已有信息无法验证的内容,例如AI模型针对用户提出的事实性问题给出错误回答,或编造无法验证的内容。
近期,腾讯AI Lab联合国内外多家学术机构发布了一篇面向大模型幻觉工作的综述。该综述认为,AI幻觉集中在大模型缺乏相关知识、记忆错误知识、大模型无法准确估计自身能力边界等场景。
“从技术原理上看,AI幻觉多由于AI对知识的记忆不足、理解能力不足、训练方式固有的弊端及模型本身技术的局限性导致。”张民坦言,AI幻觉会造成知识偏见与误解,甚至有时会导致安全风险、伦理和道德问题。
AI幻觉尚难消除
尽管AI幻觉短期内难以完全消除,但业界正试图通过技术改进和监管评估来缓解其影响,以保障人工智能技术的安全可靠应用。
“现阶段AI幻觉难以完全被消除,但却可以试着缓解。”张民介绍,在预训练、微调强化学习、推理生成等阶段中运用适当的技术手段,有望缓解AI幻觉现象。
据介绍,在预训练方面,需增加知识密集的数据、高质量数据的选取和过滤;微调强化学习过程中,选择模型知识边界内的训练数据极为重要;推理生成过程中,可以采用检索外部知识的办法使得模型生成结果有证据可循。此外,改进解码搜索算法也是一种可行的方案。
腾讯AI Lab联合国内外多家学术机构发布的综述亦表明了同样观点,并认为诸如多智能体交互、指令设计、人在回路、分析模型内部状态等技术也可成为缓解AI幻觉的方式。
值得一提的是,哈尔滨工业大学(深圳)自研的立知文本大模型和九天多模态大模型,对于上述缓解AI幻觉的方式均有深入探索,并取得了显著效果。
“这对于开发一个真实可信的AI大模型是十分有必要的。”张民介绍,“我们尝试通过视觉信息增强语言模型的能力,降低语言模型的外部幻觉问题;通过多个大模型智能体进行独立思考和分析,经由多智能体之间的讨论、博弈和合作,增强回复的客观性,减少AI幻觉。”
张民表示,破解AI幻觉将提高AI系统的实用性、可信度和可应用性,这对人工智能技术的未来发展和社会的发展都有积极影响。同时,更可靠的AI系统可以更广泛地应用于各个领域,这将促进技术进步的速度,带来更多的创新。未来,破解AI幻觉需要进一步在算法、数据、透明度和监管等多个方面采取措施,以确保AI系统的决策更加准确可靠。(科技日报记者 罗云鹏)
-
上一篇
-
下一篇
相关推荐
黑龙江饶河再现野生东北虎足迹
四川内江市市中区发生3.2级地震 震源深度10千米
海南将迎来春节前出岛车客高峰 各港口出岛秩序总体平稳
(新春走基层)“喜迎全运会 瑞蛇贺新春”新春庙会在广州举行
羊角把、牛角、十字扣,春运涨知识→小设计大用途
岁暮冰嬉 寒尽春生 这些“速度与激情”谁看了不想玩一把?
“家门口能挣钱,好日子有盼头”(新春走基层)
国家中医药局:九成以上三级妇幼保健院设置中医类临床科室
湖南零陵腊肉飘香年味浓 供销两旺助增收
春节临近 你的家乡举办哪些活动?一起来寻找年味儿→
新春走基层丨让每一盏车灯都安然明亮 他们是“魔鬼风口”的风雪护路人
中国将386.7万家固定污染源纳入排污许可管理
- 最近发表
-
- 随机阅读
-
- 清凉经济作引擎 湖南沅陵玩转水“魔方”
- “金砖机遇”青年交流对话会在俄罗斯喀山举行
- 国务院国资委:将把市值管理成效纳入央企负责人考核
- 交通银行提供精准金融支持 助力冰雪经济释放“热效应”
- 【理响中国·讲好“中国式商量”故事】新疆伊犁:在“奶茶议事会”上坐一坐 问题就解决了
- 大范围雨雪已展开 周末寒潮来袭南方也有机会下雪!雨雪分界线要抵达南岭?
- 水果不宜加热吃……是真是假?|谣言终结站
- 严守资源安全底线 山西矿产资源勘查开采管理有新规
- 美国禁毒,内病外治行不通(钟声)
- 我国太阳能电池专利申请量全球排名第一
- 美国30年期贷款利率升至6.91% 创6个月来最高值
- 农业农村部派工作组赴早稻主产区指导灾害应对工作
- 国家统计局:PPI下半年同比降幅有望收窄
- 美国电话电报公司几乎所有手机客户通话和短信记录遭窃
- 天津外国语大学“一带一路”数智经贸产业学院成立
- 今年春运琼州海峡客滚运输单日运输量屡破历史纪录
- 一点一点掘进,一点一点磨性子
- 芜湖官方通报“女子感冒后输液死亡”:正在进一步调查
- 秋日带娃逛逛这些美妙老街
- 中国准大学生“寻商”探源:食“商宴”、学洛阳铲、猜甲骨文
- 热门推荐
-
- 如何赓续中国诗歌传统?专家:融汇贯通中走进生活
- (乡村行·看振兴)江西安义:“乡村运营”激活乡村发展“一池春水”
- 中国创交会创新创业系列榜单揭晓
- 不合理低价游为何禁不住 专家:大幅提高违法成本斩断灰色利益链
- 中国代表:反对在加沙停火无异于为继续杀戮大开绿灯
- 做公会、组专班、开试点,改革基因推文艺院团勇闯“第二舞台”
- 盒马回应停止开通会员:因业务调整暂不支持开通或续费盒马X会员
- IDC评估报告:百度文心大模型3.5拿下12项指标的7个满分
- 交易成果格外亮眼!从高交会看中国创新实力→
- 谢锋谈中美农业合作:必须停止把经济问题政治化、泛安全化
- 美国专家:欧盟对中国加税,损害的是欧洲消费者福祉 | 世界观
- 德银:人民币汇率和波动性均将维持在相对稳定的水平
- 流浪猫该不该喂?沪上中外居民共商“喵”计
- 比亚迪回应车辆漏电致人住院
- 意大利两天内有4名老人因高温死亡
- 青海重点沙区实现“绿进沙退”
- 美媒:美国一架客机因故障硬着陆,致6人受伤
- 绿色技术交易赋能高质量发展 追“新”逐“绿”正当时
- 山西-澳门投资促进对接会举行 促两地经贸交流合作
- 菲律宾总统签署法案提高公立学校教师年度津贴