当前位置：首页 > 国际

如何识破大语言模型“幻觉”回答？国际最新研发出“以毒攻毒”检测方法

　　中新网北京6月20日电 (记者孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠，有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨，对此如何予以有效检测广受关注。

　　国际著名学术期刊《自然》最新发表一篇人工智能研究论文称，研究人员开发出一种能检测大语言模型“幻觉”的方法，这种方法通过“以毒攻毒”方式，能测量生成回答的含义的不确定性，或能用于提升大语言模型输出的可靠性。

　　该论文介绍，大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过，这类系统很容易产生“幻觉”，生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难，因为这些回答的呈现方式可能会让它们看起来很可信。

　　在本项研究中，论文第一作者兼通讯作者、英国牛津大学Sebastian Farquhar和同事合作，尝试量化一个大语言模型产生“幻觉”的程度，从而判断生成的内容有多少忠于提供的源内容。他们的方法能检测“幻觉”的一个子类别——“编造”，特指不准确和随意的内容，常出现在大语言模型缺乏某类知识的情况下。针对“编造”问题，他们研发的方法考虑了语言的微妙差别，以及回答如何能以不同的方式表达，从而拥有不同的含义。研究表明，该方法能在大语言模型生成的个人简介，以及关于琐事、常识和生命科学这类话题的回答中识别出“编造”内容。

　　《自然》同期发表同行专家“新闻与观点”文章指出，最新研究的检测任务由一个大语言模型完成，并通过另一个大语言模型进行评价，相当于“以毒攻毒”。虽然用一个大语言模型评估一种基于大语言模型的方法似乎是在循环论证，而且可能有偏差，但他们的方法有望帮助用户理解在哪些情况下使用大语言模型的回答需要注意，这也意味着可以提高大语言模型在更多应用场景中的置信度。(完)

上一篇

外媒：超过900人在沙特朝觐期间死亡
下一篇

悉尼歌剧院《华夏情韵》龙年音乐会新闻发布会成功举办

相关推荐

最近发表: 中国内陆省份四川将三文鱼、榴莲写入政府工作报告

黑龙江饶河再现野生东北虎足迹

四川内江市市中区发生3.2级地震震源深度10千米

海南将迎来春节前出岛车客高峰各港口出岛秩序总体平稳

（新春走基层）“喜迎全运会瑞蛇贺新春”新春庙会在广州举行

合肥机场春运首周实现“开门红” 超历史同期最好水平

电影《边海》演绎中越跨国恋情将在全国上映

山东瞄准外贸新兴市场跨境采购迎新机遇

“滑雪+”牵手春节点亮“冰雪经济” 消费新场景持续火爆

国家能源局：2024年全社会用电量同比增长6.8%

羊角把、牛角、十字扣，春运涨知识→小设计大用途

岁暮冰嬉寒尽春生这些“速度与激情”谁看了不想玩一把？

“家门口能挣钱，好日子有盼头”（新春走基层）

国家中医药局：九成以上三级妇幼保健院设置中医类临床科室

湖南零陵腊肉飘香年味浓供销两旺助增收

湖南优势产业加速“出海” 2024年工程机械出口首破300亿元

全球化测试为新能源厂商出海护航

春节临近你的家乡举办哪些活动？一起来寻找年味儿→

新春走基层丨让每一盏车灯都安然明亮他们是“魔鬼风口”的风雪护路人

手机、平板等“国补”政策落地第一天消费者热情高涨

随机阅读: 摸得着的幸福：河北定州让老旧小区“好看”更“好住”

业界嘉宾相聚山东青岛探讨中国与世界经济的复苏与增长

持续支持种业振兴为守护“粮口袋”贡献金融力量

中国机械工业联合会：预计2023年全年工业增加值等指标增速约5%

前三季度新设民营企业、个体工商户数量双双两位数增长

8月26日人民币对美元中间价报7.1139元上调219个基点

外媒：美英对也门胡塞武装发动新一轮打击数人死伤

B-21完成首飞，未来会部署在哪儿

复旦测评13家大模型高考数学成绩，字节豆包II卷超GPT-4o夺冠

（乡村行·看振兴）黄河岸边旅游兴：生态游“狂飙” 乡村游升温

辽宁省人社厅“聚智惠企助振兴”专家企业行活动在阜新市启动

西藏区内外23对新人参加山南集体民族婚礼

50岁农民工夺得中国诗词大会亚军点燃家乡人民诵读诗词热情

15个人的“绿洲”

政策红包如雨下城市公交运营难题怎么破

浙江海事部门已保障电煤水上安全运输超1800万吨

四川甘孜州康定市发生3.0级地震，震源深度8千米

受台风“苏拉”影响海口三港9月2日13时起停运

中国—东盟深化保险领域合作创新跨境合作模式

新疆丝路文物亮相成都展示丝绸之路起源与高光

热门推荐

如何识破大语言模型“幻觉”回答？国际最新研发出“以毒攻毒”检测方法

相关推荐

空中盘旋多圈后降落！美国波士顿飞中国香港客机因故返航

一图看懂：从离开到重返白宫，特朗普经历了什么？｜图览天下

红十字国际委员会：93名获释被扣押人员已分别返回巴以

扎哈罗娃：泽连斯基称“家”里有事无法参加特朗普就职典礼，难道是水管爆了？

外媒关注中国交通领域新成就——中国正在“加速奔向未来”（国际论道）

乌克兰基辅拉响防空警报

韩国公调处尝试对尹锡悦进行强制问讯

停火首日超630辆人道主义物资车进入加沙地带

塞尔维亚首都一家养老院发生火灾致6死7伤

埃塞俄比亚大使点赞中国零关税政策：为埃塞带来广阔机遇

全球经济低迷等因素导致香槟销量下降

韩国公调处：考虑对尹锡悦进行强制传讯审问

如何识破大语言模型“幻觉”回答？国际最新研发出“以毒攻毒”检测方法

相关推荐

空中盘旋多圈后降落！美国波士顿飞中国香港客机因故返航

一图看懂：从离开到重返白宫，特朗普经历了什么？｜ 图览天下

红十字国际委员会：93名获释被扣押人员已分别返回巴以

扎哈罗娃：泽连斯基称“家”里有事无法参加特朗普就职典礼，难道是水管爆了？

外媒关注中国交通领域新成就——中国正在“加速奔向未来”（国际论道）

乌克兰基辅拉响防空警报

韩国公调处尝试对尹锡悦进行强制问讯

停火首日 超630辆人道主义物资车进入加沙地带

塞尔维亚首都一家养老院发生火灾 致6死7伤

埃塞俄比亚大使点赞中国零关税政策：为埃塞带来广阔机遇

全球经济低迷等因素导致香槟销量下降

韩国公调处：考虑对尹锡悦进行强制传讯审问

一图看懂：从离开到重返白宫，特朗普经历了什么？｜图览天下

停火首日超630辆人道主义物资车进入加沙地带

塞尔维亚首都一家养老院发生火灾致6死7伤