人工智能最新研究:一种大语言模型加上评价框架带来新数学发现
中新网北京12月15日电 (记者 孙自法)国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员报告了一种方法,他们利用一个大语言模型(LLM)对一个著名的数学问题作出了新发现,并通过系统的、迭代的评估框架确保正确。这一方法或可改进LLM用来解决问题和学习新知识的途径。
该论文介绍,基于人工智能的工具(例如LLM)有望加速科学发现,解决长久存在的问题,但它们有时受制于“幻觉”,导致作出看似合理但错误的陈述。加入一个评估步骤,系统地衡量潜在解决方案的准确性,使得靠LLM帮助应对复杂问题成为可能。这些问题一般需要可验证且定义明确,使这一工具在数学科学中有潜在价值。
论文第一作者和通讯作者、Google DeepMind的Bernardino Romera-Paredes和Alhussein Fawzi与同事及合作者一起提出一种方法,称为FunSearch(因为它搜索函数空间),将一组产生创造性解决方案的LLM和一个作为检查者以避免错误建议的评估程序结合起来。一个多次迭代此过程的演化方法,通过提供此前最佳解决办法作为输入来引导LLM,结果表明这种方法可以收敛到新的、可验证的正确结果。他们将FunSearch应用到了著名的上限集问题(cap set problem,数学中涉及计数和排列领域的一个中心问题),发现了超越最著名上限集的大上限集新构造。
论文作者认为,FunSearch的成功关键是它会寻找描述如何解决一个问题的程序,而非寻找解决办法。因为FunSearch的结果是程序,结果易于人类解释和验证,这意味着该方法有望激发该领域的进一步思考。
他们补充指出,目前,这个方法可能还不适合所有类型的挑战,但通过未来改进或可使FunSearch应用于更大范围的问题。(完)
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 驻名古屋总领馆提醒中国公民关注地震预警加强自我防范
- 中国科大团队研发“原子算筹”软件 助力新材料研发
- 中国发现首个深水深层亿吨级油田
- 越共中央总书记阮富仲去世
- 浙江:2025年在基层推广延伸“互联网+AI”医疗服务
- 2023年我国持续稳居世界第二大广告市场
- 美总统参选人黑利祝贺特朗普,但称“比赛远未结束”
- 赞比亚社会党主席:美国有资格教育我们什么是民主吗?丨世界观
- 俄土领导人索契会晤
- 齐齐哈尔市:打造“四所一庭一中心”模式 延伸基层法治服务
- 广西河池:歌王轮番上台 用壮族山歌“打擂”
- 野猪频频“肇事”,多地探索对策,野猪种群如何调控
- 叫停学龄前教育APP不只是配合“双减”
- 热浪席卷智利:数百场森林大火延烧 逾千人死伤
- 丝路青年说(三)| 我为中欧班列“穿针引线”
- 沙县小吃“出海”势头旺
- 1.6万首庐山诗词,今日全网“首发”!
- “中文书架”走进菲律宾国家图书馆
- 科技赋能“绿色田野”:喀什戈壁滩长出“果蔬工厂”
- 中央气象台继续发布台风红色预警
- 热门推荐
-
- 吉林市纪念喜(富)连成社创办120周年
- 黑龙江同江开通气垫船旅客运输 5分钟直达俄罗斯
- 近百名文学领域专家学者齐聚青海高原研讨《雪山大地》文学价值
- 国图文保让面临酸化消失风险的古籍“重获新生”
- 6月28日人民币对美元中间价报7.1268元 上调2个基点
- 青海德令哈国家基本气象站启动北斗探空业务试运行
- 美国西南航空一客机起飞前被子弹击中
- 葛洲坝物业再获认可 矢志践行“更好的家 给更好的你”
- 三亚机场今年暑期旅客吞吐量创暑运单月历史新高
- “2023中国VR50强企业”榜单出炉 营收超亿元数量达34家
- 18位五千多年文明遗址考古队长发布“陶寺宣言”
- 中山海事保障南中高速横门西特大桥跨小榄水道段顺利合龙
- 广州南沙与香港深化养老服务合作
- 西藏吉隆出入境边防检查站举办“边关月 边塞诗 家国情”主题诗歌分享会
- 抗震救灾岂能打“政治牌”?
- “诗和远方”牵手五载 山东文旅同频共振奏响“新乐”
- 今年前7个月天津市对非洲进出口创历史同期新高
- 外国人来华支付更便利 上半年“外包内用”交易额同比增超7倍
- 新疆天山胜利隧道进口端主洞掘进任务完成过半
- 自动分拣系统、无人配送车……我国物流装备智能化水平不断提升