当前位置：首页 > 财经

度小满发布“轩辕70B”金融大模型 C-Eval、CMMLU双榜排名第一

　　9月22日，度小满宣布“轩辕70B”金融大模型开源，所有用户均可自由下载和试用，并公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示，在C-Eval榜单上，XuanYuan-70B的总成绩达到71.9分；在CMMLU榜单中，以71.05分的高分位居榜首，在两大权威榜单上的所有开源模型中排名第一，也是国内首个同时在两大权威榜单排名第一的金融大模型。

度小满“轩辕70B”金融大模型荣登榜首

　　C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集，几乎囊括了所有国内外的主流模型，覆盖人文、社科、理工、其他专业四个大方向的52个学科，共有13948个多项选择题和中学、本科、研究生、职业等四个难度级别，是目前对模型潜力判断最具权威性的大模型榜单之一。

　　CMMLU数据集是一个综合性的中文评估基准，由MBZUAI、上海交通大学、微软亚洲研究院共同推出，专门用于评估语言模型在中文语境下的知识和推理能力，共涵盖了67个主题，涉及自然科学、社会科学、工程、人文以及常识等。

　　金融行业场景丰富，数字化程度高，是大模型落地应用的最佳场景之一。但金融又是一个高合规要求的行业，业务决策复杂，大模型真正在金融业务中做到实际应用还面临不少挑战。

　　度小满CTO许冬亮表示，“相比通用大模型，‘轩辕70B’金融大模型经过度小满业务场景中沉淀的海量金融数据训练，对金融知识理解更专业、更精准，可控性、安全性更高。我们把大模型开源，希望能够降低大模型在金融行业的部署和应用门槛，促进金融行业服务效率和服务体验的突破性革新”。

　　“轩辕70B”将在社区同时开源金融大模型和50G高质量金融语料，开源下载地址：https://github.com/Duxiaoman-DI/XuanYuan

　　今年5月份，度小满开源了国内首个千亿参数的金融大模型，已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升：在增量预训练和指令微调阶段，加入了度小满业务场景中的海量金融数据，对金融问题回复更专业，金融知识理解能力提升明显；同时在预训练阶段，”轩辕70B”的模型上下文长度扩充到8k，能够处理更长的金融报告、研究和分析。

上一篇

湖南桂阳猕猴桃飘香大湾区市场种养大户做强特色农业
下一篇

国家医保局谈种植体集采：为患者省了40亿

度小满发布“轩辕70B”金融大模型 C-Eval、CMMLU双榜排名第一

相关推荐

中国内陆省份四川将三文鱼、榴莲写入政府工作报告

合肥机场春运首周实现“开门红” 超历史同期最好水平

山东瞄准外贸新兴市场跨境采购迎新机遇

“滑雪+”牵手春节点亮“冰雪经济” 消费新场景持续火爆

国家能源局：2024年全社会用电量同比增长6.8%

湖南优势产业加速“出海” 2024年工程机械出口首破300亿元

全球化测试为新能源厂商出海护航

手机、平板等“国补”政策落地第一天消费者热情高涨

农业农村部：春节期间“菜篮子”产品供给完全有保障

A股三大股指周一上涨消费类股票走强

甘肃“风光”产品深耕中亚市场

2024年山东GDP同比增5.7%

度小满发布“轩辕70B”金融大模型 C-Eval、CMMLU双榜排名第一

相关推荐

中国内陆省份四川将三文鱼、榴莲写入政府工作报告

合肥机场春运首周实现“开门红” 超历史同期最好水平

山东瞄准外贸新兴市场 跨境采购迎新机遇

“滑雪+”牵手春节点亮“冰雪经济” 消费新场景持续火爆

国家能源局：2024年全社会用电量同比增长6.8%

湖南优势产业加速“出海” 2024年工程机械出口首破300亿元

全球化测试为新能源厂商出海护航

手机、平板等“国补”政策落地第一天 消费者热情高涨

农业农村部：春节期间“菜篮子”产品供给完全有保障

A股三大股指周一上涨 消费类股票走强

甘肃“风光”产品深耕中亚市场

2024年山东GDP同比增5.7%

山东瞄准外贸新兴市场跨境采购迎新机遇

手机、平板等“国补”政策落地第一天消费者热情高涨

A股三大股指周一上涨消费类股票走强