度小满发布“轩辕70B”金融大模型 C-Eval、CMMLU双榜排名第一
9月22日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示,在C-Eval榜单上,XuanYuan-70B的总成绩达到71.9分;在CMMLU榜单中,以71.05分的高分位居榜首,在两大权威榜单上的所有开源模型中排名第一,也是国内首个同时在两大权威榜单排名第一的金融大模型。
C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,几乎囊括了所有国内外的主流模型,覆盖人文、社科、理工、其他专业四个大方向的52个学科,共有13948个多项选择题和中学、本科、研究生、职业等四个难度级别,是目前对模型潜力判断最具权威性的大模型榜单之一。
CMMLU数据集是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,专门用于评估语言模型在中文语境下的知识和推理能力,共涵盖了67个主题,涉及自然科学、社会科学、工程、人文以及常识等。
金融行业场景丰富,数字化程度高,是大模型落地应用的最佳场景之一。但金融又是一个高合规要求的行业,业务决策复杂,大模型真正在金融业务中做到实际应用还面临不少挑战。
度小满CTO许冬亮表示,“相比通用大模型,‘轩辕70B’金融大模型经过度小满业务场景中沉淀的海量金融数据训练,对金融知识理解更专业、更精准,可控性、安全性更高。我们把大模型开源,希望能够降低大模型在金融行业的部署和应用门槛,促进金融行业服务效率和服务体验的突破性革新”。
“轩辕70B”将在社区同时开源金融大模型和50G高质量金融语料,开源下载地址:https://github.com/Duxiaoman-DI/XuanYuan
今年5月份,度小满开源了国内首个千亿参数的金融大模型,已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,”轩辕70B”的模型上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。
- 最近发表
-
- 随机阅读
-
- 中国儿艺携手故宫推出原创歌舞剧《猫神在故宫》
- 豫剧名家吴素真亮相法国阿维尼翁戏剧节
- 辽宁发布4起电动自行车安全隐患全链条整治行动典型案例
- 外媒:英国演员朱利安·山德斯的遗体在美国加州被发现
- 英国巨石阵遭环保抗议者喷漆
- 2025年1月1日起我国调整部分商品关税税率税目
- 全国首批新获准入西班牙柿子在沪顺利通关
- 广州公布首批13家市属文创试点单位名单
- 夫妻打印店还做假章假证?已寄6000余份 8人被刑拘!
- 国内游更多元出境游更便捷 旅游过大年成为“新年俗”
- 国家发改委:宏观经济治理体系不断健全,我国经济实力大幅提升
- 英媒:特朗普就任首日将宣布美国退出世卫组织
- 四部门联合推出 深化车检改革优化车检服务新举措
- 7月份广州白云机场接送旅客超600万人次
- 山东高密发生燃气闪爆 致2人死亡2人轻伤
- 2023首届长江合唱大会在湖北宜昌举行
- (新春走基层)广东近3000名重大交通项目建设者春节不停工
- 美国俄克拉荷马州一处住宅发生枪击事件 致5人死亡
- 江苏出台33条政策巩固增强经济回升向好态势
- 跨乡组团协助茶农采收 浙江庆元乡贤推动茶产业振兴
- 热门推荐
-
- 贵州省罗甸县通报两次地震震情:地震未造成人员伤亡
- 全链条打击,遏制电诈上升态势
- 福建省梅花奖演员演出季演出150余场 地方戏剧薪火相传
- 浙江文旅观察:一颗杨梅如何成为富民大产业?
- 这份防溺水安全知识指南请查收
- 甘肃经济增速连续7个季度保持全国“第一方阵”
- 中俄医学大咖哈尔滨交流眼科技术创新与发展
- “未来理想城市单元”亮相2023年服贸会
- 匈牙利匈中双语学校——培养传承发展中匈友好事业的使者
- 中国农机装备产业互联网数字生态园在河北高阳开园
- 中上协:境内上市公司上半年实现净利3.13万亿元
- 在阿拉山口感受中国向西开放的旺盛活力
- 泽连斯基:乌克兰危机以来,已有3.1万名乌军士兵阵亡
- 7月11日全国农产品批发市场猪肉平均价格比昨天上升1.8%
- 低价头盔更畅销 二三十元的头盔劝你别买
- 法国著名影星阿兰·德龙去世 享年88岁
- 太原机场冬航季将运营客运航线86条、货运航线4条
- 用心用情用力写好“暖”字 各地多措并举保障千家万户温暖过冬
- (新春走基层)“90后”铁路“夫妻档”坚守春运岗位
- 南深高铁南玉段计划11月开通 广西最大侨乡将圆“高铁梦”