度小满发布“轩辕70B”金融大模型 C-Eval、CMMLU双榜排名第一
9月22日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示,在C-Eval榜单上,XuanYuan-70B的总成绩达到71.9分;在CMMLU榜单中,以71.05分的高分位居榜首,在两大权威榜单上的所有开源模型中排名第一,也是国内首个同时在两大权威榜单排名第一的金融大模型。
C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,几乎囊括了所有国内外的主流模型,覆盖人文、社科、理工、其他专业四个大方向的52个学科,共有13948个多项选择题和中学、本科、研究生、职业等四个难度级别,是目前对模型潜力判断最具权威性的大模型榜单之一。
CMMLU数据集是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,专门用于评估语言模型在中文语境下的知识和推理能力,共涵盖了67个主题,涉及自然科学、社会科学、工程、人文以及常识等。
金融行业场景丰富,数字化程度高,是大模型落地应用的最佳场景之一。但金融又是一个高合规要求的行业,业务决策复杂,大模型真正在金融业务中做到实际应用还面临不少挑战。
度小满CTO许冬亮表示,“相比通用大模型,‘轩辕70B’金融大模型经过度小满业务场景中沉淀的海量金融数据训练,对金融知识理解更专业、更精准,可控性、安全性更高。我们把大模型开源,希望能够降低大模型在金融行业的部署和应用门槛,促进金融行业服务效率和服务体验的突破性革新”。
“轩辕70B”将在社区同时开源金融大模型和50G高质量金融语料,开源下载地址:https://github.com/Duxiaoman-DI/XuanYuan
今年5月份,度小满开源了国内首个千亿参数的金融大模型,已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,”轩辕70B”的模型上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。
- 最近发表
-
- 随机阅读
-
- 三星堆猪鼻龙头柱状器出坑 满嘴“牙璋” 奇特非凡
- “国和一号”已实现整机全国产化能力 产业链联盟不断扩大
- 叙媒:美国在叙利亚非法驻军将极端组织成员转移至伊拉克
- 中国证监会:已有19家企业完成境外上市备案 将畅通境外上市渠道
- 茅盾文学奖提名作品公布 《千里江山图》入围
- 中国粮食主产区粮食企业累计收购秋粮近1.5亿吨
- 27亿元票房领跑春节档 凭什么《热辣滚烫》?
- 国家统计局:2023年我国经济发展新动能指数较快增长
- 以“链”为媒 向新而行
- 中国太保产险打造“线上+线下”一体化营运新模式
- 航空工业专家解析K8教练机为何翱翔海外
- 北京检方依靠“数字大脑”深挖制售验特种作业假证案
- 飞行工程师变肥料专家 湖南桃江“90后”新农人把爱倾注田野
- 制造业大市苏州探索以服务促发展
- 柬埔寨前11月农产品出口逾730万吨 中国仍是最大市场
- 黑龙江将确保黑土地不减少 质量有提升
- 四川彭州一养猪场发生化粪池气体中毒事故 7人死亡
- 重庆2025年经济增长预期目标6%左右
- 交通运输部:2024年2月9日至17日小型客车免收通行费
- 中亚媒体参访团走进新疆吉木萨尔县
- 热门推荐
-
- 世界寒地冰雪经济大会长春开幕
- 摩尔多瓦公投结果揭晓 超半数选民支持加入欧盟
- 上海发布雷电黄色预警 注意防范
- 云南勐康边检站查获特大走私香烟案 案值逾200万元
- 文化中国行·长江之歌丨一粒米的万年行旅
- 挂绿荔枝热卖有何启示
- 俄罗斯巴什科尔托斯坦共和国推介会在沈阳市举行
- 里约旅游警察学中文 冀巴中合作更深入
- 争分夺秒!杭州交警为孩童“闪送”断指完成手术
- “错峰潮”开启 节后两个月国内旅游订单同比翻番
- 美参议院同意推进向乌克兰提供资金的法案
- 重庆市核学会成立 深化东西部核科技创新合作
- 飓风“海伦妮”过后 美国北卡罗来纳州仍有92人失踪
- 浙江“95后”女博士六年磨一“轴” 材料利用率提升至95%
- 三峡机场首开直飞越南胡志明市国际航线
- 俄乌局势进展:北约称相关方已向乌交付230辆坦克 两国总统联合访乌
- 推进全球关键矿产领域协调发展
- 古老而不失现代 中外文旅达人遇见多元西宁
- “远古与大地”多民族童声合唱音乐会唱响深圳
- 中新真探:喝完化痰止咳糖浆后能马上喝水吗?