彭博针对金融业推出大型语言模型BloombergGPT
中新网3月31日电 3月30日,彭博发布公告称,推出为金融界打造的大型语言模型(LLM)——BloombergGPT。
彭博是一家全球商业、金融信息和新闻资讯提供商。3月30日,该公司发布了一篇关于BloombergGPT开发情况的研究论文,详细介绍了这一大规模生成式人工智能(AI)模型。该大语言模型(LLM)专门针对各类金融数据进行训练,以全方位支持金融领域的自然语言处理(NLP)任务。
据彭博微信公众号消息,该模型将帮助彭博改进现有的金融NLP任务,如市场情绪分析、命名实体识别、新闻分类和问题回答等。此外,BloombergGPT还将释放更多新机遇,调动彭博终端上的海量数据,将人工智能的潜力带到金融领域。
据介绍,彭博的研究人员开创了一种混合训练法,将金融数据与通用数据集结合起来训练模型,以达到在金融基准上取得最佳结果,同时在通用LLM基准上也保持足够的竞争力。
与此同时,彭博的机器学习产品和研究小组和人工智能工程团队合作,利用彭博在数据创建、收集和整理方面的资源,构建了迄今为止规模最大的专业领域数据集之一。
作为一家金融数据公司,彭博的数据分析师在四十多年的时间里收集和维护了运用大量金融用语的文档。开发团队从这个由海量英文金融文档组成的档案库中,提取并创建了一个包含3630亿词例(token)的金融数据集。这批数据又与另一个包含3450亿词例的公共数据集叠加,成为了包含超7000亿词例的大型训练语料库。
彭博的研究团队利用该语料库的一部分内容,训练了纯解码器(decoder-only)因果语言模型,包含500亿个参数。团队还对训练出的模型进行了基准测试。金融领域的NLP任务采用了一套彭博的自有基准,各类通用NLP任务则采用市面上流行的基准。
彭博称,BloombergGPT模型在金融任务上的表现远超类似规模的开放模型,而在一般NLP基准上的表现也达到甚至超过平均水平。
彭博首席技术官肖恩·爱德华兹(Shawn Edwards)还表示,“BloombergGPT将使我们能够处理许多新型的应用,不仅比定制化模型的表现更好,而且开箱即用,能够大大缩短上线时间。”
相关推荐
- 最近发表
-
- 随机阅读
-
- 北京将核减核心区热点景区游客日接待量,重新规划旅游路线
- 杭温高铁联调联试跑出最高试验时速385公里
- 外媒:拜登初步批准向以出售价值6.8亿美元的武器
- 中国财政部:上半年地方财政运行总体平稳
- 国家金融监督管理总局印发信托公司监管评级与分级分类监管暂行办法
- 降本增效 上海市场监管部门率先开展数字化认证工作
- 公羊救援队抵达西藏定日地震灾区开展救援赈灾
- 3个串花6元打包!藏在支付页面的外卖打包费“刺”痛了谁?
- 交响诗篇《长城》在津演绎长城两千年沧海桑田
- 台湾花莲县海域发生4.5级地震 震源深度8千米
- 首都国际机场:须提供48小时内核酸检测阴性证明进入航站楼
- (乡村行·看振兴)安徽歙县:“青山萝卜”喜丰收 古法育种保品质
- 市场监管总局公布公平竞争审查举报受理方式
- 《我可怜的马拉特》春节再演 在浪漫诗意中传递温暖
- “新型城镇化”新在哪儿?“县域经济”如何发展?有几个关键词→
- (高质量发展调研行)生态与产业共舞 福建霞浦向海而兴
- 商务部回应欧盟拟对自华进口电动汽车征收临时反补贴税
- USANA葆婴携手权威研究机构发布保健绿皮书
- 首届中国(黑龙江)国际绿色食品和全国大豆产业博览会闭幕
- 外媒:波兰内阁集体辞职 总理被授权组建新政府
- 热门推荐
-
- 他乘“末日飞机”访韩 与韩防长会晤商定这些事
- 河北涿州至北京六里桥838公交线路恢复运营
- 直击江西抗洪一线:长江“孤岛”见安澜
- 逐浪数字经济大潮 浙江激发数据要素价值以“数”谋新
- 上海面向海外推广城市形象 启动欧洲系列活动第二站
- 北京青龙峡景区延迟开放
- 郁江2024年第1号洪水洪峰通过南宁
- 报告称上海成为餐饮首店的首选之地
- 法国前驻美大使发推:如此对待中国,美国到底想要什么?|世界观
- 端午假期北京旅游市场全面复苏 文旅产品供给充足
- 新疆哈密市举办左公柳“植柳日”活动
- 2024首届梧林戏剧周在福建晋江举办
- 新疆吐鲁番秋季晚熟哈密瓜进入采摘季 全国各地客商纷至沓来
- 拥抱大湾区
- 763名在缅电诈中国籍犯罪嫌疑人被移交中方
- 考古遗产管理专委会于杭州良渚成立 立足构建中国特色
- 菲律宾10月通胀率环比降至4.9% 低于央行预期
- 四川岷江东风岩航电枢纽项目正式启动建设
- 构筑“人工智能+”新增长极
- 日本自卫队训练时手榴弹爆炸致1人死亡