彭博针对金融业推出大型语言模型BloombergGPT
中新网3月31日电 3月30日,彭博发布公告称,推出为金融界打造的大型语言模型(LLM)——BloombergGPT。
彭博是一家全球商业、金融信息和新闻资讯提供商。3月30日,该公司发布了一篇关于BloombergGPT开发情况的研究论文,详细介绍了这一大规模生成式人工智能(AI)模型。该大语言模型(LLM)专门针对各类金融数据进行训练,以全方位支持金融领域的自然语言处理(NLP)任务。
据彭博微信公众号消息,该模型将帮助彭博改进现有的金融NLP任务,如市场情绪分析、命名实体识别、新闻分类和问题回答等。此外,BloombergGPT还将释放更多新机遇,调动彭博终端上的海量数据,将人工智能的潜力带到金融领域。
据介绍,彭博的研究人员开创了一种混合训练法,将金融数据与通用数据集结合起来训练模型,以达到在金融基准上取得最佳结果,同时在通用LLM基准上也保持足够的竞争力。
与此同时,彭博的机器学习产品和研究小组和人工智能工程团队合作,利用彭博在数据创建、收集和整理方面的资源,构建了迄今为止规模最大的专业领域数据集之一。
作为一家金融数据公司,彭博的数据分析师在四十多年的时间里收集和维护了运用大量金融用语的文档。开发团队从这个由海量英文金融文档组成的档案库中,提取并创建了一个包含3630亿词例(token)的金融数据集。这批数据又与另一个包含3450亿词例的公共数据集叠加,成为了包含超7000亿词例的大型训练语料库。
彭博的研究团队利用该语料库的一部分内容,训练了纯解码器(decoder-only)因果语言模型,包含500亿个参数。团队还对训练出的模型进行了基准测试。金融领域的NLP任务采用了一套彭博的自有基准,各类通用NLP任务则采用市面上流行的基准。
彭博称,BloombergGPT模型在金融任务上的表现远超类似规模的开放模型,而在一般NLP基准上的表现也达到甚至超过平均水平。
彭博首席技术官肖恩·爱德华兹(Shawn Edwards)还表示,“BloombergGPT将使我们能够处理许多新型的应用,不仅比定制化模型的表现更好,而且开箱即用,能够大大缩短上线时间。”
相关推荐
- 最近发表
-
- 随机阅读
-
- “南湖·1921”红色旅游列车首次登上“春运大舞台”
- 第136次中老缅泰湄公河联合巡逻执法行动圆满结束
- 印尼国际中文教育志愿者举办交流分享会
- 5月份全国发行地方债7554亿元
- 守好民众“救命钱” 广东加大力度打击欺诈骗保
- 百家融媒重庆行丨大足:“花式”守护为“悬崖瑰宝”延续“生命”
- 漂白剂可溶解头发,正确使用分几步
- 土耳其总统埃尔多安寻求连任遇挑战
- 深圳发布27条具体扶持措施鼓励渔业“挺进深蓝”
- 有聊|孙涛:保持心态年轻,要多与年轻人对话
- 乌干达中部一油罐车翻车爆炸已致11人死亡
- 持续布局“工业上楼” 上海多地推动未来产业“攀岩”
- 地方两会频频点题“国企改革” 推动相关工作走深走实
- 英国泰晤士水务公司将投入16亿英镑减少污水排放
- 以总理承认“误杀”人质 以色列和卡塔尔重启停火谈判
- 中央气象台继续发布台风黄色预警
- 第八届中国非遗博览会开幕 数字技术让“传统”焕“新彩”
- 成都大运会支付服务新亮点:外国运动员花数字人民币骑共享单车
- 亚丁湾发生5.3级地震,震源深度10千米
- 湖北软件业彰显硬实力 助推传统制造业转型升级
- 热门推荐
-
- 大型沉浸式戏剧庄园《新世界》开启2023年演出
- 朝中社:金正恩邀请普京访朝 普京接受
- “实行小麦标准化生产和管理” 新疆发布小麦优质高产栽培技术方案
- 强内供保外送 新疆确保迎峰度夏期间电力供应
- 疗愈经济赋能中国县域游 助眠食疗成卖点
- 西湖洗湖引热议 景区回应:维护西湖美常规保洁操作
- 迎新助农集市点燃冬日“烟火气” 重庆产业园区“以购代帮”赋能乡村振兴
- 回国从医是我的理想(学海泛舟)
- 互联网下的新农人|度小满X新华社客户端联合探访山白团队的非遗传承之路
- 澳大利亚国家美术馆首次向中国返还文物艺术品
- 日本演员中山美穗在家中身亡 曾出演《情书》
- 过度维修、诱导消费……这些修车“套路”你遇到过没?
- 如何为智能网联新能源汽车产业培育专业人才?业界代表重庆展开讨论
- 中国经济微观察 向“新”而行 良性竞争 推动经济持续向好
- (新春走基层)轨道车司机的“最后一班岗”:照顾好车辆和同事
- 德国化工巨头科思创上海新工厂正式投产
- 明代卫所制“活化石”张家口万全右卫城迎“新生”
- 深夜,万科回应一切
- “数字梨园”描绘智慧文旅图景 谱写数字乡村新篇——数字乡村聚力行动帮扶团走进甘肃什川镇
- 铁路公安机关排查隐患为“五一”假期营造良好治安环境