大模型“百花齐放” 业界合力“充实”中文语料数据
中新网上海9月8日电 (记者 郑莹莹)中国大模型语料数据联盟8日又吸纳了一批新成员,来充实适用于大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。
上海人工智能实验室主任助理王延峰说,ChatGPT令人惊艳,但它对中文的理解还不尽人意。
大模型时代带来以数据为中心的人工智能领域新发展,但“投喂”哪些数据备受关注。王延峰在接受记者采访时表示,语料数据不仅要量大,而且要高质量,“就像培养一个孩子一样,投入高质量的教育,才有高质量的‘输出’。”
对于中文语料数据的不足,他表示,中文语料数据对于大模型能力的提升至关重要,业界需要高质量的中文语料数据集。
上海蜜度信息技术有限公司(简称:蜜度)首席技术官刘益东在受访时指出,目前中国国内的大模型训练里,非常缺少高质量的中文语料数据集,“现在很多市面上的大模型主要是基于外文资料,再加上少量的中文资料,这样训练出来的大模型,对中文的理解能力以及对中文内容的生成能力是有欠缺的。”
蜜度是此次加入中国大模型语料数据联盟的9位“新成员”之一。现场,蜜度发布了包含7000多万条数据的开源中文语料数据集。
刘益东说,在大模型“百花齐放”的发展背景下,需要有一些机构或团体去做“公共建设”,去推动这个行业的发展,企业乐于加入其中。
上海市经济和信息化委员会人工智能发展处处长王志佳表示,“百模大战”不是一场零和游戏,携手并进才能把生成式人工智能真正与生产力相结合,把大模型这个“冷灶”真正“烧热”起来。
他指出,建设高质量语料库是大模型产业链的关键环节。大模型语料数据的多元供给需要多方协力、共同推进。(完)
- 最近发表
-
- 随机阅读
-
- 能发弹幕的“数字化婚礼”,见过吗
- 海外华文媒体走进“水浒故里”:将助推水浒文化走向世界
- 北京二手房:开门红未至 小阳春欠热
- 中国海上首个超高温超高压气田生产平台安装就位 投产后高峰年产量近6亿方
- 空天信息产业如何合作与发展?业界在渝分享实践与思考
- (第七届进博会)“中国元素”成跨国企业打开中国市场的“流量密码”
- 中新健康 | 数百名医学青年安徽蚌埠研讨基础医学最新进展
- 电视剧《他是谁》研讨会在京举行
- 前8月中国百强房企销售额同比降逾8% “千亿房企”数量增多
- 湖南双牌强壮“文旅龙骨”培育经济新增长点
- 广西贵港:农机“上岗”显身手 种田更高效
- 巴基斯坦俾路支省发生袭击事件 已致23人死亡
- 广东台山豆角滋味多 隔屏唤起侨胞乡愁
- 中国驻英国大使郑泽光:构建稳定互惠的中英关系
- 山东各地开展学雷锋志愿服务活动 倡树社会文明新风
- 内蒙古呼伦贝尔实现生态产品价值转换
- 普华永道:2023年医疗行业成为中企向东南亚投资的重要领域
- 职场妈妈刚柔并济 “西执花开”守护公平正义
- 2023年中国居民健康素养水平达到29.70%
- 江西集中签约逾10亿元跨境电商项目
- 热门推荐
-
- 品出秋天的味道 时令水果好“柿”到来
- 北京全力抢修道路保通信
- 中基协回应外媒报道“中国拟加强对冲基金监管”:不客观、不属实
- 财经观察:多重因素显效 5月消费市场恢复向好
- 苏宁易购零售云交流交易大会,百大品牌、多重补贴助燃818
- 皇家园林“寻龙记”:中国唯一双面九龙壁藏着多少龙?
- “大漆的故事”讲座为悉尼艺术爱好者带来艺术新体验
- 上海发布住宅维修资金管理新规 规范维修资金使用流程
- 菲律宾8月外商直接投资净流入同比下降14.5%
- 云南鲜花借力“双十一”促销加速出海
- 8月下旬东北、华南部分中小河流可能发生超警以上洪水
- 河南开封:“一动一静一中医”激发文旅新动能
- 国际识局:战败投降日,日本一批政客“拜鬼”,首相岸田也有动作
- 水母游泳方式启发水下航行器设计
- 何以中国·运载千秋丨运河之上看一粒米的漕运之旅
- 广州海事部门自主研发“危险货物快筛系统”上线
- 吉林森林公安破获非法猎捕野生中华蟾蜍案
- 商务部回应中欧电动汽车关税谈判:磋商还存在重大分歧
- 彩云之南飞来“雀之灵”,杨丽萍再现经典舞台
- 英国获准加入《全面与进步跨太平洋伙伴关系协定》