大模型“百花齐放” 业界合力“充实”中文语料数据
中新网上海9月8日电 (记者 郑莹莹)中国大模型语料数据联盟8日又吸纳了一批新成员,来充实适用于大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。
上海人工智能实验室主任助理王延峰说,ChatGPT令人惊艳,但它对中文的理解还不尽人意。
大模型时代带来以数据为中心的人工智能领域新发展,但“投喂”哪些数据备受关注。王延峰在接受记者采访时表示,语料数据不仅要量大,而且要高质量,“就像培养一个孩子一样,投入高质量的教育,才有高质量的‘输出’。”
对于中文语料数据的不足,他表示,中文语料数据对于大模型能力的提升至关重要,业界需要高质量的中文语料数据集。
上海蜜度信息技术有限公司(简称:蜜度)首席技术官刘益东在受访时指出,目前中国国内的大模型训练里,非常缺少高质量的中文语料数据集,“现在很多市面上的大模型主要是基于外文资料,再加上少量的中文资料,这样训练出来的大模型,对中文的理解能力以及对中文内容的生成能力是有欠缺的。”
蜜度是此次加入中国大模型语料数据联盟的9位“新成员”之一。现场,蜜度发布了包含7000多万条数据的开源中文语料数据集。
刘益东说,在大模型“百花齐放”的发展背景下,需要有一些机构或团体去做“公共建设”,去推动这个行业的发展,企业乐于加入其中。
上海市经济和信息化委员会人工智能发展处处长王志佳表示,“百模大战”不是一场零和游戏,携手并进才能把生成式人工智能真正与生产力相结合,把大模型这个“冷灶”真正“烧热”起来。
他指出,建设高质量语料库是大模型产业链的关键环节。大模型语料数据的多元供给需要多方协力、共同推进。(完)
- 最近发表
-
- 随机阅读
-
- 锚定现代化 改革再深化丨浙江临海:一块豆腐,折射共富工坊建设新未来
- 海南加强用海用岛要素保障 简化审批手续
- “中国韵味”巴黎文化展开幕
- 给缅北电诈家族成员庆生 明星祝福不能这么“随便”
- 新西兰惠灵顿市长率团访问中国 寻求电影教育等领域合作
- 路面温度零下1.9摄氏度!京珠北高速部分路段因结冰封闭
- 中国红十字会在沪发布“红十字救在身边”2024年度成果
- 第三十二届“时报金犊奖”全球校园创意分享会在内蒙古举办
- 日本地震遇难者人数升至126人 200余人下落不明
- “我为一带一路写首歌”!你可以,请速来!
- 外银分析:中国制造业PMI反弹 消费持续复苏
- 认可委员会顺利通过亚太认可合作组织国际同行评审
- 法国拨款4800万欧元应对东南部地区风暴灾情
- 以军密集空袭加沙南部并发动地面进攻
- (经济观察)重磅监管条例审议通过 中国百万亿元级大市场如何发展?
- 既是大市场也是新赛道 外资眼中的中国新机遇
- 台湾网络新媒体人:当好桥梁纽带 用心用情讲好两岸故事
- “神兽回笼”亲子关系亮红灯?
- 追光动画于洲:为中国观众做中国故事
- 北京义务教育入学服务平台5月1日开通 各区咨询电话公布
- 热门推荐
-
- 调查:欧洲人更多地将中国视作“必要伙伴”而非对手
- “海上阅读”故事:于百年坚守中品味“灯塔精神”
- 英国政府出手阻止外资收购老牌大报
- “我承担不起孩子一万元的暑假账单”
- 中国教育部拟同意设置福建福耀科技大学等14所学校
- 美国俄亥俄州发生爆炸事故 致7人受伤2人失踪
- 全球产业转移变局下 多国政要学者费瓦湖畔共话南亚发展
- 北京文旅市场强劲复苏 春节假期接待游客712.8万人次
- 将莲子壳诊断为疑似肿瘤 医生的解释为何难以服众
- 江苏“万亿工业之城”全面开启新型工业化新征程
- 第82届中国教育装备展示会:教育数字化装备成亮点
- “蓟州风·山水韵”文旅推介展销活动在天津举行
- 又便宜又好吃的白草莓,明年见
- 津巴布韦因严重旱灾进入灾难状态
- “数字家蚕”共享分析平台上线 面向全球科学家开放
- 积石山6.2级地震已致青海海东市32人遇难
- 崇太长江隧道“入江” :世界最大直径高铁盾构机开启穿江之旅
- 重庆云阳:年现金流超过700亿元 “云阳面”占全国70%以上鲜面市场份额
- 塞内加尔反对派领袖和总统候选人同时获释
- 青海:保障母婴安全,儿童健康水平稳步提升