中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。
大模型安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标,覆盖价值观正确、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力,为大模型研发和落地保驾护航。
此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行,此次测试数据共7343条,包含了个人隐私、歧视偏见、违法违规等维度,使用Responsibility Score(负责度评分)和 Safety Score(安全评分)两个指标。结果显示,360智脑在两方面评分均表现良好,超过目前市面上主流的阿里、智谱、百川等7个大模型,综合成绩第一,表明360智脑不仅具备较强的安全意识,还能更好回答安全问题,在安全性能方面优势很大。
360集团表示,自身在网络安全领域深耕多年,拥有的安全大数据规模全球领先;且作为国内较早布局人工智能大模型的企业,360自研的认知型通用大模型——“360智脑”在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力第一梯队。为对应人工智能时代出现的AI安全新挑战,360提出“以模制模”的理念,用人工智能对付人工智能,研发360安全大模型,目前已经在多个重要安全领域实现大模型能力的全面赋能。
资料显示,360是中国人工智能产业发展联盟(AIIA)安全治理委员会副组长单位以及大模型安全风险防范能力系列评估规范“核心参编单位”,同时作为中国网络空间安全协会人工智能安全治理专业委员会首批成员单位,参与大模型语料库和安全评测。
- 最近发表
-
- 随机阅读
-
- 四千余家海外媒体报道显示——中国科幻出海加速
- 焦点访谈:中国经济亮眼开局 系列举措力保消费恢复势头
- 建司75载丨国寿寿险致力实现好、维护好、发展好金融消费者的合法权益
- 也门多地遭美英军队空袭 致至少11死14伤
- 作家许诺晨:儿童文学作品要兼具知识性和趣味性
- 上海医生千里援青:援与受,收获成长和人生的经验
- 全球顶尖焰火燃放队伍齐聚湖南浏阳赛创意
- 金融监管总局:拟将消费金融公司主要出资人持股比例要求提高至不低于50%
- 以军方称叙利亚向戈兰高地发射至少一枚火箭弹
- 广西河池南丹办茶文化旅游节 “茶旅融合”促乡村振兴
- 《川茶诗词选注》:展现川茶文化韵味
- 多个热门航线经济舱售罄,你买好返程机票了吗?
- 金观平:下好黄河绿富共赢一盘棋
- “百年无极”展出梵高、莫兰迪等欧洲艺术大师62幅珍品
- 澄江生物群发现40周年:已累计报道300余个物种
- 致敬侠之大者,卡游获金庸作品授权,将推中国首款正版金庸武侠卡牌
- 中英机构合办中医药国际会议在伦敦举办
- 服务业开放为经济发展注入新动力
- 骨质疏松症靶点结构精准解析
- 国家发改委:加强消费信贷用途和流向监管,推动合理增加消费信贷
- 热门推荐
-
- 福建推进困境儿童重大疾病救治 3年救助200多名患儿
- 吉林榆树雨水不断:国家安全生产应急救援队伍全力抗洪
- 山西首份中国—尼加拉瓜自贸协定原产地证书签发
- 韩公调处要求相关机构协助执行尹锡悦逮捕令
- 在黑色煤田上书写“绿智答卷”
- 建设银行首单500亿元TLAC债券成功发行
- 四川翠云廊:古柏长青重保护 名木古韵存千载
- 朝鲜试射洲际弹道导弹
- 2020年以来广东发现动植物新种逾60种
- 日媒:驻日美军坠海军机残骸被发现 事故已致6人死亡
- 今天降准!央行将下调金融机构存款准备金率0.5个百分点
- 美国佛州发生枪击事件致3人死亡 嫌疑人被警方击毙
- @所有游客:查收这份清明出游提示 四月这些著名景区免费玩!
- 全流程监管农民工账户是治理欠薪的源头之举
- 美国国务院官员:美军数月内将从尼日尔撤离
- 外媒:马斯克与伊朗代表“秘密会谈一小时”
- 北京全面优化营商环境
- 陕西延安一煤矿瓦斯爆炸 已致7人死亡
- 河北本轮降雪平均降水量已达12.5毫米 多地积雪超9厘米
- 上海本土无症状感染者连日增加 原因何在?