中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。
大模型安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标,覆盖价值观正确、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力,为大模型研发和落地保驾护航。
此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行,此次测试数据共7343条,包含了个人隐私、歧视偏见、违法违规等维度,使用Responsibility Score(负责度评分)和 Safety Score(安全评分)两个指标。结果显示,360智脑在两方面评分均表现良好,超过目前市面上主流的阿里、智谱、百川等7个大模型,综合成绩第一,表明360智脑不仅具备较强的安全意识,还能更好回答安全问题,在安全性能方面优势很大。
360集团表示,自身在网络安全领域深耕多年,拥有的安全大数据规模全球领先;且作为国内较早布局人工智能大模型的企业,360自研的认知型通用大模型——“360智脑”在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力第一梯队。为对应人工智能时代出现的AI安全新挑战,360提出“以模制模”的理念,用人工智能对付人工智能,研发360安全大模型,目前已经在多个重要安全领域实现大模型能力的全面赋能。
资料显示,360是中国人工智能产业发展联盟(AIIA)安全治理委员会副组长单位以及大模型安全风险防范能力系列评估规范“核心参编单位”,同时作为中国网络空间安全协会人工智能安全治理专业委员会首批成员单位,参与大模型语料库和安全评测。
- 最近发表
-
- 随机阅读
-
- 国际锐评丨面对美国利诱,菲律宾需要多些清醒和理性
- 铁路旅游如何打破“夕阳红”局限?
- 黎以临时边界冲突持续 多地发生交火
- “链”动全球 一图带您了解2024年链博会
- 西藏拉萨市城关区首届商品展销会已实现销售额1.3亿元
- 三个“洋女婿”勇闯南京龙舟赛:热血沸腾的端午节太赞了
- 中国首艘超深水大洋钻探船在广州命名试航
- 广西百色4人被玻璃压倒身亡
- 甲骨文进入智能化时代 数字“焕活”冷门学科
- 几内亚首都一油库爆炸造成百余人死伤
- 中企车队在巴基斯坦遭遇恐袭 联合国安理会强烈谴责
- 福州长乐机场海关查获“百宝箱”
- 江西全省高等级航道通航总里程达960.6公里
- 消费者不再为了凑单过度消费 网友吐槽“6·18”、“双11”等大促套路满满
- 2022网络文学十大关键词出炉,中国故事、科幻等上榜
- 落实新业态劳动者权益保障,滴滴推出“橙意保障计划”
- 欧盟27国代表一致支持《人工智能法案》文本
- 重庆火锅产业要素交易平台上线运营 构建“火锅产业数智大脑”
- 第八届圣保罗中国电影展举行深度对话系列活动
- 连连失守中国市场 潘多拉“差”在哪儿
- 热门推荐
-
- 中新健康|专家抓到“最毒乳腺癌”化疗耐药“元凶”
- 东盟与中日韩先进制造业企业对接 合作意向金额近6亿美元
- 专业“擦边”的椰树,风评反转了?
- 国家金融监管总局:人身保险“睡眠保单”清理工作显实效
- 重庆渝中持续整治旅游乱象 违规“旅拍”被查
- 注意防范!甘肃五县区发布冰雹橙色预警
- 搭建桥梁 沪上社会组织“润企细无声”
- “一站式”通办服务:新疆喀什地区首个城市候机楼启用在即
- 文化中国行丨卫星遥感监测、绿色环保材料……齐长城保护有了“智慧帮手”
- 粤东城际铁路亚洲跨度最大V撑连续梁启动浇筑
- 中国最大淡水湖鄱阳湖再次跌破10米低枯水位
- 合肥海关查获侵权水杯854个
- 苏丹解除南苏丹原油出口的不可抗力
- 黑龙江双阳煤矿重大瓦斯爆炸事故调查结果公布 46人被处理
- 种植“供港澳”蔬菜、包机赴长三角务工 青海促脱贫人口稳定增收
- 山西加强煤矿水害防治工作 提升治理水平
- 震中日记 | 2月8日,奔赴重灾区
- 安徽铜陵楼房坍塌事故现场:出动大型设备10余台
- 爱奇艺2024Q1稳步提升经营效率:总营收79亿元 持续发力生成式AI
- 中经评论:以优质供给满足更多人的“文化之约”