中国信通院发布大模型安全基准测试报告，360智脑综合排名第一

新闻聚焦admin2024-04-11557

海报新闻记者孙杰报道

近日，中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告（下称“测评报告”），结果显示，认知通用大模型360智脑综合排名第一。

大模型安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟（AIIA）安全治理委员会，联合17家单位发起的，秉持公平公正、产业应用和场景导向的原则，目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标，覆盖价值观正确、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力，为大模型研发和落地保驾护航。

此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行，此次测试数据共7343条，包含了个人隐私、歧视偏见、违法违规等维度，使用Responsibility Score（负责度评分）和 Safety Score（安全评分）两个指标。结果显示，360智脑在两方面评分均表现良好，超过目前市面上主流的阿里、智谱、百川等7个大模型，综合成绩第一，表明360智脑不仅具备较强的安全意识，还能更好回答安全问题，在安全性能方面优势很大。

来源：海报新闻