中关村建起人工智能“防火墙”
创始人
2026-01-07 06:28:06

转自:北京日报客户端

一堵人工智能“防火墙”在中关村建起。日前,北京前瞻人工智能安全与治理研究院发布了前瞻人工智能安全评估体系与基座平台,包含人工智能安全评估框架、技术工具和价值参考等。

随着技术飞速迭代,人工智能的安全风险与日俱增,构建完善的人工智能安全评估与治理体系刻不容缓。此次发布的“前瞻安全基准”安全评估体系,不局限于传统安全评估的单一维度,而是在根植基础安全的基础上,延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度。

该院院长曾毅介绍,这套体系可覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键领域,重点聚焦评估和解决隐私与数据保护、滥用恶用、虚假信息防范等难题。

“前瞻·灵御”人工智能安全攻防平台通过模拟真实攻防场景,实现对模型安全性能的全面“体检”。目前,该平台支持60余种主流大模型、20余种攻击方法和10余种防御机制。

“测试发现,近几年的大模型在安全性上并没有明显提升,平台对部分新模型的攻击成功率甚至更高。”曾毅直言,人工智能模型构筑防御工事并不一定要重新训练,部署在线推理阶段的安全护栏,就能显著提升模型安全水平。而灵御平台就是通过提供针对性的防御方案和“加固”建议,实现主动防御、精准防护。

“前瞻·灵度”平台同步搭建,关注点侧重于对人工智能伦理进行智能评估与价值校准。它能在6个维度、90个细分类别中,对上百个大模型进行实时动态监控和测试。“灵度平台集成了以中国价值观为核心的大规模中文价值语料库,累计定义了25万余条规则。”曾毅说,这能有效解决现有伦理评估中文价值适应性不足、边界覆盖不全的问题。

人工智能安全评估体系和基座平台,不仅解决了“评什么、怎么评”的疑问,还回答了“怎样攻、如何防”,并明确了人工智能安全将“向何处去”的价值导向。

来源:北京日报

相关内容

热门资讯

国家医保局就《参照药预沟通办法... 经济观察网 国家医保局就《参照药预沟通办法(试行)》(征求意见稿)公开征求意见。目前,我国在医保药品...
高层次人才“带编入企”,为企业... 川观新闻记者 徐浩煊 高坪融媒 侯鹏程1月7日,南充摩兰科技有限公司生产车间内,工艺工程师唐煜在光电...
天普股份:收到证监会立案告知书... 天普股份公告,公司于1月9日收到中国证监会下发的《立案告知书》,因公司股票交易异常波动公告涉嫌重大遗...
步科股份683.22万限售股将... 步科股份1月10日发布公告称,公司部分限售股即将解禁上市,本次解除限售股份的数量为683.22万股,...
天普股份被证监会立案调查:股票... 1月9日,证监会宣布,近期宁波市天普橡胶科技股份有限公司(天普股份(维权),605255.SH)股票...