我国首部大模型国家标准实施,填补技术评价体系空白
创始人
2025-12-26 17:49:50

新京报讯 据市场监管总局消息,近日,GB/T 45288《人工智能 大模型》系列国家标准正式实施,标志着我国大模型产业进入“科学权威、统一规范”新阶段。作为首部聚焦通用大模型的国家标准,该系列填补了技术评价体系空白,明确性能、安全与服务能力要求,配套评测能力已获中国合格评定国家认可委员会(CNAS)认可。

基于此构建的“求索”-LMBench评测基准,整合方法、数据集与自动化平台,成为行业公认的“能力标尺”。评测体系已形成主流大模型白名单,为央企、国企选型提供依据,并支撑中石化、南方电网等建设行业大模型,完成对华为盘古、讯飞星火、中国移动九天等模型的场景验证。

截至目前,标准工具完成千余项评测任务,调用大模型超95万次,精准识别幻觉控制、内容安全等共性问题,助力近30家厂商技术迭代,推动形成“研发—评测—应用—升级”闭环。

标准国际化同步推进。面向东盟编制英语、老挝语、高棉语版本,填补区域空白;我国开源模型架构已被新加坡等国项目采用,彰显标准引领下的全球影响力。

编辑 张磊

相关内容

热门资讯

颜值≠安全,网红玫瑰盐的“智商... (来源:中国市场监管报)转自:中国市场监管报“AAA级粉盐”“纯天然无污染”“富含多种微量元素”……...
中国航发集团原董事长曹建国已从... 12月27日,澎湃新闻查询中国工程院官网“全体院士名单”注意到,曾任中国航空发动机集团有限公司(以下...
我国修改国家通用语言文字法 铸... 中新网北京12月27日电 (记者 谢雁冰)十四届全国人大常委会第十九次会议12月27日表决通过新修订...
IPO鹰眼预警 | 通则康威增... Hehson财经上市公司研究院|财报鹰眼预警广州通则康威科技股份有限公司(以下简称“通则康威”)披露...
广播连续剧《一往无前》今日开播 【广播连续剧《一往无前》今日开播】#广播连续剧一往无前#今天起至2026年1月,内蒙古自治区广播电视...