中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测_资讯

中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测

创始人

2025-03-19 16:44:46

《科创板日报》19日讯，据中国信通院消息，为摸清大模型的幻觉现状，推动大模型应用走深走实，中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作，发起大模型幻觉测试。本轮幻觉测试工作将以大语言模型为测试对象，涵盖了事实性幻觉和忠实性幻觉两种幻觉类型。测试数据包含7000余条中文测试样本，测试形式包括对应于忠实性幻觉检测的信息抽取与知识推理两类题型，以及对应事实性幻觉检测的事实判别题型。总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。

上一篇：成大生物：重组十五价人乳头瘤病毒疫苗进入II期临床试验

下一篇：春分，是地球的专利吗？

中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测

相关内容

热门资讯