最高220倍提速!面壁智能发布新一代端侧模型,李大海:知识密度越来越高,端侧大有可为
创始人
2025-06-09 21:47:36

AI初创公司面壁智能发布并开源了新一代端侧模型小钢炮4.0,可实现长文本推理速度5倍常规加速以及最高220倍加速,共有8B和0.5B两个参数规模。

据介绍,8B模型为稀疏注意力模型,在多个基准测试中,以22%的训练开销,性能比肩Qwen-3-8B、超越Gemma-3-12B,同时,注意力机制上采用高效双频换挡,可根据文本长短切换稀疏与稠密。0.5B模型相较Qwen-3-0.6B、Llama 3.2, 仅2.7%的训练开销,一半参数性能翻倍,并实现最快600Token/s的推理速度。

面壁智能CEO李大海表示:“没有做过上下文稀疏化的模型内存消耗过大,显存不够要用CPU的内存,‌Offloading(显存优化技术)会导致速度急速下降。我们抛砖引玉,做了两个还不错的应用,作为demo一并向大家开源。”

李大海表示,随着大模型知识密度越来越高,端侧模型将大有可为。(澎湃新闻记者 秦盛)

相关内容

热门资讯

投资者提问:请问董秘,当前中日... 投资者提问:请问董秘,当前中日关系陷入僵局乃至谷底之际,公司有规划更多使用国产光刻胶等材料来替代日系...
富德生命人寿咸阳中心支公司被罚... 12月16日金融一线消息,据咸阳金融监管分局行政处罚信息公开表显示,富德生命人寿保险股份有限公司咸阳...
市场监管总局:抓紧推进出台《互... 转自:北京日报客户端记者16日从市场监管总局获悉,市场监管总局正抓紧推进《互联网平台反垄断合规指引》...
天奇股份:锂电循环业务夯实产业... 12月16日,江西天奇金泰阁集团(简称“天奇金泰阁”)资本赋能发展大会在江西龙南举行。会上,天奇股份...
「侠客岛」他们用上了“AI分身...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:海外网)来源...