6月6日晚,面壁智能发布端侧大模型MiniCPM 4.0。该公司称新模型通过自研CPM.cu推理框架,在极限场景下实现最高220倍提速,常规5倍提速,支持在vLLM、SGLang、LlamaFactory等框架部署。
上一篇:特朗普瞄准加州下手,民主党或打马斯克牌反击
下一篇:高考首日长江沿线将现强降雨 南北多地高温持