DeepSeek发布Prover-V2新模型 参数量6710亿
创始人
2025-04-30 19:17:10

观点网讯:4月30日,DeepSeek于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。

据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数量6710亿,或为去年发布的Prover-V1.5数学模型升级版本。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

相关内容

热门资讯

四中全会精神在基层|湖南浏阳:... 转自:新华社田埂上,新铺设完工的灌溉管网开闸,水流喷涌而出。“这块地土壤肥沃,今年除了粮食增产,每亩...
四年84名大学生接力文艺支教 为提升基层特别是农村教师的专业能力和辅导水平,河南省文明办、省教育厅、省文联近年来联合启动“快乐成长...
“她是我唯一的牵挂”,91岁老... 近日,河南郑州91岁王先生告诉记者,老伴生病8年一直是他在照顾,如今老伴去世5年,自己也找了一位50...
始于热爱 归于真诚 在元树巷的小区内,藏着一家充满烟火气的中国福利彩票店。它不临主街,不占喧嚣,却在邻里口耳相传中默默扎...
“数九”,因何从冬至开始? “一九二九不出手,三九四九冰上走……”一首“数九”歌谣,是很多人熟悉的童年回忆。冬至节气一到,“数九...