华为盘古否认抄袭阿里后,其大模型员工自曝存在套壳、续训、洗水印
创始人
2025-07-07 12:37:11
0

2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE,包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。

然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过“LLM指纹”技术分析指出,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致,远超业内0.7以下的正常差异范围。

华为诺亚方舟实验室声明截图

华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。

盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”

然而,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。

爆料文章截图

该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。

自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”

最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。

截至目前,华为并未对此自曝内容发表声明。

(转自:都市现场)

相关内容

热门资讯

2025年诞生新独角兽盘点:A...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 2025 年上半年,...
央行:连续8个月增持!   来源:中国银行保险报  7月7日,中国人民银行、国家外汇管理局公布6月官方储备资产数据。截至20...
喜临门与强脑科技正式签署独家战... 观点网讯:7月7日,据强脑科技公众号消息,该公司于近日与喜临门联合召开独家战略合作签约暨新品发布会,...
即将开幕!晋中见→ 转自:晋中市政府门户网站山西省第二十三届大中学生田径运动会将在我市举办为贯彻落实《关于全面加强和改进...
起航!助力环球科考十年计划,“...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 南都讯 记者伍曼娜 ...
卫宁健康:获得政府补助1100... 卫宁健康7月7日晚间发布公告称,卫宁健康科技集团股份有限公司近日收到政府补助资金1100万元,单笔金...
石大胜华:7月7日召开董事会会... 石大胜华7月7日晚间发布公告称,公司第八届第十七次董事会会议于2025年7月7日在山东省东营市垦利区...
中金印力消费REIT截至6月底... 观点网讯:7月7日,中金印力消费基础设施封闭式基础设施证券投资基金(简称“中金印力消费REIT”)发...
螺杆清洗料怎样才能用的好?协同... (转自:链塑网)如果用清洗料洗螺杆能够像往洗衣机里倒一勺清洗剂那样简单的话,那该有多好啊!然而,现实...
洲明科技控股股东林洺锋拟减持不... 7月7日,洲明科技(300232)发布公告,控股股东、实际控制人林洺锋因个人资金需求,计划在2025...