腾讯,大动作!
创始人
2025-06-28 00:05:23
0

【导读】腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解

中国基金报记者 张燕北

头部互联网公司旗下大模型加速开源。

627日,腾讯混元开源的首款混合推理MoE模型Hunyuan-A13B发布,该模型是业界首个13B级别的MoE开源混合推理模型,其效果比肩同等架构领先开源模型。

开源模型灵活性、透明度和成本优势,为人工智能产业发展带来新机遇。今年年初DeepSeek出圈后,腾讯、阿里、字节等头部互联网公司旗下大模型开源悄然加速。

腾讯混元开源首款混合推理MoE模型

腾讯混元宣布开源首个混合推理MoE模型Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高,这意味着,开发者可以用更低门槛的方式获得更好的模型能力。

即日起,模型已经在GithubHuggingface等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

据了解,这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。

*加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分 

在实际使用场景中,Hunyuan-A13B模型可以根据需要选择思考模式。快思考模式提供简洁、高效的输出;慢思考则涉及更深、更全面的推理步骤,如反思和回溯。

Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,只需要1张中低端GPU卡即可部署。目前,Hunyuan-A13B已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐量是前沿开源模型的2倍以上。

Hunyuan-A13B集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

腾讯方面相关人士表示,Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有400+业务用于精调或者直接调用,日均请求超1.3亿次。

本次进行升级更新并对外开源,是继混元Large后混元大语言模型推出的又一重要开源模型,其参数更小,但是性能和效果实现了大幅的提升。接下来,腾讯混元将推出更多尺寸、更多特色的模型,将更多实践技术与社区共享,促进大模型开源生态的繁荣。

开源浪潮席卷行业

2024年大模型从科技前沿走向大众视野,2025DeepSeek火爆出圈,开源正在成为国内外众多大模型的必选项

据不完全统计,仅今年3月至今,OpenAI、谷歌、Meta、英伟达、阿里、DeepSeek、智谱AI、群核科技、阶跃星辰等全球多家科技巨头已密集发布超10款开源大模型。

与此同时,开源模型性能持续突破,AI开源社区Hugging Face的模型榜单不断被刷新。无论是科技巨头,还是初创企业,都在加快步伐拥抱开源浪潮。共享最新前沿技术成果的同时,这些企业也在致力于降低算力成本。

就国内而言,字节跳动豆包、昆仑万维、百度文心、阿里通义千问等今年均推出开源模型。当前,头部互联网公司旗下大模型开源仍在加速。

530日凌晨,阿里巴巴开源了创新自主搜索AI Agent——WebAgentWebAgent具备端到端的自主信息检索与多步推理能力,就像人类一样在网络环境中主动感知、决策和行动,例如,当用户想了解某个特定领域的最新研究成果时,WebAgent能够主动搜索多个学术数据库,筛选出最相关的文献,并根据用户的需求进行深入分析和总结。

字节跳动Seed团队也有新动作,发布并开源了多模态基础模型BAGEL,该模型拥有70亿个活跃参数,总参数达140亿个。BAGEL集视觉理解、文生图、图像编辑于一体,在标准多模态理解基准测试中表现出色,优于现有顶级开源视觉语言模型如Qwen2.5-VLInternVL-2.5

麦肯锡公司联合Mozilla基金会、Patrick J.McGovern基金会发布的《AI时代的开源技术》报告显示,全球超过50%的企业已在数据、模型及工具层面采用开源AI技术。

开源模型通过提供高质量的模型权重和训练代码,支持模型的预训练、微调和定制,助力科创企业基于现有的强大模型进行快速开发,避免了从头开始构建AI系统的高昂成本。企业可依据业务所需灵活调用模型组件、算法框架和推理引擎,实现从重资产开发轻量化集成的转型路径,大幅降低了创新门槛和试错成本。

据了解,未来混元计划推出多尺寸混合推理模型,从0.5B32BDense模型,以及多个MoE模型,适配企业与端侧不同需求,混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。

编辑:晨曦

校对:王玥

制作:舰长

审核:木鱼

相关内容

热门资讯

科创板“第五套”首单受理“破冰... 21世纪经济报道记者 杨坪 实习生 宋晨曦 深圳报道近日,上交所官网受理了创新药企珠海泰诺麦博制药股...
当司庆脱离模版:小红书年轻人办... 小红书北京办公室的一隅被灌木环绕,营造出一片独特的天地。8月2日中国第六代导演贾樟柯来到了这里,用《...
8月深圳二手房市场开局现好势头 8月4日,深圳市房地产中介协会发布的数据显示,上周全市二手房(含自助)录得1184套,环比增长5.2...
海特高新回购进展:已斥资649... 海特高新于2025年4月22日召开第八届董事会第十五次会议,审议通过回购股份议案。公司计划使用自有或...
贵州茅台回购进展披露:已回购3... 贵州茅台于2025年8月5日发布关于回购股份实施进展的公告,详细披露了公司回购股份的相关情况。回购方...
特斯拉向马斯克授予数百万股股票...   特斯拉将向首席执行官埃隆・马斯克授予 9600 万股限制性股票,价值约 290 亿美元。而就在六...
IPO鹰眼预警 | 科马材料毛... Hehson财经上市公司研究院|财报鹰眼预警2025年8月4日,浙江科马摩擦材料股份有限公司(以下简...
农业农村部信息中心原副主任张国... 新华信用哈尔滨8月4日电(记者陆宇航 翟卓)在8月4日举行的内蒙古“草原优品”传播推介会上,农业农村...
锐评|他们,别想让我们忘记 转自:北京日报客户端《南京照相馆》热映,《山河为证》《731》定档……这个暑期,一系列抗战主题电影引...
渝昆高铁长水机场隧道今天贯通! 8月4日上午,经过1400天的连续奋战,渝昆高铁全线重难点控制性工程——长水机场隧道安全贯通,标志着...