刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
创始人
2025-02-24 11:06:00
0

机器之心报道

机器之心编辑部

上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。

第一个项目,果然与推理加速有关。

北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。

该项目上线才 45 分钟就已经收获了超过 400 star!并且在我们截图时,Star 数量正在疯狂飙升。

项目地址:https://github.com/deepseek-ai/FlashMLA

众所周知,MLA是DeepSeek大模型的重要技术创新点,主要就是减少推理过程的KV Cache,从而实现在更少的设备上推理更长的Context,极大地降低推理成本。

此次 DeepSeek 直接开源了该核心技术的改进版本,可以说是诚意满满。

接下来,就让我看下这个开源项目的核心内容。

据介绍,FlashMLA 是适用于 Hopper GPU 的高效 MLA 解码内核,针对可变长度序列服务进行了优化。

目前已发布的内容有:

其速度非常快,在 H800 SXM5 GPU 上具有 3000 GB/s 的内存速度上限以及 580 TFLOPS 的计算上限。

在部署这个项目之前,你需要的有:

快速启动

python setup.py install

python tests/test_flash_mla.py

使用 CUDA 12.6,在 H800 SXM5 上,在内存绑定配置下实现高达 3000 GB/s,在计算绑定配置下实现 580 TFLOPS。

from flash_mla import get_mla_metadata, flash_mla_with_kvcache

tile_scheduler_metadata, num_splits = get_mla_metadata (cache_seqlens, s_q * h_q //h_kv, h_kv)

for i in range (num_layers):

o_i, lse_i = flash_mla_with_kvcache (

q_i, kvcache_i, block_table, cache_seqlens, dv,

tile_scheduler_metadata, num_splits, causal=True,

该项目发布后也是好评如潮。

甚至有网友打趣地表示:「听说第五天会是 AGI」。

最后,还是那句话:这才是真正的 OpenAI

相关内容

热门资讯

中央财办:探索具有地域特色的乡... 转自:央视网央视网消息:2月24日,国新办就进一步深化农村改革,扎实推进乡村全面振兴有关情况举行发布...
中金上调奇富科技目标价至60美...   近期,中金公司发布报告,对信贷科技行业进行深度剖析,并上调奇富科技目标价至60美元,给予“跑赢行...
山东浙江首现负电价意味着什么 来源:@时间财经微博 【#山东浙江首现负电价意味着什么#】#山东之后浙江首现负电价# 在山东史...
中国独臂船长99天绕地球成功,... 来源:@华夏时报微博本报记者 王晓慧 北京报道法国时间2月18日上午8时08分,36岁的中国航海家、...
中央一号文件释放了哪些新信号?... 转自:杭州网央视新闻讯 昨日,2025年中央一号文件正式发布,它与我国数以亿计农村人口的日常生产生活...
欧菲光:公司产品布局深远且矩阵... 证券日报网讯欧菲光2月24日在互动平台回答投资者提问时表示,智能驾驶系统方面,公司全面布局车载摄像头...
价格大跳水!还要降!很多人爱吃 “水果皇后”蓝莓,价格逐渐变得亲民。近日,记者了解到在杭州萧山多家水果店和商超,与刚上市动辄百元多一...
把推动各民族为全面建设社会主义... 转自:国家民委民族工作是党的统一战线工作的重要组成部分。不久前出版的《习近平总书记关于做好新时代党的...
杨浦这个“最暖城区”,暖意“面... 转自:上观新闻优化营商环境的重要性,再怎么强调也不为过。杨浦区优化营商环境8.0版改革方案提出,优化...
中央财办:建设宜居宜业和美乡村... 乡村建设要尽力而为、量力而行,统筹考虑地方财力、农民需要和接受程度,重点突出一个“实”字,看看老百姓...
河南省安阳市安阳县总工会为环卫... 来源:中工网 2月22日,2025年安阳县小微民生实事——环卫工人免费爱心早餐券发放仪式举行。活动现...
新加坡AI初创公司AI Ass... AI Assets在新加坡提供一款支持人工智能的投资助理应用程序,该公司上周五向美国证券交易委员会提...
十一载交融共进 京津冀协同焕新 京津冀协同发展是习近平总书记亲自谋划、亲自部署、亲自推动的重大国家战略。2014年以来,京津冀三地深...
赢得德国大选的默茨,是谁? 1米98的身高、说话直言不讳、喜欢穿西装和戴眼镜、习惯性弯腰与他人对话,德国基督教民主联盟(联盟党)...
微电生理:2024年年度净利润... 每经AI快讯,微电生理(SH 688351,收盘价:19.43元)2月24日晚间发布2024年年度业...
坚持长期主义 才能做大做强做优 转自:中国经营报    2022年11月,凌雄科技正式在香港联交所主板上市,成为中国DaaS行业第一...
成大生物控制权恐生变 转自:中国经营报    本报记者陈婷曹学平深圳报道    来自控股股东董事会的一次改选,人用狂犬病疫...
宁德时代赴港上市有何玄机? 转自:中国经营报    本报记者陈靖斌广州报道    2月11日,宁德时代(300750.SZ)正式...
资产规模近8万亿 中央汇金金融... 转自:中国经营报    相关报道    本报记者罗辑北京报道    近日,多家金融机构公告股权划转事...
利欧股份:公司与深度求索(De... 证券日报网讯利欧股份2月24日在互动平台回答投资者提问时表示,截至目前,公司与深度求索(DeepSe...