分享好友 最新资讯首页 最新资讯分类 切换频道
DeepSeek“开源周”Day1:让英伟达H800性能翻两倍
2025-03-06 08:41

作者沐风

来源AI先锋官


2月24日,的“开源周”,开源了他们第一天的项目FlashMLA。


图片


开源地址:https://github.com/deepseek-ai/FlashMLA

在DeepSeek整个技术路线中,MLA(多头潜在注意力机制)是DeepSeek已经发布的V2、V3两款模型中,最为核心的技术之一。

其可以显著减少大模型训练和推理过程中的内存占用。

此前,中国工程院院士、清华大学计算机系教授郑纬民曾提及:“DeepSeek自研的MLA架构为其自身的模型训练成本下降,起到了关键作用。”

他指出,“MLA通过改造注意力算子压缩了KV Cache大小,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模型中FFN 层的改造相配合,实现了一个非常大的稀疏MoE 层,成为DeepSeek训练成本低最关键的原因。”

而FlashMLA则是针对Hopper GPU开发的高效MLA解码内核,专为处理可变长度序列而设计,目前已投入了生产。

Hopper GPU是指基于英伟达Hopper架构研发的H系列GPU产品。

目前,英伟达该系列芯片已经发布H100、H800和H20等多款芯片。

据DeepSeek方面介绍,在基准测试性能表现上,FlashMLA可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

图片


可以说,DeepSeek真的把自己最牛*的东西开源出来了。

公开资料显示,根据美国出口管制规定,H800的带宽上限被设定为600 GB/s,相比一些旗舰产品有所降低。

这意味着,使用FlashMLA优化后,H800的内存带宽利用率有望进一步提高甚至突破H800 GPU理论上限,在内存访问上达到极致,能让开发群体充分“压榨”英伟达H系列芯片能力,以更少的芯片实现更强的模型性能,最大化GPU价值。

对于整个AI生态来说,这是一件天大的好事。

妥妥的GPU性能红利。

虽然FlashMLA是一个针对Hopper GPU的优化代码库,但对于国产GPU而言,此次开源也有利好。

对于国产GPU而言,现在可以通过FlashMLA提供的优化思路和方法论,尝试让国产卡大幅提升性能,即使架构不同,后面国产卡的推理性能提升将是顺理成章的事儿。

结合此前DeepSeek发布的论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。

如果将FlashMLA视为针对推理解码做的“终极性能提升”,那么Native Sparse Attention就是对训练和推理做更全面的“稀疏化改革”。

两者结合到一起,DeepSeek的意思就很明显,“无论训练还是推理,我都要把硬件榨干。”

目前,FlashMLA在Github上已经达到了5.9kStar。

最新文章
手机如何进行通话录音手机如何录音「手机如何进行通话录音」
手机通话录音是一项非常实用的功能,可以帮助我们记录重要的电话内容,或者作为证据保存。下面介绍几种手机通话录音的方法。1.使
Qt Group:AI赋能的HMI敏捷开发——Qt框架如何重构舱驾融合新范式
2025年3月19日,在第五届中国汽车人机交互与体验设计创新大会上,Qt Group中国商务拓展经理高森介绍了Qt框架在汽车行业的广泛应
追忆演员童正维:编辑部牛大姐、雅各布姥姥等角色成一代经典
据著名摄影师马良4月15日晚发布的讣告,其母亲、老艺术家童正维因心脏衰竭医治无效,于4月14日22时52分,在家人的陪伴下安然离世
手机电脑互传 V1.0.4手机互传「手机电脑互传 V1.0.4」
没有加固或未知加固CHANGE_WIFI_STATE改变WiFi状态INTERNET访问网络连接,可能产生GPRS流量ACCESS_WIFI_STATE获取当前WiFi接入的
“携宠游”的风吹到了常州!茅山森林世界宠物踏青季火热进行中
春意渐浓,宠物的撒欢之旅也超萌登场!近日,一场专属于“毛孩子”的春日派对——由茅山森林世界主办的“宠物春日友好会”,在众
明明应该领便当,却被作者强行复活,你知道他们都是谁吗?
在动漫火影忍者中,有很多忍者拥有他们非常鲜明的人物特点,但是也有一部分忍者,他们本来早就应该死亡了,但是因为一些特殊原因
Weinre 远程调试移动端手机web页面天翼云手机端「Weinre 远程调试移动端手机web页面」
Weinre 是一款远程调试工具,使用JS编写, 可以让我们在电脑上直接调试运行在手机上的远程页面,当你的代码已经发布上线,这时候
如果iPhone掉进水里了,把手机插入大米中有用吗大米手机「如果iPhone掉进水里了,把手机插入大米中有用吗」
当iphone掉入水中时,很多人会选择将手机插入大米中,希望这样能够拯救手机。然而,这种做法是否真的有效呢?首先,让我们来看看
拍照党怎么选手机?OPPO、华为、三星出手了,哪家好你说了算!手机党「拍照党怎么选手机?OPPO、华为、三星出手了,哪家好你说了算!」
近几年的国产技术可以说是遍地开花,从影像、续航到处理器都很有看点,其中,影像更是成为各大手机厂商的必争之地,像OPPO和华为