DeepSeek宣布开源MLA解码核FlashMLA,GitHubstar超1700



来源:新浪科技

6686体育线上登录

新浪科技讯 2月24日上午消息,在上周DeepSeek宣布本周将是开源周(OpenSourceWeek),并将连续开源五个软件库后。今日,DeepSeek宣布开源了开源周首款用于Hopper GPU的高效型MLA解码核——FlashMLA。

新浪科技注意到,在GitHub上,目前该项目已经收获了超过1700star,并且拥有62个Fork。

MLA是DeepSeek V2-V3系列大模型最为重要技术创新,主要用于减少推理过程的KV Cache,进而降低推理成本。据DeepSeek介绍,FlashMLA是Hopper GPUs的有效MLA解码内核,可针对可变长度序列进行优化,目前主要发布包括:1、 BF16;2、块大小为64 的分页kvcache。

在基准测试性能表现上,FlashMLA在英伟达H800 SXM5 GPU上可实现3000 GB/s 的内存速度以及580TFLOPS的计算上限。(文猛)

DeepSeek宣布开源MLA解码核FlashMLA,GitHubstar超1700

Beyond最经典励志的5首歌曲吉他谱,你学会了几首
Beyond最经典励志的5首歌曲吉他谱,你学会了几首

《真的爱你》真的爱你吉他谱 Beyond C调高清弹唱谱_音伴当年Beyond乐队刚成立时非常困难,大家连一件像样的乐器都买不起,更不用说举办演唱会了,黄家驹的父亲比较保守,一直希望家驹长大后能有一份稳定的工作,不希望他搞音乐,而家驹的母亲不一样,她一直以来都非常尊重儿子的想法,认为“兴趣是人生最...

G20会议谈完,美方出席规格变了,联俄制华幻想破灭,中俄肩并肩
G20会议谈完,美方出席规格变了,联俄制华幻想破灭,中俄肩并肩

G20会议上美国大佬们集体"失踪",美国务卿鲁比奥和财长双双缺席,改派"小字辈"参会,更令人瞠目的是,在利雅得,美俄两国代表却上演了"秘密会晤"大戏。这一系列戏剧性转折背后,究竟暗藏着怎样的玄机?"联俄制华"的如意算盘,怕是要打水漂了!最近这场G20峰会可谓是精彩纷呈,戏份十足,往届会议上,美国财...