云天励飞DeepEdge10实现DeepSeek来源项目FlashMLA适配,打造国产大模型算力新底座
来源:今日热点网 发布时间:2025-02-27 11:14:32

2月24日,DeepSeek"开源周"正式启动,并发布首个代码库FlashMLA,引发全球关注。

FlashMLA是针对英伟达Hopper GPU优化的高效MLA解码内核,专为可变长度序列优化设计,是DeepSeek高效使用算力的核心程序模块。FlashMLA通过MLA解码优化与分页KV缓存技术,显著提升硬件利用率,加速大语言模型解码过程,有效提高响应速度与吞吐量,适用于各种实时对话生成场景。

云天励飞芯片团队在FlashMLA开源后,迅速完成了DeepEdge10平台与FlashMLA的适配工作。在适配过程中,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先进技术,并基于自研的Triton-like编程语言快速开发验证了高效的FlashMLA算子。通过一系列优化,不仅显著提升了计算效率,还大幅降低了显存占用,充分展现了DeepEdge10平台“算力积木”芯片架构的卓越优势,以及其与DeepSeek生态的高度契合性。

今日,云天励飞已将相关代码提交至开源平台Gitee,为开源AI贡献了重要的技术力量。

算子的源码地址为:

https://gitee.com/Intellifusion_2025/tyllm/blob/master/python/tylang/flash_mla.py

DeepEdge10系列芯片是专门针对大模型时代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、机器人、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。

目前,DeepEdge10芯片平台已成功适配DeepSeek R1系列模型及国产鸿蒙操作系统。未来,云天励飞将持续加大研发力度,推动芯片在国产化领域取得更大突破,为国产AI生态建设贡献更多力量。


标签:

猜你喜欢

云天励飞DeepEdge10实现DeepSeek来源项目FlashMLA

2月24日,DeepSeek"开源周"正式启动,并发布首个代码库FlashMLA,引发 更多

2025-02-27 11:14:32

“协鑫集成?”2025芜湖马拉松暨“津盛农商行”中

一往芜前,飞向春天。2月26日上午10时30分,协鑫集成2025芜湖马拉松暨津盛农商行中国田径协会10公里...更多

2025-02-27 10:48:55

“数据电话安全强化行动”海南宜信普惠小额贷款有

"海南宜信普惠小额贷款有限公司“数据电话安全强化行动”是众多企业 更多

2025-02-27 10:26:35

高途发布2024年Q4财报,已累计回购超过人民币3.5

2025年2月26日,高途发布了2024财年第四季度及全年财报。第四季度公 更多

2025-02-27 09:51:47

春季过敏高发期,这几类人最危险!你中招了吗?

春暖花开,万物复苏,但对于过敏体质的人来说,春天却是一个“难熬 更多

2025-02-27 09:37:00

RWKV开发者大会2025:全球数万开发者探讨RWKV-7超

2025年2月22日,RWKV在上海漕河泾举办了主题为《RWKV-7与未来趋势》 更多

2025-02-27 09:29:32

爱奇艺《原罪》分账金额破3000万!创2024年短剧市

近日,爱奇艺短剧《原罪》的分账金额突破3000万元,创下2024年短剧行业分账金额新纪录。《原罪》以...更多

2025-02-26 20:53:42

活动 | 驭变而生:2025 福布斯中国新零售产业

新零售诞生于变化。彼时,移动互联网的普及和智能手机的广泛应用,彻底改变了消费者的购物习惯,线...更多

2025-02-26 20:14:21

壹刻钟桌面快充充电宝,开启快充新潮流

在移动互联网飞速发展的当下,智能手机已深度嵌入人们的生活,成为 更多

2025-02-26 19:54:21

自营家具全量补贴!京东家具开仓节万元焕新全屋智

当下,智能家居产品正日益成为现代家庭追求高品质生活的重要组成部分 更多

2025-02-26 19:26:44