昇腾赋能 TransMLA：无需重训突破架构壁垒，助力主流大模型高效适配 MLA

来源： | 2026-01-13 14:32:39

　　MLA（Multi-head Latent Attention多头潜在注意力架构）凭借低秩压缩KV缓存设计，实现长上下文推理的显存与带宽双重优化，其有效性已在 DeepSeek-V2 等模型中得到了验证。但主流预训练模型如LLaMA、Qwen千问等多基于GQA构建，企业已投入大量工程优化，复用MLA需重训，成本极高。为此，在北京大学鲲鹏昇腾科教创新卓越中心的算力支持下，北京大学人工智能研究院助理教授张牧涵团队提出TransMLA转化框架，实现了无需重训便可将主流模型向MLA迁移。

　　TransMLA针对GQA向MLA迁移的核心痛点，实现四大技术模块的精准破局：一是GQA→MLA结构映射，破解分组KV头与MLA单头潜在表示不兼容问题，通过特定的线性变换，将GQA分组后的K、V向量投影/融合为单一的低秩潜在表示，并配备上投影矩阵保障KV信息精准恢复，筑牢迁移基础；二是提出RoRoPE技术方案，通过创新适配让位置编码顺畅融入低秩压缩流程，解决了直接对RoPE应用PCA等通用降维方法可能导致的位置信息损失或模型性能下降问题；三是通过将RoPE中相邻频率的旋转维度进行折叠（Folding）与融合，在降低参数量的同时，更高效地集中和保留关键的位置信息，从而维持模型在长序列下的语义理解能力；四是通过均衡Key和Value矩阵在压缩前的范数分布，提升联合压缩（如PCA）的数值稳定性，减少信息损失。

　　在技术落地过程中，昇腾发挥了关键支撑作用。其高效并行计算架构满足结构映射模块的多任务协同处理需求，保障了架构迁移效率；其优化的存储与缓存体系，为 FreqFold 的频率信息处理、BKV-PCA 的范数均衡提供稳定硬件基础，有效提升 KV 压缩的稳定性与资源利用效率，助力 TransMLA 核心技术平稳落地。

　　经过实验显示TransMLA的转换过程性能优势明显，裁剪LLaMA-2-7B模型68.75%的KV缓存后无需训练，核心性能仅轻微损失，在32K序列长度、FP16精度下，基于昇腾平台的推理速度较之于业界主流GPU平台有显著提升。依托开放的生态资源，昇腾已推动TransMLA稳定支持主流模型部署并将集成至vLLM/SGLang等高性能推理框架生态，便于用户部署，大幅降低企业落地适配成本。

　　TransMLA与昇腾的协同创新，打通了主流模型与MLA架构鸿沟，充分发挥昇腾生态优势。昇腾全链路支持实现TransMLA“零重训、低损失”目标，保留模型参数优势，降低企业基于昇腾的升级门槛。这一软硬件协同典范，为长上下文推理提供昇腾生态解决方案，推动自主计算与前沿AI融合，彰显昇腾核心引领作用，为大模型产业依托自主硬件降本增效提供可行路径。

每日精选

从校园电竞到掠夺者亚太赛场，DODO守护打瓦女孩完成国际征途

　　1月5日至1月11日，掠夺者亚太电竞大赛2026总决赛于印度德里举办，来自亚太区的顶尖战队齐聚一堂争夺《无畏契约》和《DOTA 2》的总冠军

2026-01-12
巅峰对决松山湖！鲲鹏昇腾创新大赛全国总决赛2025圆满落幕

　　2025年12月29日，鲲鹏昇腾创新大赛全国总决赛2025在广东松山湖三丫坡落下帷幕。作为自主创新计算与AI领域的顶级赛事，本次总决赛汇聚了

2026-01-04
极光月狐数据发布《混沌：新篇伊始——月狐数据2025年度报告》

　　2025年，注定是不平凡的一年。作为十四五规划的收官之年、十五五规划的奠基之年，这一年承载着承前启后、继往开来的重大历史使命。当前

2025-12-31
索尼直营店苏州万象天地店盛大启幕以现代科技译写姑苏千年风雅

　　秉承植根中国、长远发展的企业理念，索尼（中国）有限公司宣布，中国大陆地区第10家索尼直营店——索尼直营店苏州万象天地店于12月29日

2025-12-31
2025粤港澳大湾区AI领袖峰会在深召开，创通新科集团担任智算终端委员会主席

　　2025年12月26日，以人机协同·全面出海为主题的2025粤港澳大湾区AI领袖峰会暨第二届会员大会第四次会议在深圳成功举办。大会汇聚人工智

2025-12-30
AI平台只求快=白烧钱选至强做机头“稳”住超大集群

　　过去做企业级IT，如今搞企业级AI，都有点像跑船打渔，船越大就越不能只图快，更得求稳，否则船一翻，载得渔获越多损失就越重。确实是风

2025-12-29
AI平台只求快=白烧钱选至强做机头“稳”住超大集群

　　过去做企业级IT，如今搞企业级AI，都有点像跑船打渔，船越大就越不能只图快，更得求稳，否则船一翻，载得渔获越多损失就越重。确实是风

2025-12-29
萤石网络通过数据安全能力成熟度模型（DSMM）三级认证

　　近日，科创板智能家居上市公司萤石网络正式通过数据安全能力成熟度模型（DSMM）三级认证，标志着其在数据全生命周期安全管理领域的能力

2025-12-29

昇腾赋能 TransMLA：无需重训突破架构壁垒，助力主流大模型高效适配 MLA

相关阅读

每日精选

从校园电竞到掠夺者亚太赛场，DODO守护打瓦女孩完成国际征途

巅峰对决松山湖！鲲鹏昇腾创新大赛全国总决赛2025圆满落幕

极光月狐数据发布《混沌：新篇伊始——月狐数据2025年度报告》

索尼直营店苏州万象天地店盛大启幕以现代科技译写姑苏千年风雅

2025粤港澳大湾区AI领袖峰会在深召开，创通新科集团担任智算终端委员会主席

AI平台只求快=白烧钱选至强做机头“稳”住超大集群

AI平台只求快=白烧钱选至强做机头“稳”住超大集群

萤石网络通过数据安全能力成熟度模型（DSMM）三级认证

24小时排行

一周排行

榜单