昇腾生态硬核赋能！上交大攻克超长上下文推理难题，性能大幅跃升

来源： | 2025-11-26 16:38:04

　　随着大语言模型在文本分析、智能问答等场景的广泛应用，处理1M超长文本推理时，常常面临显存不足、运算速度卡顿的行业痛点，严重限制了超长文本场景的应用。近日，上海交通大学李健教授团队依托上海交通大学鲲鹏昇腾科教创新卓越中心的算力支持，基于vLLM-Ascend 推理框架研发出一套针对超长上下文推理的稀疏注意力 KV Cache 分层缓存管理系统。在昇腾 AI 软硬件平台的全方位赋能下，该项目成功破解单卡支持超长上下文推理的显存与性能双重难题，同时大幅提升吞吐量。

　　项目核心创新在于设计了 KV Cache 分级缓存集成机制。该机制先对推理任务进行实时分析，智能识别Top-K 重要块并集中算力处理，从源头提升计算效率；同时采用数据冷热分层存储策略，根据数据访问频率，将生成数据动态划分为高频热数据与低频冷数据，再针对性优化存储位置，减少资源浪费。这一机制的落地依托昇腾CANN异构计算架构灵活的动态调度能力，能精准控制冷热数据在显存与主存间的流转，大幅降低数据迁移开销。最终，该方案实现单卡流畅处理超过1M的超长文本推理任务，系统推理吞吐量超过39%，彻底突破传统系统在长序列处理上的显存与性能瓶颈。

　　同时项目进行了元数据结构优化与缓存机制设计，其中数据索引与掩码是关键支撑 —— 通过精简索引结构、合并掩码维护步骤，有效减少重复运算，使昇腾NPU算力更集中于注意力计算与文本生成等核心任务，提升硬件利用效率。相关优化已通过vLLM-Ascend推理框架灵活集成，保障了技术方案的顺利落地。

　　目前，该项目源代码已在 Gitee 社区中开源，后续将进一步推送到昇腾开源生态，合入GitHub社区 vLLM-Ascend 项目专区。此次技术突破，不仅为超长文本推理提供了高效解决方案，更印证了昇腾生态在AI创新中的赋能价值。未来，随着该系统在更多行业场景的落地，昇腾将持续为AI技术研发提供算力与技术保障，推动大语言模型在长文本分析、智能办公、数字孪生等千行百业的深度应用，加速人工智能产业化进程。

每日精选

从制造根基到智能底座：华为乾崑携奕境如何打造中国家庭的出行信赖

　　2025年11月20日，广州华为乾崑生态大会，一个饱含用户心意的名字——【奕境】正式揭晓。这是东风汽车与华为乾崑联袂打造的全新品牌，亦

2025-11-26
2025空间计算大会倒计时！核心芯片 + 全栈方案亮点抢先看

　　如果说PC时代的操作系统是二维的屏幕桌面（Desktop），那么空间计算时代的操作系统，是整个三维物理世界本身。这一变革将重新定义人机

2025-11-25
2025空间计算产业大会前瞻：从“专用芯片”到“全栈方案”，构建智能世界技术底座

　　空间计算迎来历史性拐点，产业正加速突破。　　从 XR 的增长提速，到机器人、无人机、智能汽车对实时环境感知的迫切需求，再到大语言

2025-11-25
多款“星”品亮相2025中国无线电大会

　　当包豪斯设计哲思的光芒邂逅西伦敦伊灵区的生活，一场关于理想人居的美学叙事，在蒙特安维（Mount Anvil）匠心打造的维德苑（Verdean

2025-11-25
上海软件定制开发公司盘点：四家优秀企业深度解析

　　软件定制开发：企业数字化转型的核心引擎　　在数字经济高速发展的今天，企业数字化转型已成为生存发展的必选项。据《2025全球软件产业

2025-11-20
百奥精密空调亮相CDCE2025国际数据中心展，全生命周期方案受瞩目

　　近日， 2025国际数据中心及云计算展（CDCE）在上海新国际博览中心开幕，作为数据中心领域的标杆展会，本届展会汇聚了全球数百家行业先

2025-11-20
构建未来智能世界技术底座：2025空间计算大会将发布核心成果

　　当前，空间计算正成为全球科技产业竞争的核心方向。作为连接数字世界与真实物理空间的关键技术，它正在推动 XR 终端、机器人、AI 数

2025-11-19
Brother PT-P900标签打印机，让日常收纳焕然一新

　　在忙碌的现代生活中，我们常常面临这样的困扰：厨房里形状相似的调料瓶让人无从下手，储物间里塞满的盒子找不到想要的那一个，办公桌上

2025-11-19
“A.网址”引爆数字资产市场！单字母中文域名的价值密码

　　在互联网流量红利逐渐消退的今天，优质域名作为稀缺数字资源的价值愈发凸显。单字母中文域名A 网址凭借极简符号、高辨识度与强适配性的

2025-11-19

昇腾生态硬核赋能！上交大攻克超长上下文推理难题，性能大幅跃升

相关阅读

每日精选

从制造根基到智能底座：华为乾崑携奕境如何打造中国家庭的出行信赖

2025空间计算大会倒计时！核心芯片 + 全栈方案亮点抢先看

2025空间计算产业大会前瞻：从“专用芯片”到“全栈方案”，构建智能世界技术底座

多款“星”品亮相2025中国无线电大会

上海软件定制开发公司盘点：四家优秀企业深度解析

百奥精密空调亮相CDCE2025国际数据中心展，全生命周期方案受瞩目

构建未来智能世界技术底座：2025空间计算大会将发布核心成果

Brother PT-P900标签打印机，让日常收纳焕然一新

“A.网址”引爆数字资产市场！单字母中文域名的价值密码

24小时排行

一周排行

榜单