功能教程#
本节提供 vLLM Ascend 不同功能的使用教程。
功能教程
- PD 共置与 Mooncake 多实例
- 预填充-解码解耦架构 (Qwen2.5-VL)
- 预填充-解码解耦部署 (Deepseek)
- 长序列上下文并行 (Qwen3-235B-A22B)
- Project-Id-Version: vllm-ascend Report-Msgid-Bugs-To: POT-Creation-Date: 2026-04-22 08:13+0000 PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE Last-Translator: FULL NAME EMAIL@ADDRESS Language: zh_CN Language-Team: zh_CN LL@li.org Plural-Forms: nplurals=1; plural=0; MIME-Version: 1.0 Content-Type: text/plain; charset=utf-8 Content-Transfer-Encoding: 8bit Generated-By: Babel 2.18.0
- 后缀推测解码
- Ray 分布式部署 (Qwen3-235B-A22B)