特性指南# 本节提供了 vLLM Ascend 功能的详细使用指南。 特性指南 图模式指南 CPU 绑定 量化指南 睡眠模式指南 结构化输出指南 LoRA 适配器指南 专家负载均衡 (EPLB) Netloader 指南 RFork 指南 多令牌预测 (MTP) 动态批处理 解耦编码器 Ascend Store 部署指南 外部数据并行 分布式数据并行服务器与大规模专家并行 UCM增强前缀缓存部署指南 细粒度张量并行 (Fine-grained TP) 层分片线性算子指南 推测解码指南 上下文并行指南 Npugraph_ex 权重预取指南 序列并行 批次不变性 LMCache-Ascend 部署指南