功能指南# 本节提供了 vLLM Ascend 功能的详细使用指南。 功能指南 图模式 量化指南 睡眠模式 结构化输出 LoRA适配器 专家负载均衡 网络加载器 多Token预测(MTP) 动态批处理 Ascend Store部署 外部数据并行 大规模专家并行的DP分布式部署 UCM增强的前缀缓存部署 细粒度张量并行 层间线性层分片 推测解码 上下文并行