Skip to main content
Back to top
Ctrl
+
K
You are viewing the latest official docs.
快速开始
快速入门
安装
教程
单个NPU(Qwen3 8B)
单个NPU(Qwen2.5-VL 7B)
多-NPU(QwQ 32B)
多NPU(Qwen3-30B-A3B)
多NPU(QwQ 32B W8A8)
多节点分布式处理(DeepSeek)
FAQs
用户指南
特性与模型
模型支持
功能支持
配置指南
环境变量
附加配置
功能指南
图模式指南
量化指南
睡眠模式指南
结构化输出指南
LoRA 适配器指南
Distributed DP Server With Large Scale Expert Parallelism
版本说明
开发者指南
贡献
测试
功能指南
在 vLLM Ascend 中的补丁
准确性
使用 EvalScope
使用 lm-eval
使用 OpenCompass
准确性报告
性能
性能基准
配置执行持续时间
优化与调优
Distributed DP Server With Large EP (DeepSeek)
社区
治理
维护者和贡献者
版本管理策略
用户故事
LLaMA-Factory
Repository
Suggest edit
.md
.pdf
准确性
准确性
#
准确性
使用 EvalScope
使用 lm-eval
使用 OpenCompass
准确性报告