教程#
部署
- 单个NPU(Qwen3 8B)
- 单个NPU(Qwen2.5-VL 7B)
- 单个 NPU(Qwen2-Audio 7B)
- 单个NPU(Qwen3-Embedding-8B)
- 单 NPU(Qwen3 8B W4A8)
- Prefill-Decode 解耦 Llmdatadist 验证(Qwen2.5-VL)
- 多 NPU(Qwen3-Next)
- 多-NPU(QwQ 32B)
- 多NPU(Pangu Pro MoE)
- 多NPU(Qwen3-30B-A3B)
- 多NPU(QwQ 32B W8A8)
- 单节点(Atlas 300I 系列)
- 多节点(DeepSeek V3.2)
- 多节点分布式处理(DeepSeek)
- 多节点数据并行(Kimi-K2)
- 多节点数据并行(Qwen3-VL-235B-A22B)
- 预填充-解码分离架构的 Llmdatadist 验证(Qwen)
- 预填充-解码分离架构的 Mooncake 验证(Qwen)
- 多节点 Ray(Qwen / Qwen3-235B-A22B)