跳转至主要内容
回到顶部
Ctrl
+
K
搜索
Ctrl
+
K
开始使用
快速使用
使用文档
自定义指南
常见 Q&A
Dense
8xH100 训练 Qwen3-4B
MoE
8xH100 训练 Qwen3-30B-A3B
256xH100 训练 GLM-5.2 744B-A40B
64xH100 训练 GLM-4.7
128xH100 训练 DeepSeek R1
高级特性
投机采样
可复现性
容灾
观测
PD 分离
External Rollout Engines 配置路线图
Delta 权重同步
vLLM Config:高级引擎部署
Megatron Config:按角色覆盖训练参数
在 Megatron-LM 中快速支持新模型架构
其他用法
Fully-Async Rollout Example
Multi-Agent RL
开发指南
CI(持续集成)
Debug 指南
Trace 可视化
性能分析(Profiling)
Repository
Open issue
搜索
错误
请启用 JavaScript 以启用搜索功能。
Ctrl
+
K