用户故事

用户故事#

阅读案例研究，了解用户和开发者如何使用 vLLM Ascend 解决实际日常问题。

LLaMA-Factory 是一个易于使用且高效的大语言模型训练与微调平台，自 LLaMA-Factory#7739 起支持 vLLM Ascend 加速推理，推理性能提升 2 倍。
Huggingface/trl 是一个前沿的库，专为使用 SFT、PPO 和 DPO 等先进技术对基础模型进行后训练而设计。从 v0.17.0 版本开始，该库利用 vLLM Ascend 来支持在 Ascend NPU 上进行 RLHF。
MindIE Turbo 是华为在昇腾硬件上开发的一款用于加速LLM推理引擎的插件库，包含自主研发的大语言模型优化算法及与推理引擎框架相关的优化。从 2.0rc1 起，支持 vLLM Ascend。
GPUStack 是一个开源的 GPU 集群管理器，用于运行 AI 模型。从 v0.6.2 版本开始支持 vLLM Ascend，更多 GPUStack 性能评测信息见链接。
verl 是一个灵活、高效且可用于生产环境的大型语言模型（LLM）强化学习训练库，自 v0.4.0 起支持 vLLM Ascend，更多信息请参见 verl x Ascend 快速上手。

更多细节