用户案例

用户案例#

阅读案例研究,了解用户和开发者如何使用 vLLM Ascend 解决实际日常问题。

  • LLaMA-Factory 是一个易于使用且高效的大语言模型训练与微调平台。自 LLaMA-Factory#7739 起支持 vLLM Ascend 以加速推理,推理性能提升达 2 倍。

  • Huggingface/trl 是一个前沿库,专为使用 SFT、PPO 和 DPO 等先进技术对基础模型进行后训练而设计。自 v0.17.0 版本起集成 vLLM Ascend,以支持在昇腾 NPU 上进行 RLHF。

  • MindIE Turbo 是华为基于昇腾硬件开发的 LLM 推理引擎加速插件库,包含自研的大语言模型优化算法以及与推理引擎框架相关的优化。自 2.0rc1 版本起支持 vLLM Ascend。

  • GPUStack 是一个用于运行 AI 模型的开源 GPU 集群管理器。自 v0.6.2 版本起支持 vLLM Ascend。更多 GPUStack 性能评测信息,请参阅此链接

  • verl is a flexible, efficient, and production-ready RL training library for LLMs. It uses vLLM Ascend since v0.4.0. See more information on Ascend Quickstart.

更多详情