LLaMA-Factory#
简介
LLaMA-Factory 是一个易于使用且高效的大语言模型训练与微调平台。通过 LLaMA-Factory,您可以在本地对数百个预训练模型进行微调,无需编写任何代码。
LLaMA-Factory 用户在模型微调后,需要对其进行评估和推理。
面临的问题
LLaMA-Factory 最初使用 Transformers 在昇腾 NPU 上进行推理,但推理速度较慢。
使用 vLLM Ascend 的优势
通过 LLaMA-Factory 与 vLLM Ascend 的共同努力(LLaMA-Factory#7739),LLaMA-Factory 在模型推理阶段取得了显著的性能提升。基准测试结果表明,其推理速度相比原有的 Transformers 实现提升高达 2 倍
了解更多
For more details about LLaMA-Factory, please refer to the official documentation.