LLaMA-Factory

LLaMA-Factory#

简介

LLaMA-Factory 是一个易于使用且高效的平台，用于训练和微调大型语言模型。通过 LLaMA-Factory，您可以在本地对数百个预训练模型进行微调，无需编写任何代码。

LLaMA-Factory 用户在完成微调后，需要对模型进行评估和推理。

业务挑战

LLaMA-Factory 使用 Transformers 在昇腾 NPU 上进行推理，但速度较慢。

vLLM Ascend 带来的优势

通过 LLaMA-Factory 与 vLLM Ascend 的共同努力（LLaMA-Factory#7739），LLaMA-Factory 在模型推理阶段实现了显著的性能提升。基准测试结果表明，其推理速度相比 Transformers 实现最高提升了 2 倍。

了解更多

有关 LLaMA-Factory 的更多详情，请参阅官方文档。