LLaMA-Factory

LLaMA-Factory#

关于 / 介绍

LLaMA-Factory 是一个易于使用且高效的平台,用于训练和微调大型语言模型。有了 LLaMA-Factory,你可以在本地对数百个预训练模型进行微调,无需编写任何代码。

LLaMA-Facotory 用户需要在对模型进行微调后对模型进行评估和推理。

业务挑战

LLaMA-Factory 使用 transformers 在 Ascend NPU 上进行推理,但速度较慢。

通过 vLLM Ascend 解决挑战与收益

在 LLaMA-Factory 和 vLLM Ascend 的共同努力下(参见 LLaMA-Factory#7739),LLaMA-Factory 在模型推理阶段的性能得到了显著提升。根据测试结果,LLaMA-Factory 的推理速度相比 transformers 版本提升到了 2 倍。

了解更多

在以下文档中查看更多关于 LLaMA-Factory 以及其如何在 Ascend NPU 上使用 vLLM Ascend 进行推理的信息:LLaMA-Factory Ascend NPU 推理