Index

Symbols | A | C | G | L | M | S | V

Symbols

--block-size
- command line option
--disable-log-stats
- command line option
--download-dir
- command line option
--dtype
- command line option
--enable-prefix-caching
- command line option
--gpu-memory-utilization
- command line option
--load-format
- command line option
--max-model-len
- command line option
--max-num-batched-tokens
- command line option
--max-num-seqs
- command line option
--max-paddings
- command line option
--max-parallel-loading-workers
- command line option

--model
- command line option
--pipeline-parallel-size
- command line option
--quantization
- command line option
--revision
- command line option
--seed
- command line option
--swap-space
- command line option
--tensor-parallel-size
- command line option
--tokenizer
- command line option
--tokenizer-mode
- command line option
--tokenizer-revision
- command line option
--trust-remote-code
- command line option
--worker-use-ray
- command line option

A

C

G

generate() (vllm.engine.async_llm_engine.AsyncLLMEngine method)

L

LLMEngine (class in vllm.engine.llm_engine)

M

module
- vllm.engine
- vllm.sampling_params.SamplingParams

S

step() (vllm.engine.llm_engine.LLMEngine method)

V

vllm.engine
- module

vllm.sampling_params.SamplingParams
- module