vllm_omni.diffusion.sched.interface ¶

CachedRequestData `dataclass` ¶

Cached diffusion requests that only need their request ids resent.

request_ids `instance-attribute` ¶

request_ids: list[str]

make_empty `classmethod` ¶

make_empty() -> CachedRequestData

DiffusionRequestState `dataclass` ¶

Scheduler-owned state for one queued OmniDiffusionRequest.

error `class-attribute` `instance-attribute` ¶

error: str | None = None

req `instance-attribute` ¶

req: OmniDiffusionRequest

request_id `instance-attribute` ¶

request_id: str

sampling_params_key `class-attribute` `instance-attribute` ¶

sampling_params_key: (
    SamplingParamsKey | RequestBatchSamplingParamsKey | None
) = None

status `class-attribute` `instance-attribute` ¶

status: DiffusionRequestStatus = (
    DiffusionRequestStatus.WAITING
)

is_finished ¶

is_finished() -> bool

DiffusionRequestStatus ¶

Bases: IntEnum

Request status tracked by diffusion scheduler.

FINISHED_ABORTED `class-attribute` `instance-attribute` ¶

FINISHED_ABORTED = enum.auto()

FINISHED_COMPLETED `class-attribute` `instance-attribute` ¶

FINISHED_COMPLETED = enum.auto()

FINISHED_ERROR `class-attribute` `instance-attribute` ¶

FINISHED_ERROR = enum.auto()

PREEMPTED `class-attribute` `instance-attribute` ¶

PREEMPTED = enum.auto()

RUNNING `class-attribute` `instance-attribute` ¶

RUNNING = enum.auto()

WAITING `class-attribute` `instance-attribute` ¶

WAITING = enum.auto()

is_finished `staticmethod` ¶

is_finished(status: DiffusionRequestStatus) -> bool

DiffusionSchedulerOutput `dataclass` ¶

Output of a single scheduling cycle.

finished_req_ids `instance-attribute` ¶

finished_req_ids: set[str]

is_empty `property` ¶

is_empty: bool

kv_prefetch_jobs `class-attribute` `instance-attribute` ¶

kv_prefetch_jobs: dict | None = None

num_running_reqs `instance-attribute` ¶

num_running_reqs: int

num_scheduled_reqs `property` ¶

num_scheduled_reqs: int

num_waiting_reqs `instance-attribute` ¶

num_waiting_reqs: int

scheduled_cached_reqs `instance-attribute` ¶

scheduled_cached_reqs: CachedRequestData

scheduled_new_reqs `instance-attribute` ¶

scheduled_new_reqs: list[NewRequestData]

scheduled_request_ids `cached` `property` ¶

scheduled_request_ids: list[str]

All scheduled request ids in this cycle, including both new and cached ones.

step_id `instance-attribute` ¶

step_id: int

NewRequestData `dataclass` ¶

Payload for a newly scheduled diffusion request.

Carries the already-initialized request object so executors and workers do not re-run OmniDiffusionRequest.__post_init__ and mutate sentinel-based fields like guidance_scale_provided.

req `instance-attribute` ¶

req: OmniDiffusionRequest

request_id `instance-attribute` ¶

request_id: str

from_state `classmethod` ¶

from_state(state: DiffusionRequestState) -> NewRequestData

RequestBatchSamplingParamsKey `dataclass` ¶

Request level Batch-compatibility key derived from OmniDiffusionSamplingParams.

Only request-batch-wide fields belong here. Request-local values such as seeds, generators, latent tensors, timesteps, and pipeline-specific extra_args are read per request from DiffusionRequestBatch.sampling_params_list.

boundary_ratio `class-attribute` `instance-attribute` ¶

boundary_ratio: object = None

cfg_normalize `class-attribute` `instance-attribute` ¶

cfg_normalize: bool = False

decode_noise_scale `class-attribute` `instance-attribute` ¶

decode_noise_scale: object = None

decode_timestep `class-attribute` `instance-attribute` ¶

decode_timestep: object = None

do_classifier_free_guidance `class-attribute` `instance-attribute` ¶

do_classifier_free_guidance: bool = False

eta `class-attribute` `instance-attribute` ¶

eta: float = 0.0

fps `class-attribute` `instance-attribute` ¶

fps: object = None

frame_rate `class-attribute` `instance-attribute` ¶

frame_rate: object = None

guidance_rescale `class-attribute` `instance-attribute` ¶

guidance_rescale: float = 0.0

guidance_scale `class-attribute` `instance-attribute` ¶

guidance_scale: float = 0.0

guidance_scale_2 `class-attribute` `instance-attribute` ¶

guidance_scale_2: object = None

guidance_scale_provided `class-attribute` `instance-attribute` ¶

guidance_scale_provided: bool = False

height `class-attribute` `instance-attribute` ¶

height: object = None

layers `class-attribute` `instance-attribute` ¶

layers: int = 4

lora_int_id `class-attribute` `instance-attribute` ¶

lora_int_id: int | None = None

lora_scale `class-attribute` `instance-attribute` ¶

lora_scale: float = 1.0

max_sequence_length `class-attribute` `instance-attribute` ¶

max_sequence_length: object = None

num_frames `class-attribute` `instance-attribute` ¶

num_frames: int = 1

num_inference_steps `class-attribute` `instance-attribute` ¶

num_inference_steps: object = None

num_outputs_per_prompt `class-attribute` `instance-attribute` ¶

num_outputs_per_prompt: int = 1

output_type `class-attribute` `instance-attribute` ¶

output_type: object = None

resolution `class-attribute` `instance-attribute` ¶

resolution: object = 640

sigmas `class-attribute` `instance-attribute` ¶

sigmas: object = None

strength `class-attribute` `instance-attribute` ¶

strength: object = None

true_cfg_scale `class-attribute` `instance-attribute` ¶

true_cfg_scale: object = None

use_en_prompt `class-attribute` `instance-attribute` ¶

use_en_prompt: bool = False

width `class-attribute` `instance-attribute` ¶

width: object = None

SamplingParamsKey `dataclass` ¶

Denoise step level Batch-compatibility key derived from OmniDiffusionSamplingParams.

Only requests with the same key can be batched together. Fields not included here are treated as request-local and do not participate in the current homogeneous batching policy.

boundary_ratio `class-attribute` `instance-attribute` ¶

boundary_ratio: float | None = None

cfg_normalize `class-attribute` `instance-attribute` ¶

cfg_normalize: bool = False

do_classifier_free_guidance `class-attribute` `instance-attribute` ¶

do_classifier_free_guidance: bool = False

fps `class-attribute` `instance-attribute` ¶

fps: int | None = None

frame_rate `class-attribute` `instance-attribute` ¶

frame_rate: float | None = None

guidance_rescale `class-attribute` `instance-attribute` ¶

guidance_rescale: float = 0.0

guidance_scale `class-attribute` `instance-attribute` ¶

guidance_scale: float = 0.0

guidance_scale_2 `class-attribute` `instance-attribute` ¶

guidance_scale_2: float | None = None

guidance_scale_provided `class-attribute` `instance-attribute` ¶

guidance_scale_provided: bool = False

height `class-attribute` `instance-attribute` ¶

height: int | None = None

lora_int_id `class-attribute` `instance-attribute` ¶

lora_int_id: int | None = None

lora_scale `class-attribute` `instance-attribute` ¶

lora_scale: float = 1.0

num_frames `class-attribute` `instance-attribute` ¶

num_frames: int = 1

num_outputs_per_prompt `class-attribute` `instance-attribute` ¶

num_outputs_per_prompt: int = 1

resolution `class-attribute` `instance-attribute` ¶

resolution: int | str | None = None

true_cfg_scale `class-attribute` `instance-attribute` ¶

true_cfg_scale: float | None = None

width `class-attribute` `instance-attribute` ¶

width: int | None = None

SchedulerInterface ¶

Bases: ABC

Abstract lifecycle contract for diffusion schedulers.

add_request `abstractmethod` ¶

add_request(request: OmniDiffusionRequest) -> str

Add a request and return the scheduler-owned request id.

close `abstractmethod` ¶

close() -> None

Release scheduler-owned state.

finish_requests `abstractmethod` ¶

finish_requests(
    request_ids: str | list[str],
    status: DiffusionRequestStatus,
) -> None

Mark one or more requests finished.

get_request_state `abstractmethod` ¶

get_request_state(
    request_id: str,
) -> DiffusionRequestState | None

Return request state if present.

has_requests `abstractmethod` ¶

has_requests() -> bool

Return whether the scheduler still owns runnable requests.

initialize `abstractmethod` ¶

initialize(od_config: OmniDiffusionConfig) -> None

Initialize or reset scheduler state.

num_running_requests `abstractmethod` ¶

num_running_requests() -> int

Return the number of requests currently running.

num_waiting_requests `abstractmethod` ¶

num_waiting_requests() -> int

Return the number of requests waiting to be scheduled.

pop_request_state `abstractmethod` ¶

pop_request_state(
    request_id: str,
) -> DiffusionRequestState | None

Remove and return request state if present.

preempt_request `abstractmethod` ¶

preempt_request(request_id: str) -> bool

Preempt a running request back to waiting.

schedule `abstractmethod` ¶

schedule() -> DiffusionSchedulerOutput

Run one scheduling cycle.

update_from_output `abstractmethod` ¶

update_from_output(
    sched_output: DiffusionSchedulerOutput,
    output: RunnerOutput,
) -> set[str]

Update scheduler state from executor output.

vllm_omni.diffusion.sched.interface ¶

CachedRequestData dataclass ¶

request_ids instance-attribute ¶

make_empty classmethod ¶

DiffusionRequestState dataclass ¶

error class-attribute instance-attribute ¶

req instance-attribute ¶

request_id instance-attribute ¶

sampling_params_key class-attribute instance-attribute ¶

status class-attribute instance-attribute ¶

is_finished ¶

DiffusionRequestStatus ¶

FINISHED_ABORTED class-attribute instance-attribute ¶

FINISHED_COMPLETED class-attribute instance-attribute ¶

FINISHED_ERROR class-attribute instance-attribute ¶

PREEMPTED class-attribute instance-attribute ¶

RUNNING class-attribute instance-attribute ¶

WAITING class-attribute instance-attribute ¶

is_finished staticmethod ¶

DiffusionSchedulerOutput dataclass ¶

finished_req_ids instance-attribute ¶

is_empty property ¶

kv_prefetch_jobs class-attribute instance-attribute ¶

num_running_reqs instance-attribute ¶

num_scheduled_reqs property ¶

num_waiting_reqs instance-attribute ¶

scheduled_cached_reqs instance-attribute ¶

scheduled_new_reqs instance-attribute ¶

scheduled_request_ids cached property ¶

step_id instance-attribute ¶

NewRequestData dataclass ¶

req instance-attribute ¶

request_id instance-attribute ¶

from_state classmethod ¶

RequestBatchSamplingParamsKey dataclass ¶

boundary_ratio class-attribute instance-attribute ¶

cfg_normalize class-attribute instance-attribute ¶

decode_noise_scale class-attribute instance-attribute ¶

decode_timestep class-attribute instance-attribute ¶

do_classifier_free_guidance class-attribute instance-attribute ¶

eta class-attribute instance-attribute ¶

fps class-attribute instance-attribute ¶

frame_rate class-attribute instance-attribute ¶

guidance_rescale class-attribute instance-attribute ¶

guidance_scale class-attribute instance-attribute ¶

guidance_scale_2 class-attribute instance-attribute ¶

guidance_scale_provided class-attribute instance-attribute ¶

height class-attribute instance-attribute ¶

layers class-attribute instance-attribute ¶

lora_int_id class-attribute instance-attribute ¶

lora_scale class-attribute instance-attribute ¶

max_sequence_length class-attribute instance-attribute ¶

num_frames class-attribute instance-attribute ¶

num_inference_steps class-attribute instance-attribute ¶

num_outputs_per_prompt class-attribute instance-attribute ¶

output_type class-attribute instance-attribute ¶

resolution class-attribute instance-attribute ¶

sigmas class-attribute instance-attribute ¶

strength class-attribute instance-attribute ¶

true_cfg_scale class-attribute instance-attribute ¶

use_en_prompt class-attribute instance-attribute ¶

width class-attribute instance-attribute ¶

SamplingParamsKey dataclass ¶

boundary_ratio class-attribute instance-attribute ¶

cfg_normalize class-attribute instance-attribute ¶

do_classifier_free_guidance class-attribute instance-attribute ¶

fps class-attribute instance-attribute ¶

frame_rate class-attribute instance-attribute ¶

guidance_rescale class-attribute instance-attribute ¶

guidance_scale class-attribute instance-attribute ¶

guidance_scale_2 class-attribute instance-attribute ¶

guidance_scale_provided class-attribute instance-attribute ¶

height class-attribute instance-attribute ¶

lora_int_id class-attribute instance-attribute ¶

lora_scale class-attribute instance-attribute ¶

num_frames class-attribute instance-attribute ¶

num_outputs_per_prompt class-attribute instance-attribute ¶

resolution class-attribute instance-attribute ¶

true_cfg_scale class-attribute instance-attribute ¶

width class-attribute instance-attribute ¶

CachedRequestData `dataclass` ¶

request_ids `instance-attribute` ¶

make_empty `classmethod` ¶

DiffusionRequestState `dataclass` ¶

error `class-attribute` `instance-attribute` ¶

req `instance-attribute` ¶

request_id `instance-attribute` ¶

sampling_params_key `class-attribute` `instance-attribute` ¶

status `class-attribute` `instance-attribute` ¶

FINISHED_ABORTED `class-attribute` `instance-attribute` ¶

FINISHED_COMPLETED `class-attribute` `instance-attribute` ¶

FINISHED_ERROR `class-attribute` `instance-attribute` ¶

PREEMPTED `class-attribute` `instance-attribute` ¶

RUNNING `class-attribute` `instance-attribute` ¶

WAITING `class-attribute` `instance-attribute` ¶

is_finished `staticmethod` ¶

DiffusionSchedulerOutput `dataclass` ¶

finished_req_ids `instance-attribute` ¶

is_empty `property` ¶

kv_prefetch_jobs `class-attribute` `instance-attribute` ¶

num_running_reqs `instance-attribute` ¶

num_scheduled_reqs `property` ¶

num_waiting_reqs `instance-attribute` ¶

scheduled_cached_reqs `instance-attribute` ¶

scheduled_new_reqs `instance-attribute` ¶

scheduled_request_ids `cached` `property` ¶

step_id `instance-attribute` ¶

NewRequestData `dataclass` ¶

req `instance-attribute` ¶

request_id `instance-attribute` ¶

from_state `classmethod` ¶

RequestBatchSamplingParamsKey `dataclass` ¶

boundary_ratio `class-attribute` `instance-attribute` ¶

cfg_normalize `class-attribute` `instance-attribute` ¶

decode_noise_scale `class-attribute` `instance-attribute` ¶

decode_timestep `class-attribute` `instance-attribute` ¶

do_classifier_free_guidance `class-attribute` `instance-attribute` ¶

eta `class-attribute` `instance-attribute` ¶

fps `class-attribute` `instance-attribute` ¶

frame_rate `class-attribute` `instance-attribute` ¶

guidance_rescale `class-attribute` `instance-attribute` ¶

guidance_scale `class-attribute` `instance-attribute` ¶

guidance_scale_2 `class-attribute` `instance-attribute` ¶

guidance_scale_provided `class-attribute` `instance-attribute` ¶

height `class-attribute` `instance-attribute` ¶

layers `class-attribute` `instance-attribute` ¶

lora_int_id `class-attribute` `instance-attribute` ¶

lora_scale `class-attribute` `instance-attribute` ¶

max_sequence_length `class-attribute` `instance-attribute` ¶

num_frames `class-attribute` `instance-attribute` ¶

num_inference_steps `class-attribute` `instance-attribute` ¶

num_outputs_per_prompt `class-attribute` `instance-attribute` ¶

output_type `class-attribute` `instance-attribute` ¶

resolution `class-attribute` `instance-attribute` ¶

sigmas `class-attribute` `instance-attribute` ¶

strength `class-attribute` `instance-attribute` ¶

true_cfg_scale `class-attribute` `instance-attribute` ¶

use_en_prompt `class-attribute` `instance-attribute` ¶

width `class-attribute` `instance-attribute` ¶

SamplingParamsKey `dataclass` ¶

boundary_ratio `class-attribute` `instance-attribute` ¶

cfg_normalize `class-attribute` `instance-attribute` ¶

do_classifier_free_guidance `class-attribute` `instance-attribute` ¶

fps `class-attribute` `instance-attribute` ¶

frame_rate `class-attribute` `instance-attribute` ¶

guidance_rescale `class-attribute` `instance-attribute` ¶

guidance_scale `class-attribute` `instance-attribute` ¶

guidance_scale_2 `class-attribute` `instance-attribute` ¶

guidance_scale_provided `class-attribute` `instance-attribute` ¶

height `class-attribute` `instance-attribute` ¶

lora_int_id `class-attribute` `instance-attribute` ¶

lora_scale `class-attribute` `instance-attribute` ¶

num_frames `class-attribute` `instance-attribute` ¶

num_outputs_per_prompt `class-attribute` `instance-attribute` ¶

resolution `class-attribute` `instance-attribute` ¶

true_cfg_scale `class-attribute` `instance-attribute` ¶

width `class-attribute` `instance-attribute` ¶

add_request `abstractmethod` ¶

close `abstractmethod` ¶

finish_requests `abstractmethod` ¶