vllm_omni.diffusion.sched ¶

Modules:

Name	Description
`base_scheduler`
`interface`
`request_scheduler`
`step_scheduler`

Scheduler `module-attribute` ¶

Scheduler = RequestScheduler

CachedRequestData `dataclass` ¶

Cached diffusion requests that only need their request ids resent.

request_ids `instance-attribute` ¶

request_ids: list[str]

make_empty `classmethod` ¶

make_empty() -> CachedRequestData

DiffusionRequestState `dataclass` ¶

Scheduler-owned state for one queued OmniDiffusionRequest.

error `class-attribute` `instance-attribute` ¶

error: str | None = None

req `instance-attribute` ¶

req: OmniDiffusionRequest

request_id `instance-attribute` ¶

request_id: str

sampling_params_key `class-attribute` `instance-attribute` ¶

sampling_params_key: (
    SamplingParamsKey | RequestBatchSamplingParamsKey | None
) = None

status `class-attribute` `instance-attribute` ¶

status: DiffusionRequestStatus = (
    DiffusionRequestStatus.WAITING
)

is_finished ¶

is_finished() -> bool

DiffusionRequestStatus ¶

Bases: IntEnum

Request status tracked by diffusion scheduler.

FINISHED_ABORTED `class-attribute` `instance-attribute` ¶

FINISHED_ABORTED = enum.auto()

FINISHED_COMPLETED `class-attribute` `instance-attribute` ¶

FINISHED_COMPLETED = enum.auto()

FINISHED_ERROR `class-attribute` `instance-attribute` ¶

FINISHED_ERROR = enum.auto()

PREEMPTED `class-attribute` `instance-attribute` ¶

PREEMPTED = enum.auto()

RUNNING `class-attribute` `instance-attribute` ¶

RUNNING = enum.auto()

WAITING `class-attribute` `instance-attribute` ¶

WAITING = enum.auto()

is_finished `staticmethod` ¶

is_finished(status: DiffusionRequestStatus) -> bool

DiffusionSchedulerOutput `dataclass` ¶

Output of a single scheduling cycle.

finished_req_ids `instance-attribute` ¶

finished_req_ids: set[str]

is_empty `property` ¶

is_empty: bool

kv_prefetch_jobs `class-attribute` `instance-attribute` ¶

kv_prefetch_jobs: dict | None = None

num_running_reqs `instance-attribute` ¶

num_running_reqs: int

num_scheduled_reqs `property` ¶

num_scheduled_reqs: int

num_waiting_reqs `instance-attribute` ¶

num_waiting_reqs: int

scheduled_cached_reqs `instance-attribute` ¶

scheduled_cached_reqs: CachedRequestData

scheduled_new_reqs `instance-attribute` ¶

scheduled_new_reqs: list[NewRequestData]

scheduled_request_ids `cached` `property` ¶

scheduled_request_ids: list[str]

All scheduled request ids in this cycle, including both new and cached ones.

step_id `instance-attribute` ¶

step_id: int

NewRequestData `dataclass` ¶

Payload for a newly scheduled diffusion request.

Carries the already-initialized request object so executors and workers do not re-run OmniDiffusionRequest.__post_init__ and mutate sentinel-based fields like guidance_scale_provided.

req `instance-attribute` ¶

req: OmniDiffusionRequest

request_id `instance-attribute` ¶

request_id: str

from_state `classmethod` ¶

from_state(state: DiffusionRequestState) -> NewRequestData

RequestScheduler ¶

Bases: _BaseScheduler

Diffusion scheduler with vLLM-style waiting/running queues.

add_request ¶

add_request(request: OmniDiffusionRequest) -> str

schedule ¶

schedule() -> DiffusionSchedulerOutput

update_from_output ¶

update_from_output(
    sched_output: DiffusionSchedulerOutput,
    output: RunnerOutput,
) -> set[str]

SchedulerInterface ¶

Bases: ABC

Abstract lifecycle contract for diffusion schedulers.

add_request `abstractmethod` ¶

add_request(request: OmniDiffusionRequest) -> str

Add a request and return the scheduler-owned request id.

close `abstractmethod` ¶

close() -> None

Release scheduler-owned state.

finish_requests `abstractmethod` ¶

finish_requests(
    request_ids: str | list[str],
    status: DiffusionRequestStatus,
) -> None

Mark one or more requests finished.

get_request_state `abstractmethod` ¶

get_request_state(
    request_id: str,
) -> DiffusionRequestState | None

Return request state if present.

has_requests `abstractmethod` ¶

has_requests() -> bool

Return whether the scheduler still owns runnable requests.

initialize `abstractmethod` ¶

initialize(od_config: OmniDiffusionConfig) -> None

Initialize or reset scheduler state.

num_running_requests `abstractmethod` ¶

num_running_requests() -> int

Return the number of requests currently running.

num_waiting_requests `abstractmethod` ¶

num_waiting_requests() -> int

Return the number of requests waiting to be scheduled.

pop_request_state `abstractmethod` ¶

pop_request_state(
    request_id: str,
) -> DiffusionRequestState | None

Remove and return request state if present.

preempt_request `abstractmethod` ¶

preempt_request(request_id: str) -> bool

Preempt a running request back to waiting.

schedule `abstractmethod` ¶

schedule() -> DiffusionSchedulerOutput

Run one scheduling cycle.

update_from_output `abstractmethod` ¶

update_from_output(
    sched_output: DiffusionSchedulerOutput,
    output: RunnerOutput,
) -> set[str]

Update scheduler state from executor output.

StepScheduler ¶

Bases: _BaseScheduler

Placeholder scheduler that advances a request one denoise step per update.

add_request ¶

add_request(request: OmniDiffusionRequest) -> str

schedule ¶

schedule() -> DiffusionSchedulerOutput

update_from_output ¶

update_from_output(
    sched_output: DiffusionSchedulerOutput,
    output: RunnerOutput,
) -> set[str]

vllm_omni.diffusion.sched ¶

Scheduler module-attribute ¶

CachedRequestData dataclass ¶

request_ids instance-attribute ¶

make_empty classmethod ¶

DiffusionRequestState dataclass ¶

error class-attribute instance-attribute ¶

req instance-attribute ¶

request_id instance-attribute ¶

sampling_params_key class-attribute instance-attribute ¶

status class-attribute instance-attribute ¶

is_finished ¶

DiffusionRequestStatus ¶

FINISHED_ABORTED class-attribute instance-attribute ¶

FINISHED_COMPLETED class-attribute instance-attribute ¶

FINISHED_ERROR class-attribute instance-attribute ¶

PREEMPTED class-attribute instance-attribute ¶

RUNNING class-attribute instance-attribute ¶

WAITING class-attribute instance-attribute ¶

is_finished staticmethod ¶

DiffusionSchedulerOutput dataclass ¶

finished_req_ids instance-attribute ¶

is_empty property ¶

kv_prefetch_jobs class-attribute instance-attribute ¶

num_running_reqs instance-attribute ¶

num_scheduled_reqs property ¶

num_waiting_reqs instance-attribute ¶

scheduled_cached_reqs instance-attribute ¶

scheduled_new_reqs instance-attribute ¶

scheduled_request_ids cached property ¶

step_id instance-attribute ¶

NewRequestData dataclass ¶

req instance-attribute ¶

request_id instance-attribute ¶

from_state classmethod ¶

RequestScheduler ¶

add_request ¶

schedule ¶

update_from_output ¶

SchedulerInterface ¶

add_request abstractmethod ¶

close abstractmethod ¶

finish_requests abstractmethod ¶

get_request_state abstractmethod ¶

has_requests abstractmethod ¶

initialize abstractmethod ¶

num_running_requests abstractmethod ¶

num_waiting_requests abstractmethod ¶

pop_request_state abstractmethod ¶

preempt_request abstractmethod ¶

schedule abstractmethod ¶

update_from_output abstractmethod ¶

StepScheduler ¶

add_request ¶

schedule ¶

update_from_output ¶

Scheduler `module-attribute` ¶

CachedRequestData `dataclass` ¶

request_ids `instance-attribute` ¶

make_empty `classmethod` ¶

DiffusionRequestState `dataclass` ¶

error `class-attribute` `instance-attribute` ¶

req `instance-attribute` ¶

request_id `instance-attribute` ¶

sampling_params_key `class-attribute` `instance-attribute` ¶

status `class-attribute` `instance-attribute` ¶

FINISHED_ABORTED `class-attribute` `instance-attribute` ¶

FINISHED_COMPLETED `class-attribute` `instance-attribute` ¶

FINISHED_ERROR `class-attribute` `instance-attribute` ¶

PREEMPTED `class-attribute` `instance-attribute` ¶

RUNNING `class-attribute` `instance-attribute` ¶

WAITING `class-attribute` `instance-attribute` ¶

is_finished `staticmethod` ¶

DiffusionSchedulerOutput `dataclass` ¶

finished_req_ids `instance-attribute` ¶

is_empty `property` ¶

kv_prefetch_jobs `class-attribute` `instance-attribute` ¶

num_running_reqs `instance-attribute` ¶

num_scheduled_reqs `property` ¶

num_waiting_reqs `instance-attribute` ¶

scheduled_cached_reqs `instance-attribute` ¶

scheduled_new_reqs `instance-attribute` ¶

scheduled_request_ids `cached` `property` ¶

step_id `instance-attribute` ¶

NewRequestData `dataclass` ¶

req `instance-attribute` ¶

request_id `instance-attribute` ¶

from_state `classmethod` ¶

add_request `abstractmethod` ¶

close `abstractmethod` ¶

finish_requests `abstractmethod` ¶

get_request_state `abstractmethod` ¶

has_requests `abstractmethod` ¶

initialize `abstractmethod` ¶

num_running_requests `abstractmethod` ¶

num_waiting_requests `abstractmethod` ¶

pop_request_state `abstractmethod` ¶

preempt_request `abstractmethod` ¶

schedule `abstractmethod` ¶

update_from_output `abstractmethod` ¶