vllm_omni.diffusion.models.t5_encoder.t5_gemma_encoder ¶

T5GemmaAttention ¶

Bases: Module

head_dim `instance-attribute` ¶

head_dim = head_dim

hidden_size `instance-attribute` ¶

hidden_size = hidden_size

kv_size `instance-attribute` ¶

kv_size = self.num_kv_heads * self.head_dim

num_heads `instance-attribute` ¶

num_heads = self.total_num_heads // tp_size

num_kv_heads `instance-attribute` ¶

num_kv_heads = max(1, self.total_num_kv_heads // tp_size)

o_proj `instance-attribute` ¶

o_proj = RowParallelLinear(
    input_size=self.total_num_heads * self.head_dim,
    output_size=hidden_size,
    bias=False,
    input_is_parallel=True,
)

q_size `instance-attribute` ¶

q_size = self.num_heads * self.head_dim

qkv_proj `instance-attribute` ¶

qkv_proj = QKVParallelLinear(
    hidden_size=hidden_size,
    head_size=self.head_dim,
    total_num_heads=self.total_num_heads,
    total_num_kv_heads=self.total_num_kv_heads,
    bias=False,
)

rotary_emb `instance-attribute` ¶

rotary_emb = get_rope(
    self.head_dim,
    max_position=max_position_embeddings,
    is_neox_style=True,
    rope_parameters={"base": rope_theta},
)

total_num_heads `instance-attribute` ¶

total_num_heads = num_heads

total_num_kv_heads `instance-attribute` ¶

total_num_kv_heads = num_kv_heads

forward ¶

forward(
    positions: Tensor,
    hidden_states: Tensor,
    attention_mask: Tensor | None = None,
) -> Tensor

T5GemmaEncoderLayer ¶

Bases: Module

mlp `instance-attribute` ¶

mlp = T5GemmaMLP(
    hidden_size=config.hidden_size,
    intermediate_size=config.intermediate_size,
    hidden_act=config.hidden_activation,
)

post_feedforward_layernorm `instance-attribute` ¶

post_feedforward_layernorm = T5GemmaRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

post_self_attn_layernorm `instance-attribute` ¶

post_self_attn_layernorm = T5GemmaRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

pre_feedforward_layernorm `instance-attribute` ¶

pre_feedforward_layernorm = T5GemmaRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

pre_self_attn_layernorm `instance-attribute` ¶

pre_self_attn_layernorm = T5GemmaRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

self_attn `instance-attribute` ¶

self_attn = T5GemmaAttention(
    hidden_size=config.hidden_size,
    num_heads=config.num_attention_heads,
    num_kv_heads=config.num_key_value_heads,
    head_dim=config.head_dim,
    max_position_embeddings=config.max_position_embeddings,
    rope_theta=getattr(config, "rope_theta", 10000.0),
)

forward ¶

forward(
    positions: Tensor,
    hidden_states: Tensor,
    attention_mask: Tensor | None,
) -> Tensor

T5GemmaEncoderModelTP ¶

Bases: Module

config `instance-attribute` ¶

config = config

device `property` ¶

device: device

dtype `property` ¶

dtype: dtype

embed_tokens `instance-attribute` ¶

embed_tokens = VocabParallelEmbedding(
    config.vocab_size, config.hidden_size
)

layers `instance-attribute` ¶

layers = nn.ModuleList(
    [
        (T5GemmaEncoderLayer(config))
        for _ in (range(config.num_hidden_layers))
    ]
)

norm `instance-attribute` ¶

norm = T5GemmaRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

vocab_size `instance-attribute` ¶

vocab_size = config.vocab_size

forward ¶

forward(
    input_ids: Tensor, attention_mask: Tensor | None = None
) -> Tensor

load_weights ¶

load_weights(
    weights: Iterable[tuple[str, Tensor]],
) -> set[str]

T5GemmaMLP ¶

Bases: Module

act_fn `instance-attribute` ¶

act_fn = get_act_fn(hidden_act)

down_proj `instance-attribute` ¶

down_proj = RowParallelLinear(
    input_size=intermediate_size,
    output_size=hidden_size,
    bias=False,
    input_is_parallel=True,
)

gate_up_proj `instance-attribute` ¶

gate_up_proj = MergedColumnParallelLinear(
    input_size=hidden_size,
    output_sizes=[intermediate_size, intermediate_size],
    bias=False,
    gather_output=False,
)

forward ¶

forward(x: Tensor) -> Tensor

T5GemmaRMSNorm ¶

Bases: Module

variance_epsilon `instance-attribute` ¶

variance_epsilon = eps

weight `instance-attribute` ¶

weight = nn.Parameter(torch.zeros(hidden_size))

forward ¶

forward(hidden_states: Tensor) -> Tensor

vllm_omni.diffusion.models.t5_encoder.t5_gemma_encoder ¶

T5GemmaAttention ¶

head_dim instance-attribute ¶

hidden_size instance-attribute ¶

kv_size instance-attribute ¶

num_heads instance-attribute ¶

num_kv_heads instance-attribute ¶

o_proj instance-attribute ¶

q_size instance-attribute ¶

qkv_proj instance-attribute ¶

rotary_emb instance-attribute ¶

total_num_heads instance-attribute ¶

total_num_kv_heads instance-attribute ¶

forward ¶

T5GemmaEncoderLayer ¶

mlp instance-attribute ¶

post_feedforward_layernorm instance-attribute ¶

post_self_attn_layernorm instance-attribute ¶

pre_feedforward_layernorm instance-attribute ¶

pre_self_attn_layernorm instance-attribute ¶

self_attn instance-attribute ¶

forward ¶

T5GemmaEncoderModelTP ¶

config instance-attribute ¶

device property ¶

dtype property ¶

embed_tokens instance-attribute ¶

layers instance-attribute ¶

norm instance-attribute ¶

vocab_size instance-attribute ¶

forward ¶

load_weights ¶

T5GemmaMLP ¶

act_fn instance-attribute ¶

down_proj instance-attribute ¶

gate_up_proj instance-attribute ¶

forward ¶

T5GemmaRMSNorm ¶

variance_epsilon instance-attribute ¶

weight instance-attribute ¶

forward ¶

head_dim `instance-attribute` ¶

hidden_size `instance-attribute` ¶

kv_size `instance-attribute` ¶

num_heads `instance-attribute` ¶

num_kv_heads `instance-attribute` ¶

o_proj `instance-attribute` ¶

q_size `instance-attribute` ¶

qkv_proj `instance-attribute` ¶

rotary_emb `instance-attribute` ¶

total_num_heads `instance-attribute` ¶

total_num_kv_heads `instance-attribute` ¶

mlp `instance-attribute` ¶

post_feedforward_layernorm `instance-attribute` ¶

post_self_attn_layernorm `instance-attribute` ¶

pre_feedforward_layernorm `instance-attribute` ¶

pre_self_attn_layernorm `instance-attribute` ¶

self_attn `instance-attribute` ¶

config `instance-attribute` ¶

device `property` ¶

dtype `property` ¶

embed_tokens `instance-attribute` ¶

layers `instance-attribute` ¶

norm `instance-attribute` ¶

vocab_size `instance-attribute` ¶

act_fn `instance-attribute` ¶

down_proj `instance-attribute` ¶

gate_up_proj `instance-attribute` ¶

variance_epsilon `instance-attribute` ¶

weight `instance-attribute` ¶