vllm_omni.diffusion.models.internvla_a1.adapter_qwen3_vl ¶

Qwen3VLForConditionalGeneration ¶

Bases: Qwen3VLForConditionalGeneration

accepts_loss_kwargs `class-attribute` `instance-attribute` ¶

accepts_loss_kwargs = False

config `instance-attribute` ¶

config: Qwen3VLConfig

lm_head `instance-attribute` ¶

lm_head = nn.Linear(
    config.text_config.hidden_size,
    config.text_config.vocab_size,
    bias=False,
)

model `instance-attribute` ¶

model = Qwen3VLModel(config)

Qwen3VLModel ¶

Bases: Qwen3VLModel

accepts_loss_kwargs `class-attribute` `instance-attribute` ¶

accepts_loss_kwargs = False

base_model_prefix `class-attribute` `instance-attribute` ¶

base_model_prefix = ''

config `instance-attribute` ¶

config: Qwen3VLConfig

language_model `instance-attribute` ¶

language_model = Qwen3VLTextModel._from_config(
    config.text_config
)

rope_deltas `instance-attribute` ¶

rope_deltas = None

visual `instance-attribute` ¶

visual = Qwen3VLVisionModel._from_config(
    config.vision_config
)

Qwen3VLTextAttention ¶

Bases: Qwen3VLTextAttention

k_norm `instance-attribute` ¶

k_norm = Qwen3VLTextRMSNorm(
    self.head_dim, eps=config.rms_norm_eps
)

q_norm `instance-attribute` ¶

q_norm = Qwen3VLTextRMSNorm(
    self.head_dim, eps=config.rms_norm_eps
)

forward ¶

forward(
    hidden_states: Tensor,
    position_embeddings: tuple[Tensor, Tensor],
    attention_mask: Tensor | None,
    past_key_values: Cache | None = None,
    cache_position: LongTensor | None = None,
    use_cache: bool = False,
    **kwargs: Unpack[FlashAttentionKwargs],
) -> tuple[Tensor, Tensor | None]

Qwen3VLTextDecoderLayer ¶

Bases: Qwen3VLTextDecoderLayer

input_layernorm `instance-attribute` ¶

input_layernorm = Qwen3VLTextRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

post_attention_layernorm `instance-attribute` ¶

post_attention_layernorm = Qwen3VLTextRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

self_attn `instance-attribute` ¶

self_attn = Qwen3VLTextAttention(
    config=config, layer_idx=layer_idx
)

Qwen3VLTextModel ¶

Bases: Qwen3VLTextModel

config `instance-attribute` ¶

config: Qwen3VLTextConfig

embed_tokens `instance-attribute` ¶

embed_tokens = nn.Embedding(
    config.vocab_size, config.hidden_size, self.padding_idx
)

gradient_checkpointing `instance-attribute` ¶

gradient_checkpointing = False

layers `instance-attribute` ¶

layers = nn.ModuleList(
    [
        (Qwen3VLTextDecoderLayer(config, layer_idx))
        for layer_idx in (range(config.num_hidden_layers))
    ]
)

norm `instance-attribute` ¶

norm = Qwen3VLTextRMSNorm(
    config.hidden_size, eps=config.rms_norm_eps
)

padding_idx `instance-attribute` ¶

padding_idx = config.pad_token_id

rotary_emb `instance-attribute` ¶

rotary_emb = Qwen3VLTextRotaryEmbedding(config=config)

vocab_size `instance-attribute` ¶

vocab_size = config.vocab_size

forward ¶

forward(
    input_ids: LongTensor = None,
    attention_mask: Tensor | None = None,
    position_ids: LongTensor | None = None,
    past_key_values: Cache | None = None,
    inputs_embeds: FloatTensor | None = None,
    use_cache: bool | None = None,
    cache_position: LongTensor | None = None,
    visual_pos_masks: Tensor | None = None,
    deepstack_visual_embeds: list[Tensor] | None = None,
    **kwargs: Unpack[FlashAttentionKwargs],
) -> tuple | BaseModelOutputWithPast

Qwen3VLTextRMSNorm ¶

Bases: Qwen3VLTextRMSNorm

forward ¶

forward(hidden_states: Tensor) -> Tensor

vllm_omni.diffusion.models.internvla_a1.adapter_qwen3_vl ¶

Qwen3VLForConditionalGeneration ¶

accepts_loss_kwargs class-attribute instance-attribute ¶

config instance-attribute ¶

lm_head instance-attribute ¶

model instance-attribute ¶

Qwen3VLModel ¶

accepts_loss_kwargs class-attribute instance-attribute ¶

base_model_prefix class-attribute instance-attribute ¶

config instance-attribute ¶

language_model instance-attribute ¶

rope_deltas instance-attribute ¶

visual instance-attribute ¶

Qwen3VLTextAttention ¶

k_norm instance-attribute ¶

q_norm instance-attribute ¶

forward ¶

Qwen3VLTextDecoderLayer ¶

input_layernorm instance-attribute ¶

post_attention_layernorm instance-attribute ¶

self_attn instance-attribute ¶

Qwen3VLTextModel ¶

config instance-attribute ¶

embed_tokens instance-attribute ¶

gradient_checkpointing instance-attribute ¶

layers instance-attribute ¶

norm instance-attribute ¶

padding_idx instance-attribute ¶

rotary_emb instance-attribute ¶

vocab_size instance-attribute ¶

forward ¶

Qwen3VLTextRMSNorm ¶

forward ¶

accepts_loss_kwargs `class-attribute` `instance-attribute` ¶

config `instance-attribute` ¶

lm_head `instance-attribute` ¶

model `instance-attribute` ¶

accepts_loss_kwargs `class-attribute` `instance-attribute` ¶

base_model_prefix `class-attribute` `instance-attribute` ¶

config `instance-attribute` ¶

language_model `instance-attribute` ¶

rope_deltas `instance-attribute` ¶

visual `instance-attribute` ¶

k_norm `instance-attribute` ¶

q_norm `instance-attribute` ¶

input_layernorm `instance-attribute` ¶

post_attention_layernorm `instance-attribute` ¶

self_attn `instance-attribute` ¶

config `instance-attribute` ¶

embed_tokens `instance-attribute` ¶

gradient_checkpointing `instance-attribute` ¶

layers `instance-attribute` ¶

norm `instance-attribute` ¶

padding_idx `instance-attribute` ¶

rotary_emb `instance-attribute` ¶

vocab_size `instance-attribute` ¶