vllm_omni.model_executor.models.indextts2.tokenizer ¶

logger `module-attribute` ¶

logger = init_logger(__name__)

Bases: PreTrainedTokenizer

vocab_file = vocab_file

vocab_size

convert_tokens_to_string(tokens)

from_pretrained(
    pretrained_model_name_or_path, *args, **kwargs
)

get_vocab()

split_segments(
    tokenized: list[str],
    max_text_tokens_per_segment: int = 120,
    quick_streaming_tokens: int = 0,
) -> list[list[str]]