Loading...
Loading...
The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers state-of-the-art performance comparable to leading-edge models across a wide range of tasks, including language understanding, logical reasoning, code generation, agent-based tasks, image understanding, video understanding, and graphical user interface (GUI) interactions. With its robust code-generation and agent capabilities, the model exhibits strong generalization across diverse agent.
Índice de Qualidade
45.0
21st de 444
Top 5%
Índice de Código
41.3
24th de 354
Top 7%
Preço/1M
$1.35
519th mais barato
350% acima da mediana
Top 76%
Velocidade
54 tok/s
Top 45%
TTFT
1.46s
Janela de Contexto
262K
61st maior
Top 25%
Entrada
$0.60
por 1M tokens
Saída
$3.60
por 1M tokens
Combinado
$1.35
por 1M tokens
Mais barato que 24% dos modelos. Preço mediano é $0.30/1M tokens.
Diário
$1.35
Mensal
$40.50
54
tokens/seg
Mais rápido que 55% dos modelos
1.46
segundos
Mais rápido que 19% dos modelos
38.45
segundos
Mais rápido que 6% dos modelos
Mediana do Mercado
45 tok/s
19% mais rápido
TTFT Mediano
0.42s
249% mais lento
Vazão/Dólar
40
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 75% dos modelos
Saída Máxima
66K
tokens
25% do contexto
1.7M
1.4K
Multi-GPU
8x A100 / H100