Loading...
Loading...
The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. In terms of...
Entrada
$0.26
por 1M tokens
Saída
$2.08
por 1M tokens
Combinado
$0.72
por 1M tokens
Mais barato que 46% dos modelos. Preço mediano é $0.56/1M tokens.
Diário
$0.72
Mensal
$21.45
161
tokens/seg
Mais rápido que 82% dos modelos
1.07
segundos
Mais rápido que 50% dos modelos
13.47
segundos
Mais rápido que 34% dos modelos
Mediana do Mercado
86 tok/s
88% mais rápido
TTFT Mediano
1.07s
0% mais lento
Vazão/Dólar
226
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 66% dos modelos
Saída Máxima
66K
tokens
25% do contexto
877.7K
537
Multi-GPU
8x A100 / H100
Índice de Qualidade
41.6
65th de 507
Top 13%
Índice de Código
34.7
85th de 417
Top 21%
Preço/1M
$0.72
344th mais barato
28% acima da mediana
Top 54%
Velocidade
161 tok/s
Top 18%
TTFT
1.07s
Janela de Contexto
262K
91st maior
Top 34%