Qwen: Qwen3.5-122B-A10B
Sobre
The Qwen3.5 122B-A10B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. In terms of...
Modelos Relacionados
Preços
Entrada
$0.26
por 1M tokens
Saída
$2.08
por 1M tokens
Combinado
$0.72
por 1M tokens
Mais barato que 45% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Diário
$0.72
Mensal
$21.45
vs. Modelos Similares
Desempenho
148
tokens/seg
Mais rápido que 73% dos modelos
1.08
segundos
Mais rápido que 51% dos modelos
14.57
segundos
Mais rápido que 34% dos modelos
Mediana do Mercado
94 tok/s
58% mais rápido
TTFT Mediano
1.10s
2% mais rápido
Vazão/Dólar
207
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 62% dos modelos
Saída Máxima
262K
tokens
100% do contexto
Benchmarks
Open Source
799.3K
578
Multi-GPU
8x A100 / H100