Loading...
Loading...
Qwen3-Next-80B-A3B-Instruct is an instruction-tuned chat model in the Qwen3-Next series optimized for fast, stable responses without “thinking” traces. It targets complex tasks across reasoning, code generation, knowledge QA, and multilingual...
Entrada
$0.09
por 1M tokens
Saída
$1.10
por 1M tokens
Combinado
$0.34
por 1M tokens
Mais barato que 60% dos modelos. Preço mediano é $0.56/1M tokens.
Diário
$0.34
Mensal
$10.28
154
tokens/seg
Mais rápido que 79% dos modelos
1.10
segundos
Mais rápido que 48% dos modelos
1.10
segundos
Mais rápido que 65% dos modelos
Mediana do Mercado
86 tok/s
79% mais rápido
TTFT Mediano
1.07s
3% mais lento
Vazão/Dólar
449
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 66% dos modelos
Saída Máxima
16K
tokens
6% do contexto
777.1K
951
Multi-GPU
8x A100 / H100
Índice de Qualidade
20.1
242nd de 507
Top 48%
Índice de Código
15.3
245th de 417
Top 59%
Índice de Matemática
66.3
104th de 269
Top 39%
Preço/1M
$0.34
252nd mais barato
39% abaixo da mediana
Top 40%
Velocidade
154 tok/s
Top 21%
TTFT
1.10s
Janela de Contexto
262K
91st maior
Top 34%