Loading...
Loading...
Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use. Built on the Qwen3 architecture, it supports a native context length of 256K tokens (extendable to 1M with Yarn) and performs strongly in tasks involving function calls, browser use, and structured code completion. This model is optimized for instruction-following without “thinking mode”, and integrates well with OpenAI-compatible tool-use formats.
Índice de Qualidade
20.0
187th de 444
Top 43%
Índice de Código
19.4
153rd de 354
Top 43%
Índice de Matemática
29.0
187th de 268
Top 70%
Preço/1M
$0.90
478th mais barato
200% acima da mediana
Top 71%
Velocidade
25 tok/s
Top 60%
TTFT
1.45s
Janela de Contexto
160K
144th maior
Top 41%
Entrada
$0.45
por 1M tokens
Saída
$2.25
por 1M tokens
Combinado
$0.90
por 1M tokens
Mais barato que 29% dos modelos. Preço mediano é $0.30/1M tokens.
Diário
$0.90
Mensal
$27.00
25
tokens/seg
Mais rápido que 40% dos modelos
1.45
segundos
Mais rápido que 20% dos modelos
1.45
segundos
Mais rápido que 32% dos modelos
Mediana do Mercado
45 tok/s
44% mais lento
TTFT Mediano
0.42s
246% mais lento
Vazão/Dólar
28
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
160K
tokens
Maior que 59% dos modelos
Saída Máxima
33K
tokens
20% do contexto
1.1M
982
24-48 GB
A6000 / M3 Ultra