Qwen3 Coder 30B A3B Instruct

Alibaba·Lançado em 2025-07-31

Open Source30B160K ctxApache 2.0

Comparar Testar via OpenRouter Ver no HuggingFace

Sobre

Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use. Built on the...

Modelos Relacionados

Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22 Qwen3.6 27B2026-04-21 Qwen3.6 Max Preview2026-04-20 Qwen3.6 35B A3B (Non-reasoning)2026-04-16 Qwen3.6 35B A3B2026-04-15

Índice de Qualidade

20.0

243rd de 507

Top 48%

Índice de Código

19.4

204th de 417

Top 49%

Índice de Matemática

29.0

188th de 269

Top 70%

Preço/1M

$0.12

115th mais barato

79% abaixo da mediana

Top 18%

Velocidade

113 tok/s

Top 36%

TTFT

1.50s

Janela de Contexto

160K

200th maior

Top 48%

Posição no Mercado

Qwen3 Coder 30B A3B InstructMédia do Mercado

Preços

Entrada

$0.07

por 1M tokens

Saída

$0.27

por 1M tokens

Combinado

$0.12

por 1M tokens

Mais barato que 82% dos modelos. Preço mediano é $0.56/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.12

Mensal

$3.60

vs. Modelos Similares

Qwen: Qwen3 Next 80B A3B InstructQ:+0.1

$0.34+185%

Qwen3 235B A22B (Reasoning)Q:-0.2

$2.63+2087%

QwQ 32BQ:-0.3

$0.74+521%

Qwen3 VL 30B A3B (Reasoning)Q:-0.3

$0.34+182%

Desempenho

113

tokens/seg

Mais rápido que 64% dos modelos

1.50

segundos

Mais rápido que 30% dos modelos

1.50

segundos

Mais rápido que 55% dos modelos

Mediana do Mercado

86 tok/s

32% mais rápido

TTFT Mediano

1.07s

40% mais lento

Vazão/Dólar

945

tok/s por $/1M

Comparação de Velocidade

OpenAI: GPT-4.1 Nano

113 tok/s-0%

Magistral Small 1.2

113 tok/s-0%

OpenAI: GPT-4o (2024-05-13)

114 tok/s+1%

Janela de Contexto

160K

tokens

Maior que 52% dos modelos

Saída Máxima

33K

tokens

20% do contexto

Benchmarks

MMLU-Pro

70.6%

GPQA Diamond

51.6%

HLE

4.0%

LiveCodeBench

40.3%

SciCode

27.8%

TerminalBench Hard

15.2%

MATH-500

89.3%

AIME

29.7%

AIME 2025

29.0%

IFBench

32.7%

Long Context Recall

29.0%

Tau2

34.5%

Média do MercadoMelhor Score

Open Source

HuggingFace

apache-2.030BGGUF / GPTQ / AWQ

Downloads

2.7M

Curtidas

1.1K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Tri-21B-think Preview

Trillion Labs

Q: 20.0N/A/1M

Código: -12.0

GPT-4.5 (Preview)

OpenAI

Q: 20.0N/A/1M

Qwen: Qwen3 Next 80B A3B Instruct

Alibaba

Q: 20.1$0.34/1M262K ctx

Mais rápido: 36%Mais caro: 185%

Qwen3 235B A22B (Reasoning)

Alibaba

Q: 19.8$2.63/1M

Mais lento: 40%Mais caro: 2087%

QwQ 32B

Alibaba

Q: 19.7$0.74/1M131K ctx

Mais lento: 72%Mais caro: 521%

Qwen3 VL 30B A3B (Reasoning)

Alibaba

Q: 19.7$0.34/1M

Mais caro: 182%Código: -6.3

Comparar todos os 7 modelos

Índice de Qualidade

20.0

243rd de 507

Top 48%

Índice de Código

19.4

204th de 417

Top 49%

Índice de Matemática

29.0

188th de 269

Top 70%

Preço/1M

$0.12

115th mais barato

79% abaixo da mediana

Top 18%

Velocidade

113 tok/s

Top 36%

TTFT

1.50s

Janela de Contexto

160K

200th maior

Top 48%

Posição no Mercado

Qwen3 Coder 30B A3B InstructMédia do Mercado