Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3 Coder 30B A3B Instruct

Alibaba·Lançado em 2025-07-31
Open Source30B160K ctxApache 2.0

Sobre

Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use. Built on the...

Preços

Entrada

$0.07

por 1M tokens

Saída

$0.27

por 1M tokens

Combinado

$0.12

por 1M tokens

Mais barato que 82% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.12

Mensal

$3.60

vs. Modelos Similares

Qwen: Qwen3 Next 80B A3B InstructQ:+0.1
$0.34+185%
QwQ 32BQ:-0.2
$0.74+521%
Qwen3 235B A22B (Reasoning)Q:-0.2
$2.63+2087%
Qwen3 VL 30B A3B (Reasoning)Q:-0.3
$0.34+182%

Desempenho

111

tokens/seg

Mais rápido que 59% dos modelos

1.51

segundos

Mais rápido que 33% dos modelos

1.51

segundos

Mais rápido que 56% dos modelos

Mediana do Mercado

94 tok/s

17% mais rápido

TTFT Mediano

1.11s

36% mais lento

Vazão/Dólar

922

tok/s por $/1M

Comparação de Velocidade

GPT-5.4 (Non-reasoning)
111 tok/s+0%
LFM2 24B A2B
111 tok/s+1%
Claude 4.5 Haiku (Reasoning)
111 tok/s+1%

Janela de Contexto

160K

tokens

Maior que 48% dos modelos

Saída Máxima

33K

tokens

20% do contexto

Benchmarks

MMLU-Pro
70.6%
GPQA Diamond
51.6%
HLE
4.0%
LiveCodeBench
40.3%
SciCode
27.8%
TerminalBench Hard
15.2%
MATH-500
89.3%
AIME
29.7%
AIME 2025
29.0%
IFBench
32.7%
Long Context Recall
29.0%
Tau2
34.5%
Média do MercadoMelhor Score
apache-2.030BGGUF / GPTQ / AWQ
Downloads

1.9M

Curtidas

1.1K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos