Qwen: Qwen3 Coder 30B A3B Instruct

Alibaba·Released 2025-07-31

Open Source30B160K ctxApache 2.0

About

Qwen3-Coder-30B-A3B-Instruct is a 30.5B parameter Mixture-of-Experts (MoE) model with 128 experts (8 active per forward pass), designed for advanced code generation, repository-scale understanding, and agentic tool use. Built on the...

Quality Index

13.6

269th of 537

Top 50%

Coding Index

19.4

236th of 447

Top 53%

Math Index

29.0

188th of 269

Top 70%

Price/1M

$0.12

126th cheapest

78% below median

Top 18%

Speed

111 tok/s

Top 41%

TTFT

1.51s

Context Window

160K

234th largest

Top 52%

Market Position

Qwen: Qwen3 Coder 30B A3B InstructMarket Average

Pricing

Input

$0.07

per 1M tokens

Output

$0.27

per 1M tokens

Blended

$0.12

per 1M tokens

Cheaper than 82% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.12

Monthly

$3.60

vs. Similar Models

Qwen: Qwen3 Next 80B A3B InstructQ:+0.1

$0.34+185%

QwQ 32BQ:-0.2

$0.74+521%

Qwen3 235B A22B (Reasoning)Q:-0.2

$2.63+2087%

Qwen3 VL 30B A3B (Reasoning)Q:-0.3

$0.34+182%

Performance

111

tokens/sec

Faster than 59% of models

1.51

seconds

Faster than 33% of models

1.51

seconds

Faster than 56% of models

Market Median

94 tok/s

17% faster

Median TTFT

1.11s

36% slower

Throughput/Dollar

922

tok/s per $/1M

Speed Comparison

GPT-5.4 (Non-reasoning)

111 tok/s+0%

LFM2 24B A2B

111 tok/s+1%

Claude 4.5 Haiku (Reasoning)

111 tok/s+1%

Context Window

160K

tokens

Larger than 48% of models

Max Output

33K

tokens

20% of context

Benchmarks

MMLU-Pro

70.6%

GPQA Diamond

51.6%

HLE

4.0%

LiveCodeBench

40.3%

SciCode

27.8%

TerminalBench Hard

15.2%

MATH-500

89.3%

AIME

29.7%

AIME 2025

29.0%

IFBench

32.7%

Long Context Recall

29.0%

Tau2

34.5%

Market AverageTop Score

Open Source

View model repository

apache-2.030BGGUF / GPTQ / AWQ

Downloads

1.9M

Likes

1.1K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Quick Compare

Similar Models

Tri-21B-think Preview

Trillion Labs

Q: 13.6N/A/1M

Coding: -12.0

GPT-4.5 (Preview)

OpenAI

Q: 13.6N/A/1M

Qwen: Qwen3 Next 80B A3B Instruct

Alibaba

Q: 13.7$0.34/1M262K ctx

Faster: 70%Pricier: 185%

QwQ 32B

Alibaba

Q: 13.4$0.74/1M131K ctx

Slower: 71%Pricier: 521%

Qwen3 235B A22B (Reasoning)

Alibaba

Q: 13.4$2.63/1M

Slower: 40%Pricier: 2087%

Gemini 2.0 Flash Thinking Experimental (Jan '25)

Google

Q: 13.3N/A/1M

Coding: +4.7

Compare all 7 models

Qwen: Qwen3 Coder 30B A3B Instruct

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position