Qwen3 32B (Non-reasoning)

Alibaba·Released 2025-04-28

Open Source

Compare

Quality Index

8.6

364th of 537

Top 69%

Math Index

19.7

210th of 269

Top 78%

Price/1M

$0.26

235th cheapest

52% below median

Top 34%

Speed

95 tok/s

Top 49%

TTFT

1.17s

Market Position

Qwen3 32B (Non-reasoning)Market Average

Pricing

Input

$0.15

per 1M tokens

Output

$0.59

per 1M tokens

Blended

$0.26

per 1M tokens

Cheaper than 66% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.26

Monthly

$7.80

vs. Similar Models

Llama 3.3 Instruct 70BQ:0.0

$0.61+135%

Mistral Small 3.1Q:0.0

$0.14-47%

OpenAI: GPT-4o (2024-05-13)Q:0.0

$7.50+2785%

Llama Nemotron Super 49B v1.5 (Non-reasoning)Q:+0.1

$0.17-33%

Performance

tokens/sec

Faster than 51% of models

1.17

seconds

Faster than 46% of models

1.17

seconds

Faster than 64% of models

Market Median

94 tok/s

1% faster

Median TTFT

1.11s

5% slower

Throughput/Dollar

366

tok/s per $/1M

Speed Comparison

Cogito v2.1 (Reasoning)

95 tok/s+0%

Reka Flash 3

95 tok/s-0%

Qwen3 VL 32B (Reasoning)

96 tok/s+0%

Benchmarks

MMLU-Pro

72.7%

GPQA Diamond

53.5%

HLE

4.3%

LiveCodeBench

28.8%

SciCode

28.0%

TerminalBench HardNot evaluated

MATH-500

86.9%

AIME

30.3%

AIME 2025

19.7%

IFBench

31.5%

Long Context Recall

0.0%

Tau2Not evaluated

Market AverageTop Score

Open Source

Quick Compare

Similar Models

OpenAI: GPT-4o (2024-05-13)

OpenAI

Q: 8.6$7.50/1M128K ctx

Faster: 33%Pricier: 2785%

Llama 3.3 Instruct 70B

Qwen3 32B (Non-reasoning)

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position