Qwen3 4B 2507 (Reasoning)

Alibaba·Released 2025-08-06

Open Source

Compare

Quality Index

12.0

296th of 537

Top 55%

Coding Index

9.5

360th of 447

Top 81%

Math Index

82.7

56th of 269

Top 21%

Market Position

Qwen3 4B 2507 (Reasoning)Market Average

Benchmarks

MMLU-Pro

74.3%

GPQA Diamond

66.7%

HLE

5.9%

LiveCodeBench

64.1%

SciCode

25.6%

TerminalBench Hard

1.5%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025

82.7%

IFBench

49.8%

Long Context Recall

37.7%

Tau2

25.4%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

MiniCPM5-1B (Reasoning)

OpenBMB

Q: 12.0N/A/1M

Coding: -8.0

Sarvam 105B (high)

Sarvam

Q: 11.9$0.07/1M

Nova 2.0 Lite (Non-reasoning)

Amazon

Q: 11.8$0.85/1M

Llama 3.3 Nemotron Super 49B v1 (Reasoning)

NVIDIA

Q: 12.2N/A/1M

Gemini 2.0 Pro Experimental (Feb '25)

Google

Q: 11.8N/A/1M

Coding: +16.0

Claude 3 Opus

Anthropic

Q: 11.8$30.00/1M

Coding: +10.0

Compare all 7 models

Qwen3 4B 2507 (Reasoning)

Related Models

Market Position

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position