Qwen2.5 Instruct 72B

Alibaba·Released 2024-09-19

Open SourceMoE

Compare

Quality Index

9.6

336th of 537

Top 63%

Coding Index

11.9

327th of 447

Top 74%

Math Index

14.0

221st of 269

Top 83%

Price/1M

$0.37

287th cheapest

32% below median

Top 42%

Speed

56 tok/s

Top 76%

TTFT

1.23s

Market Position

Qwen2.5 Instruct 72BMarket Average

Pricing

Input

$0.36

per 1M tokens

Output

$0.40

per 1M tokens

Blended

$0.37

per 1M tokens

Cheaper than 58% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.37

Monthly

$11.10

vs. Similar Models

GPT-4o (Aug '24)Q:0.0

$4.38+1082%

Qwen3 Omni 30B A3B (Reasoning)Q:0.0

$0.43+16%

Ling-flash-2.0Q:+0.1

$0.25-33%

Perplexity: SonarQ:-0.1

$1.00+170%

Performance

tokens/sec

Faster than 24% of models

1.23

seconds

Faster than 42% of models

1.23

seconds

Faster than 62% of models

Market Median

94 tok/s

41% slower

Median TTFT

1.11s

11% slower

Throughput/Dollar

150

tok/s per $/1M

Speed Comparison

Mistral Large 3

56 tok/s-0%

Mistral Large 2 (Nov '24)

56 tok/s+1%

Grok 3 mini Reasoning (high)

55 tok/s-1%

Benchmarks

MMLU-Pro

72.0%

GPQA Diamond

49.1%

HLE

4.2%

LiveCodeBench

27.6%

SciCode

26.7%

TerminalBench Hard

4.5%

MATH-500

85.8%

AIME

16.0%

AIME 2025

14.0%

IFBench

36.9%

Long Context Recall

20.3%

Tau2

34.5%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

GPT-4o (Aug '24)

OpenAI

Q: 9.6$4.38/1M128K ctx

Faster: 130%Pricier: 1082%

Qwen3 Omni 30B A3B (Reasoning)

Alibaba

Q: 9.6$0.43/1M

Faster: 85%Pricier: 16%

Perplexity: Sonar

Perplexity

Q: 9.5$1.00/1M127K ctx

Pricier: 170%

Step3 VL 10B

StepFun

Q: 9.5N/A/1M

Ling-flash-2.0

InclusionAI

Q: 9.7$0.25/1M

Cheaper: 33%Coding: +4.8

DeepSeek R1 Distill Qwen 14B

DeepSeek

Q: 9.8N/A/1M

Compare all 7 models

Qwen2.5 Instruct 72B

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position