OpenAI: o4 Mini

OpenAI·Released 2025-04-16

200K ctxMultimodal

About

OpenAI o4-mini is a compact reasoning model in the o-series, optimized for fast, cost-efficient performance while retaining strong multimodal and agentic capabilities. It supports tool use and demonstrates competitive reasoning...

Quality Index

25.6

139th of 537

Top 26%

Coding Index

25.6

180th of 447

Top 40%

Math Index

90.7

23rd of 269

Top 9%

Price/1M

$1.93

511th cheapest

254% above median

Top 75%

Speed

183 tok/s

Top 17%

TTFT

19.46s

Context Window

200K

201st largest

Top 50%

Market Position

OpenAI: o4 MiniMarket Average

Pricing

Input

$1.10

per 1M tokens

Output

$4.40

per 1M tokens

Blended

$1.93

per 1M tokens

Cheaper than 25% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$1.93

Monthly

$57.75

vs. Similar Models

Gemma 4 26B A4B (Reasoning)Q:+0.1

$0.20-90%

Claude 4 Opus (Non-reasoning)Q:-0.1

$30.00+1458%

Claude 4 Sonnet (Non-reasoning)Q:-0.1

$6.00+212%

Step 3.5 FlashQ:-0.1

$0.15-92%

Performance

183

tokens/sec

Faster than 83% of models

19.46

seconds

Faster than 5% of models

19.46

seconds

Faster than 26% of models

Market Median

94 tok/s

93% faster

Median TTFT

1.11s

1649% slower

Throughput/Dollar

tok/s per $/1M

Speed Comparison

Nemotron 3 Ultra 550B A55B (Reasoning)

183 tok/s+0%

OpenAI: GPT-4.1 Nano

182 tok/s-0%

OpenAI: GPT-5.4 Mini

182 tok/s-0%

Context Window

200K

tokens

Larger than 50% of models

Max Output

100K

tokens

50% of context

Benchmarks

MMLU-Pro

83.2%

GPQA Diamond

78.4%

HLE

17.5%

LiveCodeBench

85.9%

SciCode

46.5%

TerminalBench Hard

15.2%

MATH-500

98.9%

AIME

94.0%

AIME 2025

90.7%

IFBench

68.7%

Long Context Recall

55.0%

Tau2

55.6%

Market AverageTop Score

Quick Compare

Similar Models

Gemma 4 26B A4B (Reasoning)

Google

Q: 25.7$0.20/1M

Cheaper: 90%Coding: +13.7

Claude 4 Sonnet (Non-reasoning)

Anthropic

Q: 25.5$6.00/1M

Slower: 74%Pricier: 212%

Claude 4 Opus (Non-reasoning)

Anthropic

Q: 25.5$30.00/1M

Slower: 81%Pricier: 1458%

Step 3.5 Flash

StepFun

Q: 25.5$0.15/1M

Cheaper: 92%Coding: +6.0

Google: Gemini 2.5 Pro

Google

Q: 25.8$3.44/1M1.0M ctx

Slower: 22%Pricier: 79%

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

NVIDIA

Q: 25.4$0.41/1M

Faster: 27%Cheaper: 79%

Compare all 7 models

OpenAI: o4 Mini

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Quick Compare

Similar Models

Market Position