OpenAI: GPT-4.1 Nano

OpenAI·Released 2025-04-14

1.0M ctxMultimodal

About

For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series. It delivers exceptional performance at a small size with its 1 million...

Quality Index

7.3

398th of 537

Top 74%

Coding Index

11.2

333rd of 447

Top 75%

Math Index

24.0

200th of 269

Top 75%

Price/1M

$0.17

178th cheapest

68% below median

Top 28%

Speed

182 tok/s

Top 17%

TTFT

0.52s

Context Window

1.0M

46th largest

Top 11%

Market Position

OpenAI: GPT-4.1 NanoMarket Average

Pricing

Input

$0.10

per 1M tokens

Output

$0.40

per 1M tokens

Blended

$0.17

per 1M tokens

Cheaper than 72% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.17

Monthly

$5.25

vs. Similar Models

Mistral Large 2407Q:0.0

$3.00+1614%

Gemma 3 27B InstructQ:+0.1

$0.14-17%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)Q:+0.1

$0.09-50%

NVIDIA Nemotron Nano 9B V2 (Non-reasoning)Q:+0.1

$0.09-51%

Performance

182

tokens/sec

Faster than 83% of models

0.52

seconds

Faster than 86% of models

0.52

seconds

Faster than 90% of models

Market Median

94 tok/s

93% faster

Median TTFT

1.11s

53% faster

Throughput/Dollar

1039

tok/s per $/1M

Speed Comparison

OpenAI: GPT-5.4 Mini

182 tok/s-0%

OpenAI: o4 Mini

183 tok/s+0%

Nemotron 3 Ultra 550B A55B (Reasoning)

183 tok/s+1%

Context Window

1.0M

tokens

Larger than 89% of models

Max Output

33K

tokens

3% of context

Benchmarks

MMLU-Pro

65.7%

GPQA Diamond

51.2%

HLE

3.9%

LiveCodeBench

32.6%

SciCode

25.9%

TerminalBench Hard

3.8%

MATH-500

84.8%

AIME

23.7%

AIME 2025

24.0%

IFBench

32.0%

Long Context Recall

17.0%

Tau2

17.3%

Market AverageTop Score

Quick Compare

Similar Models

Mistral Large 2407

Mistral

Q: 7.3$3.00/1M131K ctx

Pricier: 1614%Context Window: 8x smaller

Gemma 3 27B Instruct

Google

Q: 7.4$0.14/1M

Slower: 80%Cheaper: 17%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

NVIDIA

Q: 7.4$0.09/1M

Slower: 53%Cheaper: 50%

NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

NVIDIA

Q: 7.4$0.09/1M

Slower: 20%Cheaper: 51%

Qwen3 8B (Reasoning)

Alibaba

Q: 7.4$0.37/1M

Slower: 67%Pricier: 111%

Grok Beta

xAI

Q: 7.5N/A/1M

Compare all 7 models

OpenAI: GPT-4.1 Nano

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Quick Compare

Similar Models

Market Position