OpenAI: GPT-4.1 Nano

OpenAI·Lançado em 2025-04-14

1.0M ctxMultimodal

Sobre

For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series. It delivers exceptional performance at a small size with its 1 million...

Modelos Relacionados

GPT-5.5 Instant (May 2026)2026-05-05 OpenAI: GPT Chat Latest2026-05-05 OpenAI: GPT-5.52026-04-24 OpenAI: GPT-5.5 Pro2026-04-24 GPT-5.5 (high)2026-04-23 GPT-5.5 (medium)2026-04-23 GPT-5.5 (low)2026-04-23 GPT-5.5 (Non-reasoning)2026-04-23

Índice de Qualidade

7.3

398th de 537

Top 74%

Índice de Código

11.2

333rd de 447

Top 75%

Índice de Matemática

24.0

200th de 269

Top 75%

Preço/1M

$0.17

178th mais barato

68% abaixo da mediana

Top 28%

Velocidade

182 tok/s

Top 17%

TTFT

0.52s

Janela de Contexto

1.0M

46th maior

Top 11%

Posição no Mercado

OpenAI: GPT-4.1 NanoMédia do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Mistral Large 2407Q:0.0

$3.00+1614%

Gemma 3 27B InstructQ:+0.1

$0.14-17%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)Q:+0.1

$0.09-50%

NVIDIA Nemotron Nano 9B V2 (Non-reasoning)Q:+0.1

$0.09-51%

Desempenho

182

tokens/seg

Mais rápido que 83% dos modelos

0.52

segundos

Mais rápido que 86% dos modelos

0.52

segundos

Mais rápido que 90% dos modelos

Mediana do Mercado

94 tok/s

93% mais rápido

TTFT Mediano

1.11s

53% mais rápido

Vazão/Dólar

1039

tok/s por $/1M

Comparação de Velocidade

OpenAI: GPT-5.4 Mini

182 tok/s-0%

OpenAI: o4 Mini

183 tok/s+0%

Nemotron 3 Ultra 550B A55B (Reasoning)

183 tok/s+1%

Janela de Contexto

1.0M

tokens

Maior que 89% dos modelos

Saída Máxima

33K

tokens

3% do contexto

Benchmarks

MMLU-Pro

65.7%

GPQA Diamond

51.2%

HLE

3.9%

LiveCodeBench

32.6%

SciCode

25.9%

TerminalBench Hard

3.8%

MATH-500

84.8%

AIME

23.7%

AIME 2025

24.0%

IFBench

32.0%

Long Context Recall

17.0%

Tau2

17.3%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Mistral Large 2407

Mistral

Q: 7.3$3.00/1M131K ctx

Mais caro: 1614%Janela de Contexto: 8x menor

Gemma 3 27B Instruct

Google

Q: 7.4$0.14/1M

Mais lento: 80%Mais barato: 17%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

NVIDIA

Q: 7.4$0.09/1M

Mais lento: 53%Mais barato: 50%

NVIDIA Nemotron Nano 9B V2 (Non-reasoning)

NVIDIA

Q: 7.4$0.09/1M

Mais lento: 20%Mais barato: 51%

Qwen3 8B (Reasoning)

Alibaba

Q: 7.4$0.37/1M

Mais lento: 67%Mais caro: 111%

Grok Beta

xAI

Q: 7.5N/A/1M

Comparar todos os 7 modelos