OpenAI: GPT-4.1 Nano

OpenAI·Lançado em 2025-04-14

1.0M ctxMultimodal

Sobre

For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series. It delivers exceptional performance at a small size with its 1 million...

Modelos Relacionados

OpenAI: GPT Chat Latest2026-05-05 OpenAI: GPT-5.52026-04-24 OpenAI: GPT-5.5 Pro2026-04-24 GPT-5.5 (high)2026-04-23 GPT-5.5 (medium)2026-04-23 GPT-5.5 (low)2026-04-23 GPT-5.5 (Non-reasoning)2026-04-23 OpenAI: GPT-5.4 Image 22026-04-21

Índice de Qualidade

13.0

368th de 507

Top 73%

Índice de Código

11.2

302nd de 417

Top 73%

Índice de Matemática

24.0

200th de 269

Top 75%

Preço/1M

$0.17

161st mais barato

69% abaixo da mediana

Top 27%

Velocidade

113 tok/s

Top 37%

TTFT

0.55s

Janela de Contexto

1.0M

38th maior

Top 10%

Posição no Mercado

OpenAI: GPT-4.1 NanoMédia do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.17

por 1M tokens

Mais barato que 73% dos modelos. Preço mediano é $0.56/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.17

Mensal

$5.25

vs. Modelos Similares

Mistral Large 2407Q:0.0

$3.00+1614%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)Q:+0.2

$0.09-50%

NVIDIA Nemotron Nano 9B V2 (Non-reasoning)Q:+0.2

$0.09-51%

Qwen3 8B (Reasoning)Q:+0.2

$0.37+111%

Desempenho

113

tokens/seg

Mais rápido que 63% dos modelos

0.55

segundos

Mais rápido que 78% dos modelos

0.55

segundos

Mais rápido que 86% dos modelos

Mediana do Mercado

86 tok/s

32% mais rápido

TTFT Mediano

1.07s

49% mais rápido

Vazão/Dólar

647

tok/s por $/1M

Comparação de Velocidade

Qwen: Qwen3 Coder 30B A3B Instruct

113 tok/s+0%

Magistral Small 1.2

113 tok/s-0%

Meta: Llama 4 Maverick

112 tok/s-1%

Janela de Contexto

1.0M

tokens

Maior que 90% dos modelos

Saída Máxima

33K

tokens

3% do contexto

Benchmarks

MMLU-Pro

65.7%

GPQA Diamond

51.2%

HLE

3.9%

LiveCodeBench

32.6%

SciCode

25.9%

TerminalBench Hard

3.8%

MATH-500

84.8%

AIME

23.7%

AIME 2025

24.0%

IFBench

32.0%

Long Context Recall

17.0%

Tau2

17.3%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Mistral Large 2407

Mistral

Q: 13.0$3.00/1M131K ctx

Mais caro: 1614%Janela de Contexto: 8x menor

Qwen2.5 Coder Instruct 32B

Alibaba

Q: 12.9N/A/1M

Qwen3 4B 2507 Instruct

Alibaba

Q: 12.9N/A/1M

OpenAI: GPT-4

OpenAI

Q: 12.8$37.50/1M8K ctx

Mais lento: 78%Mais caro: 21329%

Qwen3 14B (Non-reasoning)

Alibaba

Q: 12.8$0.38/1M

Mais lento: 41%Mais caro: 118%

NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)

NVIDIA

Q: 13.2$0.09/1M

Mais lento: 40%Mais barato: 50%

Comparar todos os 7 modelos

Índice de Qualidade

13.0

368th de 507

Top 73%

Índice de Código

11.2

302nd de 417

Top 73%

Índice de Matemática

24.0

200th de 269

Top 75%

Preço/1M

$0.17

161st mais barato

69% abaixo da mediana

Top 27%

Velocidade

113 tok/s

Top 37%

TTFT

0.55s

Janela de Contexto

1.0M

38th maior

Top 10%

Posição no Mercado

OpenAI: GPT-4.1 NanoMédia do Mercado