Loading...
Loading...
For tasks that demand low latency, GPT‑4.1 nano is the fastest and cheapest model in the GPT-4.1 series. It delivers exceptional performance at a small size with its 1 million token context window, and scores 80.1% on MMLU, 50.3% on GPQA, and 9.8% on Aider polyglot coding – even higher than GPT‑4o mini. It’s ideal for tasks like classification or autocompletion.
Índice de Qualidade
13.0
308th de 444
Top 70%
Índice de Código
11.2
245th de 354
Top 69%
Índice de Matemática
24.0
199th de 268
Top 75%
Preço/1M
$0.17
280th mais barato
42% abaixo da mediana
Top 42%
Velocidade
106 tok/s
Top 24%
TTFT
0.39s
Janela de Contexto
1.0M
23rd maior
Top 7%
Entrada
$0.10
por 1M tokens
Saída
$0.40
por 1M tokens
Combinado
$0.17
por 1M tokens
Mais barato que 58% dos modelos. Preço mediano é $0.30/1M tokens.
Diário
$0.17
Mensal
$5.25
106
tokens/seg
Mais rápido que 76% dos modelos
0.39
segundos
Mais rápido que 53% dos modelos
0.39
segundos
Mais rápido que 55% dos modelos
Mediana do Mercado
45 tok/s
133% mais rápido
TTFT Mediano
0.42s
7% mais rápido
Vazão/Dólar
604
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
1.0M
tokens
Maior que 93% dos modelos
Saída Máxima
33K
tokens
3% do contexto