Ir para o conteúdo principal
Voltar ao Blog

GPT-5.4 está na terra de ninguém: caro demais para ser barato, fraco demais para justificar o premium

O GPT-5.4 da OpenAI alcança 56.8 de qualidade a $5.63/M tokens. O Gemini 3.1 Pro quase o iguala por 20% menos. Uma análise de preços.

FindLLM7 de maio de 2026
gpt-5-4openaipricing-analysismodel-comparison

GPT-5.4 (OpenAI) ocupa uma posição desconfortável no cenário atual de modelos. Com 56.8 de qualidade e $5.63/M tokens, ele entrega marginalmente menos que a qualidade do Gemini 3.1 Pro enquanto custa 25% mais, e fica 3.4 pontos abaixo do GPT-5.5 sem oferecer economias significativas em relação a essa diferença. Para a maioria das cargas de trabalho em produção, o GPT-5.4 é o modelo que você pula.

O aperto nos preços

O problema é simples. Gemini 3.1 Pro Preview (Google) marca 57.2 de qualidade a $4.50/M tokens. O GPT-5.4 marca 56.8 a $5.63/M tokens. São 0.4 pontos a menos de qualidade por $1.13 a mais por milhão de tokens. Em qualquer cenário onde você processa volume — sumarização em lote, pipelines de RAG, classificação de documentos — esses $1.13 se acumulam em pressão real no orçamento sem nenhum ganho de qualidade.

A diferença de velocidade piora a situação. O Gemini 3.1 Pro roda a 142 tok/s contra 85 tok/s do GPT-5.4. Isso é 67% mais rápido na inferência. Para aplicações sensíveis à latência como agentes interativos ou interfaces com streaming, o Gemini completa respostas em aproximadamente 60% do tempo real.

ModeloQualidadePreço/M tokensVelocidadeCriador
GPT-5.560.2$11.2579 tok/sOpenAI
Claude Opus 4.757.3$10.0064 tok/sAnthropic
Gemini 3.1 Pro Preview57.2$4.50142 tok/sGoogle
GPT-5.456.8$5.6385 tok/sOpenAI
GPT-5.5 (medium)56.7$11.2573 tok/sOpenAI

Onde o GPT-5.4 ainda pode fazer sentido

Consigo construir um caso restrito. Se você está preso ao ecossistema de API da OpenAI — modelos fine-tunados, bibliotecas de prompts existentes, comportamento específico de function-calling — e os $11.25/M do GPT-5.5 são caros demais para seu throughput, então o GPT-5.4 é sua melhor opção dentro desse fornecedor. É o modelo mais barato da OpenAI acima de 55 de qualidade.

Isso não é irrelevante. Custos de troca de fornecedor são reais. Engenharia de prompt que explora comportamentos específicos da OpenAI (formatação de tool use, tratamento de system messages) não migra de forma limpa. Se sua equipe investiu meses ajustando prompts para o estilo de seguimento de instruções da OpenAI, pagar o premium de $1.13 sobre o Gemini pode ser mais barato do que reescrever e revalidar tudo.

Mas esse é um argumento de lock-in, não um argumento de qualidade.

Comparação de qualidade

A distância até o GPT-5.5 é real, mas cara de fechar

Subir do GPT-5.4 para o GPT-5.5 compra 3.4 pontos de qualidade a um custo de $5.62 adicionais por milhão de tokens — exatamente dobrando seu gasto. Se isso vale a pena depende inteiramente da sua tolerância a erros. Em tarefas de classificação onde o índice de qualidade correlaciona com acurácia, 3.4 pontos podem significar 2-3% menos classificações incorretas. Para um pipeline processando milhões de documentos com revisão humana posterior, essa redução na taxa de erro pode facilmente justificar o custo através de menos retrabalho.

Para geração criativa ou tarefas abertas onde diferenças de qualidade são mais difíceis de medir em produção, o salto é mais difícil de justificar.

Comparação de preços

O veredito operacional

O GPT-5.4 é um meio-termo sem lugar definido. Não ganha em preço (Gemini 3.1 Pro é mais barato e mais rápido com qualidade marginalmente superior), não ganha em qualidade (GPT-5.5 está claramente à frente), e não ganha em velocidade (142 tok/s contra 85 tok/s não é páreo). Sua única posição defensável é como opção econômica para equipes já comprometidas com o stack da OpenAI.

Se você está escolhendo do zero, o Gemini 3.1 Pro Preview domina essa faixa de preço. Se você precisa de qualidade máxima independente do custo, o GPT-5.5 é a resposta. O GPT-5.4 existe para as equipes no meio que não conseguem trocar de fornecedor e não podem dobrar sua conta de inferência.

Use o LLM Selector para filtrar pelas suas restrições reais — fornecedor, teto de orçamento, limite mínimo de qualidade — e você provavelmente vai parar em algum lugar diferente do GPT-5.4, a menos que o lock-in com a OpenAI seja um requisito inegociável.

Fique por dentro

Análise semanal de LLMs direto no seu email. Sem spam.