GPT-5.4 está na terra de ninguém: caro demais para ser barato, fraco demais para justificar o premium
O GPT-5.4 da OpenAI alcança 56.8 de qualidade a $5.63/M tokens. O Gemini 3.1 Pro quase o iguala por 20% menos. Uma análise de preços.
GPT-5.4 (OpenAI) ocupa uma posição desconfortável no cenário atual de modelos. Com 56.8 de qualidade e $5.63/M tokens, ele entrega marginalmente menos que a qualidade do Gemini 3.1 Pro enquanto custa 25% mais, e fica 3.4 pontos abaixo do GPT-5.5 sem oferecer economias significativas em relação a essa diferença. Para a maioria das cargas de trabalho em produção, o GPT-5.4 é o modelo que você pula.
O aperto nos preços
O problema é simples. Gemini 3.1 Pro Preview (Google) marca 57.2 de qualidade a $4.50/M tokens. O GPT-5.4 marca 56.8 a $5.63/M tokens. São 0.4 pontos a menos de qualidade por $1.13 a mais por milhão de tokens. Em qualquer cenário onde você processa volume — sumarização em lote, pipelines de RAG, classificação de documentos — esses $1.13 se acumulam em pressão real no orçamento sem nenhum ganho de qualidade.
A diferença de velocidade piora a situação. O Gemini 3.1 Pro roda a 142 tok/s contra 85 tok/s do GPT-5.4. Isso é 67% mais rápido na inferência. Para aplicações sensíveis à latência como agentes interativos ou interfaces com streaming, o Gemini completa respostas em aproximadamente 60% do tempo real.
| Modelo | Qualidade | Preço/M tokens | Velocidade | Criador |
|---|---|---|---|---|
| GPT-5.5 | 60.2 | $11.25 | 79 tok/s | OpenAI |
| Claude Opus 4.7 | 57.3 | $10.00 | 64 tok/s | Anthropic |
| Gemini 3.1 Pro Preview | 57.2 | $4.50 | 142 tok/s | |
| GPT-5.4 | 56.8 | $5.63 | 85 tok/s | OpenAI |
| GPT-5.5 (medium) | 56.7 | $11.25 | 73 tok/s | OpenAI |
Onde o GPT-5.4 ainda pode fazer sentido
Consigo construir um caso restrito. Se você está preso ao ecossistema de API da OpenAI — modelos fine-tunados, bibliotecas de prompts existentes, comportamento específico de function-calling — e os $11.25/M do GPT-5.5 são caros demais para seu throughput, então o GPT-5.4 é sua melhor opção dentro desse fornecedor. É o modelo mais barato da OpenAI acima de 55 de qualidade.
Isso não é irrelevante. Custos de troca de fornecedor são reais. Engenharia de prompt que explora comportamentos específicos da OpenAI (formatação de tool use, tratamento de system messages) não migra de forma limpa. Se sua equipe investiu meses ajustando prompts para o estilo de seguimento de instruções da OpenAI, pagar o premium de $1.13 sobre o Gemini pode ser mais barato do que reescrever e revalidar tudo.
Fique por dentro
Análise semanal de LLMs direto no seu email. Sem spam.