Ir para o conteúdo principal
Voltar ao Blog

GPT-5.5 abre uma vantagem de 3 pontos em qualidade, Gemini 3.1 Pro oferece preço menor que todos acima dele

GPT-5.5 lidera com 60.2 em qualidade, mas custa $11.25/M tokens. Gemini 3.1 Pro iguala o Opus 4.7 pela metade do preço. Resumo semanal de LLMs para 27 de abril.

FindLLM27 de abril de 2026
weekly-briefinggpt-5-5gemini-3-1-propricingquality

GPT-5.5 (OpenAI) agora ocupa a marca de 60.2 no índice de qualidade, 2.9 pontos acima do concorrente mais próximo. É a maior diferença no topo do ranking em semanas. Mas o movimento mais relevante está um nível abaixo, onde o Gemini 3.1 Pro Preview (Google) iguala a qualidade do Claude Opus 4.7 por menos da metade do custo.

O tier premium custa $10+ por milhão de tokens. Vale a pena?

Três modelos se agrupam acima de 57: GPT-5.5 com 60.2, Claude Opus 4.7 com 57.3 e Gemini 3.1 Pro com 57.2. Apenas um deles cobra menos de $5/M tokens.

ModeloQualidadePreço/M inputVelocidade
GPT-5.560.2$11.2584 tok/s
Claude Opus 4.757.3$10.0059 tok/s
Gemini 3.1 Pro Preview57.2$4.50132 tok/s
GPT-5.456.8$5.6385 tok/s

O Gemini 3.1 Pro fica atrás do Opus 4.7 por apenas 0.1 ponto de qualidade, custa 55% menos e gera tokens a 132 tok/s — mais que o dobro dos 59 tok/s do Opus. Para qualquer carga de trabalho onde a latência de inferência importa e você está executando milhares de requisições, a conta é simples. O Gemini 3.1 Pro é o melhor modelo abaixo de $5/M tokens para uso geral, e não é nem de perto uma disputa acirrada.

A liderança em qualidade do GPT-5.5 é real, mas cara. A diferença de 2.9 pontos sobre o Gemini justifica o preço premium apenas quando você precisa de máxima precisão em tarefas difíceis e o custo é secundário. Para processamento em lote ou pipelines de alto volume, você está pagando 2.5x mais por token por uma melhoria de qualidade de ~5%.

Comparação de qualidade

O tier econômico ficou mais interessante

DeepSeek V4 Pro a $0.54/M tokens e 51.5 de qualidade continua sendo a forma mais barata de passar de 50 no índice. Kimi K2.6 a $1.72/M oferece 53.9 de qualidade com throughput de 138 tok/s, o mais rápido de toda a tabela. MiMo-V2.5-Pro (Xiaomi) se posiciona entre os dois a $1.50/M e 53.8 de qualidade, mas com apenas 66 tok/s.

Se você está otimizando custo por ponto de qualidade, o DeepSeek V4 Pro vence com aproximadamente $0.01 por ponto de qualidade por milhão de tokens. O Kimi K2.6 é a escolha quando você precisa de velocidade e qualidade abaixo de $2/M — seu throughput de 138 tok/s significa ciclos de iteração mais rápidos e menor tempo total em cadeias sequenciais.

Comparação de preço

Os tiers de raciocínio do GPT-5.5 não justificam o custo extra

GPT-5.5 (high) pontua 58.9 e GPT-5.5 (medium) pontua 56.7, ambos ao mesmo preço de $11.25/M. O GPT-5.5 padrão com 60.2 supera os dois. A menos que a OpenAI ajuste os preços por tier, não há motivo para usar as variantes com restrições.

O que acompanhar

  • Gemini 3.1 Pro ainda está marcado como "Preview." Preço e velocidade podem mudar no lançamento oficial (GA). Se o Google mantiver os $4.50/M, ele se torna a recomendação padrão para a maioria das cargas de trabalho em produção.
  • Qwen3.6 Max Preview (Alibaba) registra 51.8 de qualidade, mas apenas 34 tok/s. Vale acompanhar se a versão final resolve o throughput.
  • Muse Spark (Meta) com 52.1 de qualidade é open source, ainda sem dados de preço ou velocidade. Se for lançado com throughput competitivo, o tier open source ganha um concorrente de peso.

Escolha seu tradeoff com o LLM Selector ou navegue pelo ranking completo em Explore.

Fique por dentro

Análise semanal de LLMs direto no seu email. Sem spam.