GPT-5.5 abre uma vantagem de 3 pontos em qualidade, Gemini 3.1 Pro oferece preço menor que todos acima dele
GPT-5.5 lidera com 60.2 em qualidade, mas custa $11.25/M tokens. Gemini 3.1 Pro iguala o Opus 4.7 pela metade do preço. Resumo semanal de LLMs para 27 de abril.
GPT-5.5 (OpenAI) agora ocupa a marca de 60.2 no índice de qualidade, 2.9 pontos acima do concorrente mais próximo. É a maior diferença no topo do ranking em semanas. Mas o movimento mais relevante está um nível abaixo, onde o Gemini 3.1 Pro Preview (Google) iguala a qualidade do Claude Opus 4.7 por menos da metade do custo.
O tier premium custa $10+ por milhão de tokens. Vale a pena?
Três modelos se agrupam acima de 57: GPT-5.5 com 60.2, Claude Opus 4.7 com 57.3 e Gemini 3.1 Pro com 57.2. Apenas um deles cobra menos de $5/M tokens.
| Modelo | Qualidade | Preço/M input | Velocidade |
|---|---|---|---|
| GPT-5.5 | 60.2 | $11.25 | 84 tok/s |
| Claude Opus 4.7 | 57.3 | $10.00 | 59 tok/s |
| Gemini 3.1 Pro Preview | 57.2 | $4.50 | 132 tok/s |
| GPT-5.4 | 56.8 | $5.63 | 85 tok/s |
O Gemini 3.1 Pro fica atrás do Opus 4.7 por apenas 0.1 ponto de qualidade, custa 55% menos e gera tokens a 132 tok/s — mais que o dobro dos 59 tok/s do Opus. Para qualquer carga de trabalho onde a latência de inferência importa e você está executando milhares de requisições, a conta é simples. O Gemini 3.1 Pro é o melhor modelo abaixo de $5/M tokens para uso geral, e não é nem de perto uma disputa acirrada.
A liderança em qualidade do GPT-5.5 é real, mas cara. A diferença de 2.9 pontos sobre o Gemini justifica o preço premium apenas quando você precisa de máxima precisão em tarefas difíceis e o custo é secundário. Para processamento em lote ou pipelines de alto volume, você está pagando 2.5x mais por token por uma melhoria de qualidade de ~5%.
O tier econômico ficou mais interessante
DeepSeek V4 Pro a $0.54/M tokens e 51.5 de qualidade continua sendo a forma mais barata de passar de 50 no índice. Kimi K2.6 a $1.72/M oferece 53.9 de qualidade com throughput de 138 tok/s, o mais rápido de toda a tabela. MiMo-V2.5-Pro (Xiaomi) se posiciona entre os dois a $1.50/M e 53.8 de qualidade, mas com apenas 66 tok/s.
Fique por dentro
Análise semanal de LLMs direto no seu email. Sem spam.