GPT-5.5 assume a coroa de qualidade por $11.25, mas a verdadeira ação está na parte de baixo da tabela
GPT-5.5 lidera qualidade com 60.2, mas custa 8x mais que o Kimi K2.6. O briefing desta semana analisa quem deveria se importar.
O panorama geral
GPT-5.5 (OpenAI) agora ocupa o topo com 60.2 no índice de qualidade, a maior pontuação do ranking. Custa $11.25/M tokens e gera saída a 69 tok/s. Se essa diferença de qualidade justifica o preço depende inteiramente da sua carga de trabalho, porque três modelos abaixo de $2/M tokens estão se agrupando em torno de 53-54 de qualidade e se aproximando rapidamente.
GPT-5.5: líder em qualidade, outlier em preço
O novo modelo topo de linha da OpenAI abre uma vantagem de 2.9 pontos de qualidade sobre o Claude Opus 4.7 (57.3) e 3.0 pontos sobre o Gemini 3.1 Pro Preview (57.2). Isso é significativo. Mas o preço conta outra história: $11.25/M tokens o coloca em 2.5x o custo do Gemini 3.1 Pro ($4.50) e quase 8x o do Kimi K2.6 ($1.44).
As três variantes do GPT-5.5 são intrigantes. O modo de esforço "high" pontua menos (58.9) que o padrão (60.2), e o "medium" cai para 56.7, todos pelo mesmo preço de $11.25. Se você está pagando premium, fique com a configuração padrão.
| Modelo | Qualidade | Preço/M | Velocidade | Open source |
|---|---|---|---|---|
| GPT-5.5 | 60.2 | $11.25 | 69 tok/s | Não |
| Claude Opus 4.7 | 57.3 | $10.00 | 61 tok/s | Não |
| Gemini 3.1 Pro | 57.2 | $4.50 | 127 tok/s | Não |
| Kimi K2.6 | 53.9 | $1.44 | 41 tok/s | Sim |
| Grok 4.3 | 53.2 | $1.56 | 91 tok/s | Não |
A faixa sub-$2 está ficando lotada e competitiva
Kimi K2.6 (MoonshotAI) com 53.9 de qualidade por $1.44/M tokens, Grok 4.3 (xAI) com 53.2 por $1.56, e MiMo-V2.5-Pro (Xiaomi) com 53.8 por $1.50 estão todos dentro de um ponto de qualidade entre si. Para processamento em lote, pipelines de RAG, ou qualquer carga de trabalho onde retentativas dominam o custo, esses modelos entregam aproximadamente 90% da qualidade do GPT-5.4 por 25-27% do seu preço.
Fique por dentro
Análise semanal de LLMs direto no seu email. Sem spam.