Claude Fable 5 conquista a coroa de qualidade a $20/M, GLM 5.2 estreita a lacuna open-source
Fable 5 da Anthropic atinge 59.9 de qualidade a $20/M. GLM 5.2 alcança 51.1 em open-source a $1.46/M. Opus 4.8 substitui o 4.7 pelo mesmo preço.
Claude Fable 5 é o novo líder de qualidade — mas a que custo?
Claude Fable 5 (Anthropic) chega a 59.9 no índice de qualidade, a pontuação mais alta do mercado atualmente. Custa $20/M de tokens de entrada — quase o dobro do Claude Opus 4.8 a $10/M e quase 1.8x o GPT-5.5 a $11.25/M. Com 77 tokens por segundo, é mais rápido que ambas as variantes do Opus, mas fica atrás dos 83 tok/s do GPT-5.5.
A questão operacional: 4.2 pontos de qualidade a mais que o Opus 4.8 justificam o dobro do preço? Para pipelines onde a qualidade da saída controla os ciclos de revisão humana, sim — menos passagens de revisão podem compensar o prêmio pago nos tokens. Para workloads em lote ou inferência em alto volume, a conta não fecha tão rápido.
Opus 4.8 substitui discretamente o 4.7 pelo mesmo preço
Claude Opus 4.8 pontua 55.7 a $10/M, um aumento de 2.2 pontos em relação ao Opus 4.7 com 53.5. Mesmo preço, mesma faixa, leve ganho de velocidade (58 tok/s contra 52 tok/s). Se você estava rodando o Opus 4.7 em produção, a troca é um upgrade gratuito — sem diferença de custo, sem regressão de latência.
Contra o GPT-5.5 (54.8 a $11.25/M), o Opus 4.8 agora vence tanto em qualidade quanto em preço. A diferença é pequena (0.9 pontos), mas inverte a comparação de valor da semana passada.
| Modelo | Qualidade | Preço/1M | Velocidade |
|---|---|---|---|
| Claude Fable 5 | 59.9 | $20.00 | 77 tok/s |
| Claude Opus 4.8 | 55.7 | $10.00 | 58 tok/s |
| GPT-5.5 | 54.8 | $11.25 | 83 tok/s |
| GLM 5.2 | 51.1 | $1.46 | 139 tok/s |
GLM 5.2 é a história open-source da semana
GLM 5.2 (Z AI) atinge 51.1 de qualidade a $1.46/M — pesos abertos, e supera o GPT-5.4 (51.4) que custa 3.9x mais. Com 139 tok/s, também é mais rápido que todos os modelos fechados acima dele, exceto o Gemini 3.5 Flash. Para equipes que precisam de self-hosting ou querem previsibilidade de custo sem lock-in de API, esta é a melhor proposta de valor open-source na tabela.
DeepSeek V4 Pro continua sendo a escolha open-source econômica, com 44.3 de qualidade e $0.54/M. Mas o GLM 5.2 reduz a diferença de qualidade para 6.8 pontos por $0.92/M a mais — uma troca razoável para workloads de produção onde falhas de parser e custos de retry dominam.
O que acompanhar
- Se o preço de $20/M do Fable 5 se mantém ou se a Anthropic o repositiona para baixo conforme o Opus 4.8 canibaliza o segmento mid-premium.
- Benchmarks do GLM 5.2 em self-hosted vs. números de API — afirmações open-source precisam de confirmação independente em workloads reais.
- A resposta do GPT-5.5: o Opus 4.8 agora o supera em preço e qualidade, o que nunca havia acontecido nessa faixa.
Para uma comparação completa entre todas as faixas, veja o LLM Selector ou Explore o leaderboard.
Fique por dentro
Análise semanal de LLMs direto no seu email. Sem spam.