Claude Mythos Preview não é um lançamento de produto — é um novo nível de acesso para IA de fronteira

O Claude Mythos Preview da Anthropic sinaliza que os modelos mais poderosos de programação e cibersegurança estão se tornando infraestrutura controlada, não produtos públicos.

FindLLM8 de abril de 2026

Anthropiccybersecuritycoding modelsmodel pricingmodel safetyAI agents

O que a Anthropic realmente lançou

Claude Mythos Preview (Anthropic) não é um lançamento de chatbot. É uma prévia de pesquisa apenas por convite, distribuída através de um programa chamado Project Glasswing, restrita a organizações que mantêm infraestrutura de software crítica. Não existe cadastro por autoatendimento. Após a fase de prévia de pesquisa, os participantes pagam $25 por milhão de tokens de entrada e $125 por milhão de tokens de saída. Para comparação, o Claude Opus 4.6 custa $5/$25 por milhão — tornando o Mythos uma camada premium 5× mais cara.

Os parceiros de lançamento são AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks e mais de 40 organizações adicionais. A Anthropic comprometeu até $100 milhões em créditos de uso e $4 milhões em doações para grupos de segurança open-source, incluindo Alpha-Omega/OpenSSF e a Apache Software Foundation. Isso é distribuição em nível de infraestrutura: parceiros verificados, remediação financiada e um compromisso público de reportar lições e correções divulgadas em até 90 dias.

O modelo em si tem uma janela de contexto de 1M de tokens e suporta até 128k tokens de saída. As restrições reforçam a postura controlada: sem uso forçado de ferramentas, sem suporte a prefill do último assistente, e execução de código limitada à API do Claude e ao Microsoft Foundry.

Por que o salto nos benchmarks importa operacionalmente

A Anthropic publicou resultados comparativos diretos contra o Opus 4.6. As diferenças não são incrementais.

Benchmark	Claude Mythos Preview	Claude Opus 4.6	Significado prático da diferença
SWE-bench Verified	93,9%	80,8%	Taxa de sucesso autônomo substancialmente maior em patches de issues reais do GitHub
SWE-bench Pro	77,8%	53,4%	Tarefas mais difíceis envolvendo múltiplos arquivos agora viáveis para pipelines de agentes
Terminal-Bench 2.0	82,0%	65,4%	Fluxos de trabalho mais robustos em terminal de longa duração
CyberGym vulnerability reproduction	83,1%	66,6%	Reprodução autônoma de vulnerabilidades mais confiável para equipes de triagem
GPQA Diamond	94,6%	91,3%	Ganho marginal em raciocínio científico de nível pós-graduação
Humanity's Last Exam (com ferramentas)	64,7%	53,1%

Fique por dentro

Análise semanal de LLMs direto no seu email. Sem spam.

Modelo	Modelo de acesso	Disponibilidade pública	Preço entrada/MTok	Preço saída/MTok	Janela de contexto	Limite de saída	Carga de trabalho ideal
Claude Mythos Preview	Apenas por convite (Project Glasswing)	Não	$25	$125	1M tokens	128k tokens	Defesa cibernética autônoma, codificação agêntica de longa duração
Claude Opus 4.6	API pública	Sim	$5 (adaptive: $10)	$25	200k tokens	—	Raciocínio complexo, agentes de codificação em produção
Claude Sonnet 4.6	API pública	Sim	$3 (adaptive: $6)	$15	200k tokens	—	Codificação de alto throughput, saída estruturada

Claude Mythos Preview não é um lançamento de produto — é um novo nível de acesso para IA de fronteira

O que a Anthropic realmente lançou

Por que o salto nos benchmarks importa operacionalmente

Fique por dentro

Uma nova camada premium, não uma substituição universal

O que os documentos de segurança revelam

O ângulo open-source e do ecossistema

Ceticismo da comunidade

O que isso significa para a maioria dos desenvolvedores