Desempenho
188
tokens/seg
Mais rápido que 87% dos modelos
0.18
segundos
Mais rápido que 99% dos modelos
10.82
segundos
Mais rápido que 38% dos modelos
Mediana do Mercado
92 tok/s
105% mais rápido
TTFT Mediano
1.13s
84% mais rápido
Comparação de Velocidade
OpenAI: GPT-5.1-Codex
187 tok/s-1%
Gemini 3 Flash Preview (Non-reasoning)
191 tok/s+1%
NVIDIA Nemotron 3 Super 120B A12B (Reasoning)
185 tok/s-2%
Benchmarks
MMLU-ProNão avaliado
GPQA Diamond
75.7%
HLE
9.9%
LiveCodeBenchNão avaliado
SciCode
38.2%
TerminalBench Hard
31.1%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
57.6%
Long Context Recall
32.3%
Tau2
37.4%
Média do MercadoMelhor Score