Modelos Relacionados
Desempenho
143
tokens/seg
Mais rápido que 70% dos modelos
1.13
segundos
Mais rápido que 49% dos modelos
15.16
segundos
Mais rápido que 32% dos modelos
Mediana do Mercado
94 tok/s
51% mais rápido
TTFT Mediano
1.11s
1% mais lento
Comparação de Velocidade
GPT-5 nano (medium)
142 tok/s-0%
Google: Gemini 2.5 Pro
142 tok/s-0%
Qwen: Qwen3 VL 8B Instruct
143 tok/s+0%
Benchmarks
MMLU-Pro
69.6%
GPQA Diamond
41.6%
HLE
3.3%
LiveCodeBench
29.5%
SciCode
17.8%
TerminalBench Hard
2.3%
MATH-500
84.7%
AIME
20.3%
AIME 2025Não avaliado
IFBench
31.8%
Long Context Recall
0.0%
Tau2
0.0%
Média do MercadoMelhor Score