Modelos Relacionados
Desempenho
69
tokens/seg
Mais rápido que 34% dos modelos
0.20
segundos
Mais rápido que 99% dos modelos
29.24
segundos
Mais rápido que 16% dos modelos
Mediana do Mercado
94 tok/s
26% mais lento
TTFT Mediano
1.10s
82% mais rápido
Comparação de Velocidade
GPT-5.5 (low)
69 tok/s-0%
Qwen: Qwen3 VL 32B Instruct
69 tok/s+1%
Grok Build 0.1 0616
68 tok/s-1%
Benchmarks
MMLU-Pro
79.0%
GPQA Diamond
73.3%
HLE
9.8%
LiveCodeBench
80.7%
SciCode
37.3%
TerminalBench Hard
14.4%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
88.0%
IFBench
69.1%
Long Context Recall
50.3%
Tau2
69.3%
Média do MercadoMelhor Score