Modelos Relacionados
Desempenho
466
tokens/seg
Mais rápido que 99% dos modelos
1.13
segundos
Mais rápido que 49% dos modelos
1.13
segundos
Mais rápido que 65% dos modelos
Mediana do Mercado
94 tok/s
398% mais rápido
TTFT Mediano
1.10s
2% mais lento
Comparação de Velocidade
Granite 3.3 8B (Non-reasoning)
464 tok/s-1%
Granite 4.0 H Small
481 tok/s+3%
LFM2.5-VL-1.6B
518 tok/s+11%
Benchmarks
MMLU-Pro
25.7%
GPQA Diamond
22.8%
HLE
5.7%
LiveCodeBench
2.0%
SciCode
2.5%
TerminalBench Hard
0.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
3.3%
IFBench
22.0%
Long Context Recall
0.0%
Tau2
12.6%
Média do MercadoMelhor Score