Modelos Relacionados
Desempenho
40
tokens/seg
Mais rápido que 9% dos modelos
0.73
segundos
Mais rápido que 69% dos modelos
0.73
segundos
Mais rápido que 78% dos modelos
Mediana do Mercado
94 tok/s
57% mais lento
TTFT Mediano
1.10s
34% mais rápido
Comparação de Velocidade
Devstral Small (Jul '25)
40 tok/s+0%
Hermes 4 - Llama-3.1 405B (Non-reasoning)
40 tok/s-0%
Qwen3.5 4B (Non-reasoning)
40 tok/s-1%
Benchmarks
MMLU-Pro
76.2%
GPQA Diamond
59.4%
HLE
3.6%
LiveCodeBench
44.8%
SciCode
33.1%
TerminalBench Hard
18.9%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
36.7%
IFBench
38.1%
Long Context Recall
30.0%
Tau2
24.9%
Média do MercadoMelhor Score