Modelos Relacionados
Desempenho
42
tokens/seg
Mais rápido que 10% dos modelos
0.57
segundos
Mais rápido que 80% dos modelos
0.57
segundos
Mais rápido que 86% dos modelos
Mediana do Mercado
94 tok/s
55% mais lento
TTFT Mediano
1.10s
48% mais rápido
Comparação de Velocidade
Hermes 4 - Llama-3.1 405B (Reasoning)
42 tok/s+0%
MoonshotAI: Kimi K2.6
42 tok/s+0%
MiMo-V2-Pro
43 tok/s+1%
Benchmarks
MMLU-Pro
67.8%
GPQA Diamond
53.2%
HLE
3.4%
LiveCodeBench
34.8%
SciCode
28.8%
TerminalBench Hard
16.7%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
34.3%
IFBench
31.2%
Long Context Recall
24.0%
Tau2
23.4%
Média do MercadoMelhor Score