Modelos Relacionados
Desempenho
64
tokens/seg
Mais rápido que 32% dos modelos
0.46
segundos
Mais rápido que 90% dos modelos
0.46
segundos
Mais rápido que 94% dos modelos
Mediana do Mercado
94 tok/s
31% mais lento
TTFT Mediano
1.10s
59% mais rápido
Comparação de Velocidade
Apertus 70B Instruct
64 tok/s+0%
Qwen3 14B (Non-reasoning)
64 tok/s-0%
Qwen3 235B A22B 2507 Instruct
65 tok/s+1%
Benchmarks
MMLU-Pro
37.8%
GPQA Diamond
22.9%
HLE
4.0%
LiveCodeBench
9.5%
SciCode
5.2%
TerminalBench Hard
0.8%
MATH-500
69.1%
AIME
9.0%
AIME 2025
10.3%
IFBench
22.0%
Long Context Recall
0.0%
Tau2
0.0%
Média do MercadoMelhor Score