Modelos Relacionados
Desempenho
331
tokens/seg
Mais rápido que 97% dos modelos
1.03
segundos
Mais rápido que 54% dos modelos
1.03
segundos
Mais rápido que 68% dos modelos
Mediana do Mercado
94 tok/s
253% mais rápido
TTFT Mediano
1.10s
6% mais rápido
Comparação de Velocidade
gpt-oss-120b (low)
327 tok/s-1%
Google: Gemini 3.1 Flash Lite Preview
324 tok/s-2%
Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)
347 tok/s+5%
Benchmarks
MMLU-Pro
29.8%
GPQA Diamond
30.6%
HLE
5.2%
LiveCodeBench
8.1%
SciCode
2.5%
TerminalBench Hard
0.8%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
8.3%
IFBench
19.5%
Long Context Recall
0.0%
Tau2
13.5%
Média do MercadoMelhor Score