Benchmarks
MMLU-ProNão avaliado
GPQA Diamond
84.9%
HLE
10.0%
LiveCodeBenchNão avaliado
SciCode
26.6%
TerminalBench Hard
0.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
35.4%
Long Context Recall
0.0%
Tau2
21.6%
Média do MercadoMelhor Score
Open Source
apache-2.03B
Downloads
713.8K
Curtidas
1.0K
VRAM (FP16)
4-8 GB
GPU
RTX 3060 / M1