Modelos Relacionados
Desempenho
131
tokens/seg
Mais rápido que 67% dos modelos
0.42
segundos
Mais rápido que 94% dos modelos
0.42
segundos
Mais rápido que 96% dos modelos
Mediana do Mercado
94 tok/s
40% mais rápido
TTFT Mediano
1.10s
62% mais rápido
Comparação de Velocidade
Nova 2.0 Pro Preview (low)
131 tok/s+0%
Qwen3 VL 8B (Reasoning)
131 tok/s-0%
MoonshotAI: Kimi K2 Thinking
131 tok/s-0%
Benchmarks
MMLU-ProNão avaliado
GPQA Diamond
42.5%
HLE
4.4%
LiveCodeBenchNão avaliado
SciCode
13.3%
TerminalBench Hard
0.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
26.9%
Long Context Recall
0.0%
Tau2
0.0%
Média do MercadoMelhor Score
Open Source
apache-2.08BGGUF / GPTQ / AWQ
Downloads
680.0K
Curtidas
189
VRAM (FP16)
8-16 GB
GPU
RTX 4070 / M2 Pro