Loading...
Loading...
DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new...
Entrada
$0.29
por 1M tokens
Saída
$0.29
por 1M tokens
Combinado
$0.29
por 1M tokens
Mais barato que 63% dos modelos. Preço mediano é $0.56/1M tokens.
Diário
$0.29
Mensal
$8.70
43
tokens/seg
Mais rápido que 12% dos modelos
0.45
segundos
Mais rápido que 88% dos modelos
47.11
segundos
Mais rápido que 9% dos modelos
Mediana do Mercado
86 tok/s
50% mais lento
TTFT Mediano
1.07s
58% mais rápido
Vazão/Dólar
148
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
33K
tokens
Maior que 8% dos modelos
Saída Máxima
33K
tokens
100% do contexto
932.0K
1.6K
24-48 GB
A6000 / M3 Ultra
Índice de Qualidade
17.2
285th de 507
Top 56%
Índice de Matemática
63.0
111th de 269
Top 41%
Preço/1M
$0.29
234th mais barato
48% abaixo da mediana
Top 37%
Velocidade
43 tok/s
Top 88%
TTFT
0.45s
Janela de Contexto
33K
353rd maior
Top 92%