DeepSeek R1 Distill Qwen 32B
Sobre
DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new...
Modelos Relacionados
Preços
Entrada
$0.29
por 1M tokens
Saída
$0.29
por 1M tokens
Combinado
$0.29
por 1M tokens
Mais barato que 63% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Diário
$0.29
Mensal
$8.70
vs. Modelos Similares
Desempenho
43
tokens/seg
Mais rápido que 9% dos modelos
0.45
segundos
Mais rápido que 91% dos modelos
47.11
segundos
Mais rápido que 7% dos modelos
Mediana do Mercado
94 tok/s
55% mais lento
TTFT Mediano
1.11s
60% mais rápido
Vazão/Dólar
148
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
128K
tokens
Maior que 16% dos modelos
Saída Máxima
33K
tokens
26% do contexto
Benchmarks
Open Source
843.8K
1.6K
24-48 GB
A6000 / M3 Ultra