Loading...
Loading...
Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video. With 32 billion parameters, it combines deep visual perception with advanced text...
Entrada
$0.10
por 1M tokens
Saída
$0.42
por 1M tokens
Combinado
$0.18
por 1M tokens
Mais barato que 72% dos modelos. Preço mediano é $0.56/1M tokens.
Diário
$0.18
Mensal
$5.46
75
tokens/seg
Mais rápido que 43% dos modelos
1.13
segundos
Mais rápido que 48% dos modelos
1.13
segundos
Mais rápido que 64% dos modelos
Mediana do Mercado
86 tok/s
13% mais lento
TTFT Mediano
1.07s
5% mais lento
Vazão/Dólar
412
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
131K
tokens
Maior que 33% dos modelos
Saída Máxima
33K
tokens
25% do contexto
1.5M
199
24-48 GB
A6000 / M3 Ultra
Índice de Qualidade
17.2
285th de 507
Top 56%
Índice de Código
15.6
241st de 417
Top 58%
Índice de Matemática
68.3
100th de 269
Top 37%
Preço/1M
$0.18
180th mais barato
68% abaixo da mediana
Top 28%
Velocidade
75 tok/s
Top 57%
TTFT
1.13s
Janela de Contexto
131K
201st maior
Top 67%