Qwen: Qwen3 VL 32B Instruct
Sobre
Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video. With 32 billion parameters, it combines deep visual perception with advanced text...
Modelos Relacionados
Preços
Entrada
$0.10
por 1M tokens
Saída
$0.42
por 1M tokens
Combinado
$0.18
por 1M tokens
Mais barato que 71% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Diário
$0.18
Mensal
$5.46
vs. Modelos Similares
Desempenho
69
tokens/seg
Mais rápido que 35% dos modelos
1.13
segundos
Mais rápido que 48% dos modelos
1.13
segundos
Mais rápido que 64% dos modelos
Mediana do Mercado
94 tok/s
26% mais lento
TTFT Mediano
1.10s
3% mais lento
Vazão/Dólar
380
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 62% dos modelos
Saída Máxima
33K
tokens
13% do contexto
Benchmarks
Open Source
5.6M
207
24-48 GB
A6000 / M3 Ultra