Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3 VL 32B Instruct

Alibaba·Lançado em 2025-10-23
Open Source32B262K ctxApache 2.0Multimodal

Sobre

Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video. With 32 billion parameters, it combines deep visual perception with advanced text...

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.42

por 1M tokens

Combinado

$0.18

por 1M tokens

Mais barato que 71% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.18

Mensal

$5.46

vs. Modelos Similares

Ministral 3 14BQ:0.0
$0.20+10%
OpenAI: GPT-4oQ:+0.1
$4.38+2304%
DeepSeek R1 Distill Qwen 32BQ:-0.1
$0.29+59%
Z.ai: GLM 4.6VQ:-0.1
$0.45+147%

Desempenho

69

tokens/seg

Mais rápido que 35% dos modelos

1.13

segundos

Mais rápido que 48% dos modelos

1.13

segundos

Mais rápido que 64% dos modelos

Mediana do Mercado

94 tok/s

26% mais lento

TTFT Mediano

1.10s

3% mais lento

Vazão/Dólar

380

tok/s por $/1M

Comparação de Velocidade

Apriel-v1.6-15B-Thinker
69 tok/s-1%
GPT-5.5 (low)
69 tok/s-1%
Cohere: Command A
70 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

33K

tokens

13% do contexto

Benchmarks

MMLU-Pro
79.1%
GPQA Diamond
67.1%
HLE
6.3%
LiveCodeBench
51.4%
SciCode
30.1%
TerminalBench Hard
8.3%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
68.3%
IFBench
39.2%
Long Context Recall
31.3%
Tau2
29.2%
Média do MercadoMelhor Score
apache-2.032BGGUF / GPTQ / AWQ
Downloads

5.6M

Curtidas

207

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos