Qwen: Qwen3 VL 32B Instruct

Alibaba·Lançado em 2025-10-23

Open Source32B131K ctxApache 2.0Multimodal

Comparar Testar via OpenRouter Ver no HuggingFace

Sobre

Qwen3-VL-32B-Instruct is a large-scale multimodal vision-language model designed for high-precision understanding and reasoning across text, images, and video. With 32 billion parameters, it combines deep visual perception with advanced text...

Modelos Relacionados

Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22 Qwen3.6 Max Preview2026-04-20 Qwen3.6 35B A3B (Non-reasoning)2026-04-16

Índice de Qualidade

17.2

285th de 507

Top 56%

Índice de Código

15.6

241st de 417

Top 58%

Índice de Matemática

68.3

100th de 269

Top 37%

Preço/1M

$0.18

180th mais barato

68% abaixo da mediana

Top 28%

Velocidade

75 tok/s

Top 57%

TTFT

1.13s

Janela de Contexto

131K

201st maior

Top 67%

Posição no Mercado

Qwen: Qwen3 VL 32B InstructMédia do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.42

por 1M tokens

Combinado

$0.18

por 1M tokens

Mais barato que 72% dos modelos. Preço mediano é $0.56/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.18

Mensal

$5.46

vs. Modelos Similares

DeepSeek: R1 Distill Qwen 32BQ:0.0

$0.29+59%

Z.ai: GLM 4.6VQ:-0.1

$0.45+147%

OpenAI: GPT-4oQ:+0.1

$4.38+2304%

Llama 3.1 Instruct 405BQ:+0.2

$3.69+1926%

Desempenho

75

tokens/seg

Mais rápido que 43% dos modelos

1.13

segundos

Mais rápido que 48% dos modelos

1.13

segundos

Mais rápido que 64% dos modelos

Mediana do Mercado

86 tok/s

13% mais lento

TTFT Mediano

1.07s

5% mais lento

Vazão/Dólar

412

tok/s por $/1M

Comparação de Velocidade

OpenAI: GPT-4.1 Mini

75 tok/s-1%

OpenAI: GPT-5.4

76 tok/s+1%

Olmo 3 7B Instruct

76 tok/s+1%

Janela de Contexto

131K

tokens

Maior que 33% dos modelos

Saída Máxima

33K

tokens

25% do contexto

Benchmarks

MMLU-Pro

79.1%

GPQA Diamond

67.1%

HLE

6.3%

LiveCodeBench

51.4%

SciCode

30.1%

TerminalBench Hard

8.3%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

68.3%

IFBench

39.2%

Long Context Recall

31.3%

Tau2

29.2%

Média do MercadoMelhor Score

Open Source

HuggingFace

apache-2.032BGGUF / GPTQ / AWQ

Downloads

1.5M

Curtidas

199

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

DeepSeek: R1 Distill Qwen 32B

DeepSeek

Q: 17.2$0.29/1M33K ctx

Mais lento: 43%Mais caro: 59%

Z.ai: GLM 4.6V

Z AI

Q: 17.1$0.45/1M131K ctx

Mais lento: 54%Mais caro: 147%

OpenAI: GPT-4o

OpenAI

Q: 17.3$4.38/1M128K ctx

Mais rápido: 62%Mais caro: 2304%

Llama 3.1 Instruct 405B

Posição no Mercado

Qwen: Qwen3 VL 32B InstructMédia do Mercado