Qwen: Qwen3 VL 30B A3B Instruct

Alibaba·Lançado em 2025-10-06

Open Source30B262K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

Qwen3-VL-30B-A3B-Instruct is a multimodal model that unifies strong text generation with visual understanding for images and videos. Its Instruct variant optimizes instruction-following for general multimodal tasks. It excels in perception...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

10.0

326th de 537

Top 61%

Índice de Código

14.3

291st de 447

Top 65%

Índice de Matemática

72.3

90th de 269

Top 34%

Preço/1M

$0.23

223rd mais barato

58% abaixo da mediana

Top 33%

Velocidade

120 tok/s

Top 38%

TTFT

1.04s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

Qwen: Qwen3 VL 30B A3B InstructMédia do Mercado

Preços

Entrada

$0.13

por 1M tokens

Saída

$0.52

por 1M tokens

Combinado

$0.23

por 1M tokens

Mais barato que 67% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.23

Mensal

$6.83

vs. Modelos Similares

Hermes 4 - Llama-3.1 70B (Reasoning)Q:0.0

$0.20-13%

Meta: Llama 4 ScoutQ:0.0

$0.15-34%

Qwen3 14B (Reasoning)Q:+0.1

$0.73+221%

Claude 3.5 Sonnet (Oct '24)Q:-0.1

$6.00+2537%

Desempenho

120

tokens/seg

Mais rápido que 62% dos modelos

1.04

segundos

Mais rápido que 54% dos modelos

1.04

segundos

Mais rápido que 68% dos modelos

Mediana do Mercado

94 tok/s

27% mais rápido

TTFT Mediano

1.11s

6% mais rápido

Vazão/Dólar

525

tok/s por $/1M

Comparação de Velocidade

Grok 4.3 (Non-reasoning)

119 tok/s-0%

Gemini 3 Pro Preview (low)

120 tok/s+0%

Z.ai: GLM 4.7

119 tok/s-1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

33K

tokens

13% do contexto

Benchmarks

MMLU-Pro

76.4%

GPQA Diamond

69.5%

HLE

6.4%

LiveCodeBench

47.6%

SciCode

30.8%

TerminalBench Hard

6.1%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

72.3%

IFBench

33.1%

Long Context Recall

23.7%

Tau2

19.0%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.030BGGUF / GPTQ / AWQ

Downloads

586.4K

Curtidas

581

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Meta: Llama 4 Scout