Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3 VL 30B A3B Instruct

Alibaba·Lançado em 2025-10-06
Open Source30B262K ctxApache 2.0Multimodal

Sobre

Qwen3-VL-30B-A3B-Instruct is a multimodal model that unifies strong text generation with visual understanding for images and videos. Its Instruct variant optimizes instruction-following for general multimodal tasks. It excels in perception...

Preços

Entrada

$0.13

por 1M tokens

Saída

$0.52

por 1M tokens

Combinado

$0.23

por 1M tokens

Mais barato que 67% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.23

Mensal

$6.83

vs. Modelos Similares

Hermes 4 - Llama-3.1 70B (Reasoning)Q:0.0
$0.20-13%
Meta: Llama 4 ScoutQ:0.0
$0.15-34%
Qwen3 14B (Reasoning)Q:+0.1
$0.73+221%
Claude 3.5 Sonnet (Oct '24)Q:-0.1
$6.00+2537%

Desempenho

120

tokens/seg

Mais rápido que 62% dos modelos

1.04

segundos

Mais rápido que 54% dos modelos

1.04

segundos

Mais rápido que 68% dos modelos

Mediana do Mercado

94 tok/s

27% mais rápido

TTFT Mediano

1.11s

6% mais rápido

Vazão/Dólar

525

tok/s por $/1M

Comparação de Velocidade

Grok 4.3 (Non-reasoning)
119 tok/s-0%
Gemini 3 Pro Preview (low)
120 tok/s+0%
Z.ai: GLM 4.7
119 tok/s-1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

33K

tokens

13% do contexto

Benchmarks

MMLU-Pro
76.4%
GPQA Diamond
69.5%
HLE
6.4%
LiveCodeBench
47.6%
SciCode
30.8%
TerminalBench Hard
6.1%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
72.3%
IFBench
33.1%
Long Context Recall
23.7%
Tau2
19.0%
Média do MercadoMelhor Score
apache-2.030BGGUF / GPTQ / AWQ
Downloads

586.4K

Curtidas

581

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos