Qwen: Qwen3 VL 8B Instruct

Alibaba·Lançado em 2025-10-14

Open Source8B256K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video. It features improved multimodal fusion with Interleaved-MRoPE for long-horizon...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

8.4

374th de 537

Top 70%

Índice de Código

7.3

385th de 447

Top 86%

Índice de Matemática

27.3

190th de 269

Top 71%

Preço/1M

$0.18

196th mais barato

66% abaixo da mediana

Top 29%

Velocidade

143 tok/s

Top 30%

TTFT

0.94s

Janela de Contexto

256K

172nd maior

Top 42%

Posição no Mercado

Qwen: Qwen3 VL 8B InstructMédia do Mercado

Preços

Entrada

$0.08

por 1M tokens

Saída

$0.50

por 1M tokens

Combinado

$0.18

por 1M tokens

Mais barato que 71% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.18

Mensal

$5.55

vs. Modelos Similares

Qwen3 4B (Reasoning)Q:0.0

$0.40+115%

Llama 3.1 Instruct 405BQ:+0.1

$3.69+1894%

Claude 3.5 Sonnet (June '24)Q:-0.1

$6.00+3143%

Llama 3.3 Instruct 70BQ:+0.2

$0.61+231%

Desempenho

143

tokens/seg

Mais rápido que 70% dos modelos

0.94

segundos

Mais rápido que 58% dos modelos

0.94

segundos

Mais rápido que 71% dos modelos

Mediana do Mercado

94 tok/s

51% mais rápido

TTFT Mediano

1.11s

15% mais rápido

Vazão/Dólar

771

tok/s por $/1M

Comparação de Velocidade

Sarvam M (Reasoning)

143 tok/s-0%

GPT-5 nano (medium)

142 tok/s-0%

Google: Gemini 2.5 Pro

142 tok/s-0%

Janela de Contexto

256K

tokens

Maior que 58% dos modelos

Saída Máxima

33K

tokens

13% do contexto

Benchmarks

MMLU-Pro

68.6%

GPQA Diamond

42.7%

HLE

2.9%

LiveCodeBench

33.2%

SciCode

17.4%

TerminalBench Hard

2.3%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

27.3%

IFBench

32.3%

Long Context Recall

15.3%

Tau2

29.2%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.08BGGUF / GPTQ / AWQ

Downloads

5.2M

Curtidas

975

VRAM (FP16)

8-16 GB

GPU

RTX 4070 / M2 Pro

Comparação Rápida

Modelos Similares

Qwen3 4B (Reasoning)

Alibaba

Q: 8.4$0.40/1M

Mais lento: 27%Mais caro: 115%

Llama 3.1 Instruct 405B