Loading...
Loading...
Qwen3-VL-8B-Instruct is a multimodal vision-language model from the Qwen3-VL series, built for high-fidelity understanding and reasoning across text, images, and video. It features improved multimodal fusion with Interleaved-MRoPE for long-horizon...
Entrada
$0.08
por 1M tokens
Saída
$0.50
por 1M tokens
Combinado
$0.18
por 1M tokens
Mais barato que 71% dos modelos. Preço mediano é $0.56/1M tokens.
Diário
$0.18
Mensal
$5.55
147
tokens/seg
Mais rápido que 77% dos modelos
0.94
segundos
Mais rápido que 58% dos modelos
0.94
segundos
Mais rápido que 70% dos modelos
Mediana do Mercado
86 tok/s
71% mais rápido
TTFT Mediano
1.07s
12% mais rápido
Vazão/Dólar
794
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
131K
tokens
Maior que 33% dos modelos
Saída Máxima
33K
tokens
25% do contexto
5.4M
897
8-16 GB
RTX 4070 / M2 Pro
Índice de Qualidade
14.3
344th de 507
Top 68%
Índice de Código
7.3
354th de 417
Top 85%
Índice de Matemática
27.3
190th de 269
Top 71%
Preço/1M
$0.18
181st mais barato
67% abaixo da mediana
Top 29%
Velocidade
147 tok/s
Top 23%
TTFT
0.94s
Janela de Contexto
131K
201st maior
Top 67%