Ir para o conteúdo principal
Voltar para Explorar

Qwen3.5 4B

Alibaba·Lançado em 2026-02-27
Open Source4BApache 2.0

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 88% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.06

Mensal

$1.80

vs. Modelos Similares

DeepSeek: R1Q:0.0
$1.15+1817%
Gemini 2.5 Flash (Reasoning)Q:0.0
$0.85+1317%
Gemma 4 26B A4B (Non-reasoning)Q:0.0
$0.20+230%
Qwen3.5 9B (Non-reasoning)Q:+0.2
$0.08+33%

Desempenho

25

tokens/seg

Mais rápido que 1% dos modelos

0.45

segundos

Mais rápido que 92% dos modelos

81.83

segundos

Mais rápido que 2% dos modelos

Mediana do Mercado

94 tok/s

74% mais lento

TTFT Mediano

1.10s

60% mais rápido

Vazão/Dólar

410

tok/s por $/1M

Comparação de Velocidade

ERNIE 4.5 300B A47B
24 tok/s-4%
MoonshotAI: Kimi K2 0905
26 tok/s+4%
Gemma 3 12B Instruct
26 tok/s+6%

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
77.1%
HLE
7.8%
LiveCodeBenchNão avaliado
SciCode
16.1%
TerminalBench Hard
18.2%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
52.0%
Long Context Recall
55.7%
Tau2
92.1%
Média do MercadoMelhor Score
apache-2.04B
Downloads

9.2M

Curtidas

694

VRAM (FP16)

8-16 GB

GPU

RTX 4070 / M2 Pro

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos