Ir para o conteúdo principal
Voltar para Explorar

Qwen3.5 0.8B

Alibaba·Lançado em 2026-02-28
Open Source800MApache 2.0

Preços

Entrada

$0.01

por 1M tokens

Saída

$0.05

por 1M tokens

Combinado

$0.02

por 1M tokens

Mais barato que 92% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.02

Mensal

$0.60

vs. Modelos Similares

Jamba 1.6 LargeQ:0.0
$3.50+17400%
Jamba 1.5 LargeQ:+0.1
$3.50+17400%
Nous: Hermes 3 70B InstructQ:+0.1
$0.70+3400%
Qwen3 8B (Non-reasoning)Q:+0.1
$0.18+825%

Desempenho

29

tokens/seg

Mais rápido que 2% dos modelos

0.45

segundos

Mais rápido que 91% dos modelos

70.50

segundos

Mais rápido que 4% dos modelos

Mediana do Mercado

94 tok/s

70% mais lento

TTFT Mediano

1.10s

59% mais rápido

Vazão/Dólar

1428

tok/s por $/1M

Comparação de Velocidade

Qwen3.5 0.8B (Non-reasoning)
29 tok/s+0%
Nous: Hermes 3 70B Instruct
29 tok/s+2%
Qwen3.5 2B
28 tok/s-3%

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
11.1%
HLE
1.2%
LiveCodeBenchNão avaliado
SciCode
0.0%
TerminalBench Hard
0.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
21.5%
Long Context Recall
5.3%
Tau2
47.7%
Média do MercadoMelhor Score
apache-2.01B
Downloads

2.5M

Curtidas

598

VRAM (FP16)

4-8 GB

GPU

RTX 3060 / M1

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos