Qwen: Qwen3.5-27B
Sobre
The Qwen3.5 27B native vision-language Dense model incorporates a linear attention mechanism, delivering fast response times while balancing inference speed and performance. Its overall capabilities are comparable to those of...
Modelos Relacionados
Preços
Entrada
$0.20
por 1M tokens
Saída
$1.56
por 1M tokens
Combinado
$0.54
por 1M tokens
Mais barato que 50% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Diário
$0.54
Mensal
$16.09
vs. Modelos Similares
Desempenho
83
tokens/seg
Mais rápido que 43% dos modelos
1.45
segundos
Mais rápido que 35% dos modelos
25.52
segundos
Mais rápido que 19% dos modelos
Mediana do Mercado
94 tok/s
11% mais lento
TTFT Mediano
1.10s
31% mais lento
Vazão/Dólar
155
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 62% dos modelos
Saída Máxima
66K
tokens
25% do contexto
Benchmarks
Open Source
2.6M
994
24-48 GB
A6000 / M3 Ultra