Loading...
Loading...
The Qwen3.5 Series 35B-A3B is a native vision-language model designed with a hybrid architecture that integrates linear attention mechanisms and a sparse mixture-of-experts model, achieving higher inference efficiency. Its overall...
Entrada
$0.14
por 1M tokens
Saída
$1.00
por 1M tokens
Combinado
$0.35
por 1M tokens
Mais barato que 59% dos modelos. Preço mediano é $0.56/1M tokens.
Diário
$0.35
Mensal
$10.65
126
tokens/seg
Mais rápido que 69% dos modelos
1.17
segundos
Mais rápido que 44% dos modelos
16.99
segundos
Mais rápido que 29% dos modelos
Mediana do Mercado
86 tok/s
47% mais rápido
TTFT Mediano
1.07s
9% mais lento
Vazão/Dólar
356
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
262K
tokens
Maior que 66% dos modelos
Saída Máxima
82K
tokens
31% do contexto
3.4M
1.4K
48-80 GB
A100 80GB
Índice de Qualidade
37.1
95th de 507
Top 19%
Índice de Código
30.3
117th de 417
Top 28%
Preço/1M
$0.35
260th mais barato
37% abaixo da mediana
Top 41%
Velocidade
126 tok/s
Top 31%
TTFT
1.17s
Janela de Contexto
262K
91st maior
Top 34%