Qwen: Qwen3.5 397B A17B
Sobre
The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers...
Modelos Relacionados
Preços
Entrada
$0.39
por 1M tokens
Saída
$2.45
por 1M tokens
Combinado
$0.90
por 1M tokens
Mais barato que 37% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Diário
$0.90
Mensal
$27.04
vs. Modelos Similares
Desempenho
52
tokens/seg
Mais rápido que 18% dos modelos
1.68
segundos
Mais rápido que 30% dos modelos
63.15
segundos
Mais rápido que 4% dos modelos
Mediana do Mercado
94 tok/s
45% mais lento
TTFT Mediano
1.11s
51% mais lento
Vazão/Dólar
58
tok/s por $/1M
Comparação de Velocidade
Janela de Contexto
256K
tokens
Maior que 58% dos modelos
Saída Máxima
64K
tokens
25% do contexto
Benchmarks
Open Source
590.0K
1.5K
Multi-GPU
8x A100 / H100