Ir para o conteúdo principal
Voltar para Explorar

Qwen: Qwen3.5 397B A17B

Alibaba·Lançado em 2026-02-16
Open Source397B256K ctxApache 2.0Multimodal

Sobre

The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers...

Preços

Entrada

$0.39

por 1M tokens

Saída

$2.45

por 1M tokens

Combinado

$0.90

por 1M tokens

Mais barato que 37% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.90

Mensal

$27.04

vs. Modelos Similares

MiniMax: MiniMax M2.5Q:0.0
$0.21-77%
Claude 4.1 Opus (Reasoning)Q:0.0
$30.00+3229%
GPT-5 (medium)Q:0.0
$3.44+281%
Qwen: Qwen3.5-27BQ:+0.1
$0.54-40%

Desempenho

52

tokens/seg

Mais rápido que 18% dos modelos

1.68

segundos

Mais rápido que 30% dos modelos

63.15

segundos

Mais rápido que 4% dos modelos

Mediana do Mercado

94 tok/s

45% mais lento

TTFT Mediano

1.11s

51% mais lento

Vazão/Dólar

58

tok/s por $/1M

Comparação de Velocidade

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)
52 tok/s-0%
Claude 4.5 Sonnet (Reasoning)
52 tok/s-0%
Ling-flash-2.0
52 tok/s+0%

Janela de Contexto

256K

tokens

Maior que 58% dos modelos

Saída Máxima

64K

tokens

25% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
89.3%
HLE
27.3%
LiveCodeBenchNão avaliado
SciCode
42.0%
TerminalBench Hard
40.9%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
78.8%
Long Context Recall
65.7%
Tau2
95.6%
Média do MercadoMelhor Score
apache-2.0397BGGUF / GPTQ / AWQ
Downloads

590.0K

Curtidas

1.5K

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos