Qwen: Qwen3.5 397B A17B

Alibaba·Lançado em 2026-02-16

Open Source397B256K ctxApache 2.0Multimodal

Comparar Testar modelo Ver repositório do modelo

Sobre

The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers...

Modelos Relacionados

Qwen: Qwen3.7 Plus2026-06-03 Qwen: Qwen3.7 Max2026-05-21 Qwen: Qwen3.6 27B2026-04-27 Qwen: Qwen3.6 35B A3B2026-04-27 Qwen: Qwen3.5 Plus 2026-04-202026-04-27 Qwen: Qwen3.6 Flash2026-04-27 Qwen: Qwen3.6 Max Preview2026-04-27 Qwen3.6 27B (Non-reasoning)2026-04-22

Índice de Qualidade

33.7

76th de 537

Top 15%

Índice de Código

48.2

37th de 447

Top 8%

Preço/1M

$0.90

427th mais barato

66% acima da mediana

Top 63%

Velocidade

52 tok/s

Top 82%

TTFT

1.68s

Janela de Contexto

256K

172nd maior

Top 42%

Posição no Mercado

Qwen: Qwen3.5 397B A17BMédia do Mercado

Preços

Entrada

$0.39

por 1M tokens

Saída

$2.45

por 1M tokens

Combinado

$0.90

por 1M tokens

Mais barato que 37% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.90

Mensal

$27.04

vs. Modelos Similares

MiniMax: MiniMax M2.5Q:0.0

$0.21-77%

Claude 4.1 Opus (Reasoning)Q:0.0

$30.00+3229%

GPT-5 (medium)Q:0.0

$3.44+281%

Qwen: Qwen3.5-27BQ:+0.1

$0.54-40%

Desempenho

tokens/seg

Mais rápido que 18% dos modelos

1.68

segundos

Mais rápido que 30% dos modelos

63.15

segundos

Mais rápido que 4% dos modelos

Mediana do Mercado

94 tok/s

45% mais lento

TTFT Mediano

1.11s

51% mais lento

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

52 tok/s-0%

Claude 4.5 Sonnet (Reasoning)

52 tok/s-0%

Ling-flash-2.0

52 tok/s+0%

Janela de Contexto

256K

tokens

Maior que 58% dos modelos

Saída Máxima

64K

tokens

25% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

89.3%

HLE

27.3%

LiveCodeBenchNão avaliado

SciCode

42.0%

TerminalBench Hard

40.9%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

78.8%

Long Context Recall

65.7%

Tau2

95.6%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.0397BGGUF / GPTQ / AWQ

Downloads

590.0K

Curtidas

1.5K

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

MiniMax: MiniMax M2.5

MiniMax

Q: 33.7$0.21/1M205K ctx

Mais rápido: 238%Mais barato: 77%

GPT-5 (medium)

OpenAI

Q: 33.7$3.44/1M

Mais rápido: 87%Mais caro: 281%

Claude 4.1 Opus (Reasoning)

Anthropic

Q: 33.7$30.00/1M

Mais lento: 23%Mais caro: 3229%

Qwen: Qwen3.5-27B

Alibaba

Q: 33.8$0.54/1M262K ctx

Mais rápido: 62%Mais barato: 40%

Z.ai: GLM 4.7

Z AI

Q: 33.8$0.74/1M203K ctx

Mais rápido: 129%Mais barato: 18%

Hy3-preview (Reasoning)

Tencent

Q: 33.6$0.20/1M

Mais rápido: 196%Mais barato: 78%

Comparar todos os 7 modelos