Qwen: Qwen3.5 397B A17B

Alibaba·Released 2026-02-16

Open Source397B256K ctxApache 2.0Multimodal

About

The Qwen3.5 series 397B-A17B native vision-language model is built on a hybrid architecture that integrates a linear attention mechanism with a sparse mixture-of-experts model, achieving higher inference efficiency. It delivers...

Quality Index

33.7

76th of 537

Top 15%

Coding Index

48.2

37th of 447

Top 8%

Price/1M

$0.90

427th cheapest

66% above median

Top 63%

Speed

52 tok/s

Top 82%

TTFT

1.68s

Context Window

256K

172nd largest

Top 42%

Market Position

Qwen: Qwen3.5 397B A17BMarket Average

Pricing

Input

$0.39

per 1M tokens

Output

$2.45

per 1M tokens

Blended

$0.90

per 1M tokens

Cheaper than 37% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.90

Monthly

$27.04

vs. Similar Models

MiniMax: MiniMax M2.5Q:0.0

$0.21-77%

Claude 4.1 Opus (Reasoning)Q:0.0

$30.00+3229%

GPT-5 (medium)Q:0.0

$3.44+281%

Qwen: Qwen3.5-27BQ:+0.1

$0.54-40%

Performance

tokens/sec

Faster than 18% of models

1.68

seconds

Faster than 30% of models

63.15

seconds

Faster than 4% of models

Market Median

94 tok/s

45% slower

Median TTFT

1.11s

51% slower

Throughput/Dollar

tok/s per $/1M

Speed Comparison

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

52 tok/s-0%

Claude 4.5 Sonnet (Reasoning)

52 tok/s-0%

Ling-flash-2.0

52 tok/s+0%

Context Window

256K

tokens

Larger than 58% of models

Max Output

64K

tokens

25% of context

Benchmarks

MMLU-ProNot evaluated

GPQA Diamond

89.3%

HLE

27.3%

LiveCodeBenchNot evaluated

SciCode

42.0%

TerminalBench Hard

40.9%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025Not evaluated

IFBench

78.8%

Long Context Recall

65.7%

Tau2

95.6%

Market AverageTop Score

Open Source

View model repository

apache-2.0397BGGUF / GPTQ / AWQ

Downloads

590.0K

Likes

1.5K

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Quick Compare

Similar Models

MiniMax: MiniMax M2.5

MiniMax

Q: 33.7$0.21/1M205K ctx

Faster: 238%Cheaper: 77%

GPT-5 (medium)

OpenAI

Q: 33.7$3.44/1M

Faster: 87%Pricier: 281%

Claude 4.1 Opus (Reasoning)

Anthropic

Q: 33.7$30.00/1M

Slower: 23%Pricier: 3229%

Qwen: Qwen3.5-27B

Alibaba

Q: 33.8$0.54/1M262K ctx

Faster: 62%Cheaper: 40%

Z.ai: GLM 4.7

Z AI

Q: 33.8$0.74/1M203K ctx

Faster: 129%Cheaper: 18%

Hy3-preview (Reasoning)

Tencent

Q: 33.6$0.20/1M

Faster: 196%Cheaper: 78%

Compare all 7 models

Qwen: Qwen3.5 397B A17B

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position