Qwen3.5 27B

Alibaba·Released 2026-02-24

Open Source27B262K ctxApache 2.0Multimodal

About

The Qwen3.5 27B native vision-language Dense model incorporates a linear attention mechanism, delivering fast response times while balancing inference speed and performance. Its overall capabilities are comparable to those of...

Quality Index

33.8

74th of 537

Top 14%

Coding Index

34.9

110th of 447

Top 25%

Price/1M

$0.54

339th cheapest

1% below median

Top 50%

Speed

84 tok/s

Top 57%

TTFT

1.41s

Context Window

262K

110th largest

Top 38%

Market Position

Qwen3.5 27BMarket Average

Pricing

Input

$0.20

per 1M tokens

Output

$1.56

per 1M tokens

Blended

$0.54

per 1M tokens

Cheaper than 50% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.54

Monthly

$16.09

vs. Similar Models

Z.ai: GLM 4.7Q:0.0

$0.74+38%

MiniMax: MiniMax M2.5Q:-0.1

$0.21-61%

Qwen: Qwen3.5 397B A17BQ:-0.1

$0.90+68%

Claude 4.1 Opus (Reasoning)Q:-0.1

$30.00+5494%

Performance

tokens/sec

Faster than 43% of models

1.41

seconds

Faster than 36% of models

25.25

seconds

Faster than 20% of models

Market Median

94 tok/s

11% slower

Median TTFT

1.11s

27% slower

Throughput/Dollar

156

tok/s per $/1M

Speed Comparison

DeepSeek V4 Pro (Non-reasoning)

84 tok/s-0%

DeepSeek V4 Pro

84 tok/s-0%

Mistral Medium

85 tok/s+1%

Context Window

262K

tokens

Larger than 62% of models

Max Output

66K

tokens

25% of context

Benchmarks

MMLU-ProNot evaluated

GPQA Diamond

85.8%

HLE

22.2%

LiveCodeBenchNot evaluated

SciCode

39.5%

TerminalBench Hard

32.6%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025Not evaluated

IFBench

75.6%

Long Context Recall

67.3%

Tau2

93.9%

Market AverageTop Score

Open Source

View model repository

apache-2.027BGGUF / GPTQ / AWQ

Downloads

2.6M

Likes

996

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Quick Compare

Similar Models

Z.ai: GLM 4.7

Z AI

Q: 33.8$0.74/1M203K ctx

Faster: 42%Pricier: 38%

Qwen: Qwen3.5 397B A17B

Alibaba

Q: 33.7$0.90/1M256K ctx

Slower: 38%Pricier: 68%

MiniMax: MiniMax M2.5

MiniMax

Q: 33.7$0.21/1M205K ctx

Faster: 109%Cheaper: 61%

GPT-5 (medium)

OpenAI

Q: 33.7$3.44/1M

Faster: 15%Pricier: 541%

Claude 4.1 Opus (Reasoning)

Anthropic

Q: 33.7$30.00/1M

Slower: 52%Pricier: 5494%

Hy3-preview (Reasoning)

Tencent

Q: 33.6$0.20/1M

Faster: 83%Cheaper: 63%

Compare all 7 models

Qwen3.5 27B

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position