Z.ai: GLM 4.6V

Z AI·Released 2025-12-08

Open Source131K ctxMultimodal

About

GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media. It supports up to 128K tokens, processes complex page layouts...

Quality Index

17.1

287th of 507

Top 57%

Coding Index

11.1

304th of 417

Top 73%

Math Index

26.3

194th of 269

Top 72%

Price/1M

$0.45

294th cheapest

20% below median

Top 46%

Speed

34 tok/s

Top 94%

TTFT

9.03s

Context Window

131K

201st largest

Top 67%

Market Position

Z.ai: GLM 4.6VMarket Average

Pricing

Input

$0.30

per 1M tokens

Output

$0.90

per 1M tokens

Blended

$0.45

per 1M tokens

Cheaper than 54% of models. Median price is $0.56/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.45

Monthly

$13.50

vs. Similar Models

Qwen: Qwen3 VL 32B InstructQ:+0.1

$0.18-60%

DeepSeek: R1 Distill Qwen 32BQ:+0.1

$0.29-36%

Qwen3 235B A22B (Non-reasoning)Q:-0.1

$0.79+75%

OpenAI: GPT-4oQ:+0.2

$4.38+872%

Performance

34

tokens/sec

Faster than 6% of models

9.03

seconds

Faster than 13% of models

9.03

seconds

Faster than 41% of models

Market Median

86 tok/s

60% slower

Median TTFT

1.07s

743% slower

Throughput/Dollar

76

tok/s per $/1M

Speed Comparison

DeepSeek: DeepSeek V4 Pro

34 tok/s+0%

Llama 3.1 Instruct 405B

34 tok/s+0%

Gemma 3 4B Instruct

34 tok/s-0%

Context Window

131K

tokens

Larger than 33% of models

Max Output

24K

tokens

18% of context

Benchmarks

MMLU-Pro

75.2%

GPQA Diamond

56.6%

HLE

3.7%

LiveCodeBench

41.1%

SciCode

27.2%

TerminalBench Hard

3.0%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025

26.3%

IFBench

27.9%

Long Context Recall

12.3%

Tau2

30.7%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

Qwen: Qwen3 VL 32B Instruct

Alibaba

Q: 17.2$0.18/1M131K ctx

Faster: 118%Cheaper: 60%

DeepSeek: R1 Distill Qwen 32B

DeepSeek

Q: 17.2$0.29/1M33K ctx

Faster: 25%Cheaper: 36%

Qwen3 235B A22B (Non-reasoning)

Alibaba

Q: 17.0$0.79/1M

Faster: 97%Pricier: 75%

OpenAI: GPT-4o

OpenAI

Q: 17.3$4.38/1M128K ctx

Faster: 254%Pricier: 872%

Llama 3.1 Instruct 405B

Market Position

Z.ai: GLM 4.6VMarket Average

Z.ai: GLM 4.6V

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position