Z.ai: GLM 4.5V

Z AI·Released 2025-08-11

Open Source66K ctxMultimodal

About

GLM-4.5V is a vision-language foundation model for multimodal agent applications. Built on a Mixture-of-Experts (MoE) architecture with 106B parameters and 12B activated parameters, it achieves state-of-the-art results in video understanding,...

Quality Index

7.0

402nd of 537

Top 75%

Coding Index

10.8

342nd of 447

Top 77%

Math Index

15.3

217th of 269

Top 81%

Price/1M

$0.90

420th cheapest

66% above median

Top 62%

Speed

46 tok/s

Top 89%

TTFT

11.55s

Context Window

66K

376th largest

Top 87%

Market Position

Z.ai: GLM 4.5VMarket Average

Pricing

Input

$0.60

per 1M tokens

Output

$1.80

per 1M tokens

Blended

$0.90

per 1M tokens

Cheaper than 38% of models. Median price is $0.54/1M tokens.

Cost Calculator

Tokens per day1M

100K100M

Daily

$0.90

Monthly

$27.00

vs. Similar Models

Qwen3 14B (Non-reasoning)Q:0.0

$0.38-58%

OpenAI: GPT-4Q:0.0

$37.50+4067%

Google: Gemini 2.5 Flash LiteQ:-0.1

$0.17-81%

Hermes 4 - Llama-3.1 70B (Non-reasoning)Q:-0.1

$0.20-78%

Performance

tokens/sec

Faster than 11% of models

11.55

seconds

Faster than 11% of models

11.55

seconds

Faster than 38% of models

Market Median

94 tok/s

51% slower

Median TTFT

1.11s

938% slower

Throughput/Dollar

tok/s per $/1M

Speed Comparison

Gemma 4 26B A4B (Non-reasoning)

46 tok/s-0%

Anthropic: Claude Opus 4.6

46 tok/s+0%

GLM-4.6V (Reasoning)

46 tok/s+0%

Context Window

66K

tokens

Larger than 13% of models

Max Output

16K

tokens

25% of context

Benchmarks

MMLU-Pro

75.1%

GPQA Diamond

57.3%

HLE

3.6%

LiveCodeBench

35.2%

SciCode

18.8%

TerminalBench Hard

6.8%

MATH-500Not evaluated

AIMENot evaluated

AIME 2025

15.3%

IFBench

28.6%

Long Context Recall

0.0%

Tau2

19.6%

Market AverageTop Score

Open Source

Quick Compare

Similar Models

OpenAI: GPT-4

OpenAI

Q: 7.0$37.50/1M8K ctx

Pricier: 4067%Context Window: 8x smaller

Qwen3 14B (Non-reasoning)

Alibaba

Q: 7.0$0.38/1M

Faster: 38%Cheaper: 58%

Google: Gemini 2.5 Flash Lite

Google

Q: 6.9$0.17/1M1.0M ctx

Faster: 360%Cheaper: 81%

OpenAI: GPT-4o-mini

OpenAI

Q: 6.9$0.26/1M128K ctx

Faster: 59%Cheaper: 71%

Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous Research

Q: 6.9$0.20/1M

Faster: 98%Cheaper: 78%

Mistral Small 3

Mistral

Q: 6.9$0.10/1M

Faster: 219%Cheaper: 88%

Compare all 7 models

Z.ai: GLM 4.5V

About

Related Models

Market Position

Pricing

Cost Calculator

vs. Similar Models

Performance

Benchmarks

Open Source

Quick Compare

Similar Models

Market Position