Z.ai: GLM 4.5V

Z AI·Lançado em 2025-08-11

Open Source66K ctxMultimodal

Sobre

GLM-4.5V is a vision-language foundation model for multimodal agent applications. Built on a Mixture-of-Experts (MoE) architecture with 106B parameters and 12B activated parameters, it achieves state-of-the-art results in video understanding,...

Modelos Relacionados

Z.ai: GLM 5.22026-06-16 Z.ai: GLM 5.12026-04-07 GLM-5.1 (Non-reasoning)2026-04-07 Z.ai: GLM 5V Turbo2026-04-01 Z.ai: GLM 5 Turbo2026-03-15 Z.ai: GLM 52026-02-11 GLM-5 (Non-reasoning)2026-02-11 GLM 4.7 Flash2026-01-19

Índice de Qualidade

7.0

402nd de 537

Top 75%

Índice de Código

10.8

342nd de 447

Top 77%

Índice de Matemática

15.3

217th de 269

Top 81%

Preço/1M

$0.90

420th mais barato

66% acima da mediana

Top 62%

Velocidade

46 tok/s

Top 89%

TTFT

11.55s

Janela de Contexto

66K

376th maior

Top 87%

Posição no Mercado

Z.ai: GLM 4.5VMédia do Mercado

Preços

Entrada

$0.60

por 1M tokens

Saída

$1.80

por 1M tokens

Combinado

$0.90

por 1M tokens

Mais barato que 38% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.90

Mensal

$27.00

vs. Modelos Similares

Qwen3 14B (Non-reasoning)Q:0.0

$0.38-58%

OpenAI: GPT-4Q:0.0

$37.50+4067%

Google: Gemini 2.5 Flash LiteQ:-0.1

$0.17-81%

Hermes 4 - Llama-3.1 70B (Non-reasoning)Q:-0.1

$0.20-78%

Desempenho

tokens/seg

Mais rápido que 11% dos modelos

11.55

segundos

Mais rápido que 11% dos modelos

11.55

segundos

Mais rápido que 38% dos modelos

Mediana do Mercado

94 tok/s

51% mais lento

TTFT Mediano

1.11s

938% mais lento

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Gemma 4 26B A4B (Non-reasoning)

46 tok/s-0%

Anthropic: Claude Opus 4.6

46 tok/s+0%

GLM-4.6V (Reasoning)

46 tok/s+0%

Janela de Contexto

66K

tokens

Maior que 13% dos modelos

Saída Máxima

16K

tokens

25% do contexto

Benchmarks

MMLU-Pro

75.1%

GPQA Diamond

57.3%

HLE

3.6%

LiveCodeBench

35.2%

SciCode

18.8%

TerminalBench Hard

6.8%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

15.3%

IFBench

28.6%

Long Context Recall

0.0%

Tau2

19.6%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

OpenAI: GPT-4

OpenAI

Q: 7.0$37.50/1M8K ctx

Mais caro: 4067%Janela de Contexto: 8x menor

Qwen3 14B (Non-reasoning)

Alibaba

Q: 7.0$0.38/1M

Mais rápido: 38%Mais barato: 58%

Google: Gemini 2.5 Flash Lite

Google

Q: 6.9$0.17/1M1.0M ctx

Mais rápido: 360%Mais barato: 81%

OpenAI: GPT-4o-mini

OpenAI

Q: 6.9$0.26/1M128K ctx

Mais rápido: 59%Mais barato: 71%

Hermes 4 - Llama-3.1 70B (Non-reasoning)

Nous Research

Q: 6.9$0.20/1M

Mais rápido: 98%Mais barato: 78%

Mistral Small 3

Mistral

Q: 6.9$0.10/1M

Mais rápido: 219%Mais barato: 88%

Comparar todos os 7 modelos