Z.ai: GLM 4.6V

Z AI·Lançado em 2025-12-08

Open Source131K ctxMultimodal

Sobre

GLM-4.6V is a large multimodal model designed for high-fidelity visual understanding and long-context reasoning across images, documents, and mixed media. It supports up to 128K tokens, processes complex page layouts...

Modelos Relacionados

Z.ai: GLM 5.22026-06-16 Z.ai: GLM 5.12026-04-07 GLM-5.1 (Non-reasoning)2026-04-07 Z.ai: GLM 5V Turbo2026-04-01 Z.ai: GLM 5 Turbo2026-03-15 Z.ai: GLM 52026-02-11 GLM-5 (Non-reasoning)2026-02-11 Z.ai: GLM 4.7 Flash2026-01-19

Índice de Qualidade

11.0

311th de 537

Top 58%

Índice de Código

11.1

335th de 447

Top 75%

Índice de Matemática

26.3

194th de 269

Top 72%

Preço/1M

$0.45

319th mais barato

17% abaixo da mediana

Top 47%

Velocidade

48 tok/s

Top 85%

TTFT

1.14s

Janela de Contexto

131K

236th maior

Top 73%

Posição no Mercado

Z.ai: GLM 4.6VMédia do Mercado

Preços

Entrada

$0.30

por 1M tokens

Saída

$0.90

por 1M tokens

Combinado

$0.45

por 1M tokens

Mais barato que 53% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.45

Mensal

$13.50

vs. Modelos Similares

DeepSeek R1 Distill Qwen 32BQ:0.0

$0.29-36%

Qwen: Qwen3 VL 32B InstructQ:+0.1

$0.18-60%

Ministral 3 14BQ:+0.1

$0.20-56%

Qwen3 235B A22B (Non-reasoning)Q:-0.1

$0.79+75%

Desempenho

tokens/seg

Mais rápido que 15% dos modelos

1.14

segundos

Mais rápido que 48% dos modelos

1.14

segundos

Mais rápido que 65% dos modelos

Mediana do Mercado

94 tok/s

49% mais lento

TTFT Mediano

1.11s

2% mais lento

Vazão/Dólar

108

tok/s por $/1M

Comparação de Velocidade

Claude Opus 4.6 (Adaptive Reasoning, Max Effort)

49 tok/s+1%

Qwen2.5 Max

48 tok/s-1%

Qwen: Qwen3.7 Plus

48 tok/s-1%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

33K

tokens

25% do contexto

Benchmarks

MMLU-Pro

75.2%

GPQA Diamond

56.6%

HLE

3.7%

LiveCodeBench

41.1%

SciCode

27.2%

TerminalBench Hard

3.0%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

26.3%

IFBench

27.9%

Long Context Recall

12.3%

Tau2

30.7%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

DeepSeek R1 Distill Qwen 32B

DeepSeek

Q: 11.0$0.29/1M128K ctx

Mais barato: 36%

Qwen: Qwen3 VL 32B Instruct

Alibaba

Q: 11.1$0.18/1M262K ctx

Mais rápido: 48%Mais barato: 60%

Ministral 3 14B

Mistral

Q: 11.1$0.20/1M

Mais rápido: 77%Mais barato: 56%

Qwen3 235B A22B (Non-reasoning)

Alibaba

Q: 10.9$0.79/1M

Mais rápido: 29%Mais caro: 75%

OpenAI: GPT-4o

OpenAI

Q: 11.2$4.38/1M128K ctx

Mais rápido: 359%Mais caro: 872%

Magistral Small 1.2

Mistral

Q: 11.3$0.75/1M

Mais rápido: 66%Mais caro: 67%

Comparar todos os 7 modelos