Z.ai: GLM 4.6

Z AI·Lançado em 2025-09-30

Open Source203K ctx

Sobre

Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex...

Modelos Relacionados

Z.ai: GLM 5.22026-06-16 Z.ai: GLM 5.12026-04-07 GLM-5.1 (Non-reasoning)2026-04-07 Z.ai: GLM 5V Turbo2026-04-01 Z.ai: GLM 5 Turbo2026-03-15 Z.ai: GLM 52026-02-11 GLM-5 (Non-reasoning)2026-02-11 Z.ai: GLM 4.7 Flash2026-01-19

Índice de Qualidade

23.0

165th de 537

Top 31%

Índice de Código

30.2

147th de 447

Top 33%

Índice de Matemática

44.3

149th de 269

Top 55%

Preço/1M

$0.76

385th mais barato

39% acima da mediana

Top 56%

Velocidade

44 tok/s

Top 87%

TTFT

1.80s

Janela de Contexto

203K

195th maior

Top 45%

Posição no Mercado

Z.ai: GLM 4.6Média do Mercado

Preços

Entrada

$0.43

por 1M tokens

Saída

$1.74

por 1M tokens

Combinado

$0.76

por 1M tokens

Mais barato que 44% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.76

Mensal

$22.73

vs. Modelos Similares

Z.ai: GLM 4.7 FlashQ:-0.1

$0.14-81%

OpenAI: o1Q:+0.4

$26.25+3365%

Qwen3.5 35B A3B (Non-reasoning)Q:+0.4

$0.69-9%

Claude 3.7 Sonnet (Non-reasoning)Q:+0.5

$6.00+692%

Desempenho

tokens/seg

Mais rápido que 13% dos modelos

1.80

segundos

Mais rápido que 26% dos modelos

1.80

segundos

Mais rápido que 52% dos modelos

Mediana do Mercado

94 tok/s

53% mais lento

TTFT Mediano

1.10s

63% mais lento

Vazão/Dólar

tok/s por $/1M

Comparação de Velocidade

Qwen: Qwen3 Max Thinking

44 tok/s-0%

Gemma 4 26B A4B (Non-reasoning)

44 tok/s-0%

Claude Opus 4.7 (Non-reasoning, High Effort)

44 tok/s-1%

Janela de Contexto

203K

tokens

Maior que 55% dos modelos

Saída Máxima

131K

tokens

65% do contexto

Benchmarks

MMLU-Pro

78.4%

GPQA Diamond

63.2%

HLE

5.2%

LiveCodeBench

56.1%

SciCode

33.1%

TerminalBench Hard

28.8%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

44.3%

IFBench

36.7%

Long Context Recall

26.3%

Tau2

76.9%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Gemini 2.5 Pro Preview (Mar' 25)

Google

Q: 23.0N/A/1M

Código: +16.5

EXAONE 4.5 33B

LG AI Research

Q: 23.0N/A/1M

Código: -7.2

Z.ai: GLM 4.7 Flash

Z AI

Q: 22.9$0.14/1M203K ctx

Mais rápido: 132%Mais barato: 81%

OpenAI: o1

OpenAI

Q: 23.4$26.25/1M200K ctx

Mais rápido: 218%Mais caro: 3365%

Qwen3.5 35B A3B (Non-reasoning)

Alibaba

Q: 23.4$0.69/1M

Mais rápido: 332%Código: -13.4

MoonshotAI: Kimi K2 0905

Kimi

Q: 23.5$1.07/1M262K ctx

Mais lento: 42%Mais caro: 42%

Comparar todos os 7 modelos