Ir para o conteúdo principal
Voltar para Explorar

Z.ai: GLM 4.6

Z AI·Lançado em 2025-09-30
Open Source203K ctx

Sobre

Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex...

Preços

Entrada

$0.43

por 1M tokens

Saída

$1.74

por 1M tokens

Combinado

$0.76

por 1M tokens

Mais barato que 44% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.76

Mensal

$22.73

vs. Modelos Similares

Z.ai: GLM 4.7 FlashQ:-0.1
$0.14-81%
OpenAI: o1Q:+0.4
$26.25+3365%
Qwen3.5 35B A3B (Non-reasoning)Q:+0.4
$0.69-9%
Claude 3.7 Sonnet (Non-reasoning)Q:+0.5
$6.00+692%

Desempenho

44

tokens/seg

Mais rápido que 13% dos modelos

1.80

segundos

Mais rápido que 26% dos modelos

1.80

segundos

Mais rápido que 52% dos modelos

Mediana do Mercado

94 tok/s

53% mais lento

TTFT Mediano

1.10s

63% mais lento

Vazão/Dólar

58

tok/s por $/1M

Comparação de Velocidade

Qwen: Qwen3 Max Thinking
44 tok/s-0%
Gemma 4 26B A4B (Non-reasoning)
44 tok/s-0%
Claude Opus 4.7 (Non-reasoning, High Effort)
44 tok/s-1%

Janela de Contexto

203K

tokens

Maior que 55% dos modelos

Saída Máxima

131K

tokens

65% do contexto

Benchmarks

MMLU-Pro
78.4%
GPQA Diamond
63.2%
HLE
5.2%
LiveCodeBench
56.1%
SciCode
33.1%
TerminalBench Hard
28.8%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
44.3%
IFBench
36.7%
Long Context Recall
26.3%
Tau2
76.9%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos