Z.ai: GLM 4.7 Flash

Z AI·Lançado em 2026-01-19

Open Source203K ctxMIT

Comparar Testar modelo Ver repositório do modelo

Sobre

As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...

Modelos Relacionados

Z.ai: GLM 5.22026-06-16 Z.ai: GLM 5.12026-04-07 GLM-5.1 (Non-reasoning)2026-04-07 Z.ai: GLM 5V Turbo2026-04-01 Z.ai: GLM 5 Turbo2026-03-15 Z.ai: GLM 52026-02-11 GLM-5 (Non-reasoning)2026-02-11 GLM-4.7-Flash (Non-reasoning)2026-01-19

Índice de Qualidade

22.9

168th de 537

Top 31%

Índice de Código

25.9

175th de 447

Top 40%

Preço/1M

$0.14

155th mais barato

73% abaixo da mediana

Top 23%

Velocidade

102 tok/s

Top 45%

TTFT

0.94s

Janela de Contexto

203K

195th maior

Top 45%

Posição no Mercado

Z.ai: GLM 4.7 FlashMédia do Mercado

Preços

Entrada

$0.06

por 1M tokens

Saída

$0.40

por 1M tokens

Combinado

$0.14

por 1M tokens

Mais barato que 77% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.14

Mensal

$4.35

vs. Modelos Similares

Z.ai: GLM 4.6Q:+0.1

$0.76+422%

Grok 3 mini Reasoning (high)Q:-0.4

$0.35+141%

Grok 4.20 0309 (Non-reasoning)Q:-0.4

$3.00+1969%

OpenAI: o1Q:+0.5

$26.25+18003%

Desempenho

102

tokens/seg

Mais rápido que 55% dos modelos

0.94

segundos

Mais rápido que 60% dos modelos

20.47

segundos

Mais rápido que 24% dos modelos

Mediana do Mercado

94 tok/s

9% mais rápido

TTFT Mediano

1.10s

15% mais rápido

Vazão/Dólar

706

tok/s por $/1M

Comparação de Velocidade

Claude 4.5 Haiku (Non-reasoning)

103 tok/s+0%

GPT-5 mini (minimal)

103 tok/s+1%

Qwen3 Omni 30B A3B (Reasoning)

102 tok/s-1%

Janela de Contexto

203K

tokens

Maior que 55% dos modelos

Saída Máxima

16K

tokens

8% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

58.1%

HLE

7.1%

LiveCodeBenchNão avaliado

SciCode

33.7%

TerminalBench Hard

22.0%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

60.8%

Long Context Recall

35.0%

Tau2

98.8%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

mit

Downloads

2.2M

Curtidas

1.8K

Comparação Rápida

Modelos Similares

Z.ai: GLM 4.6

Z AI

Q: 23.0$0.76/1M203K ctx

Mais lento: 57%Mais caro: 422%

Gemini 2.5 Pro Preview (Mar' 25)

Google

Q: 23.0N/A/1M

Código: +20.8

EXAONE 4.5 33B

LG AI Research

Q: 23.0N/A/1M

Grok 3 mini Reasoning (high)

xAI

Q: 22.5$0.35/1M

Mais lento: 45%Mais caro: 141%

Grok 4.20 0309 (Non-reasoning)

xAI

Q: 22.5$3.00/1M

Mais rápido: 95%Mais caro: 1969%

OpenAI: o1

OpenAI

Q: 23.4$26.25/1M200K ctx

Mais rápido: 37%Mais caro: 18003%

Comparar todos os 7 modelos