Ir para o conteúdo principal
Voltar para Explorar

IBM: Granite 4.1 8B

IBM·Lançado em 2026-04-30
Open Source131K ctx

Sobre

Granite 4.1 8B is a dense, decoder-only 8-billion-parameter language model from IBM, part of the Granite 4.1 family. It supports a 131K-token context window and is designed for enterprise tasks...

Preços

Entrada

$0.05

por 1M tokens

Saída

$0.10

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 88% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.06

Mensal

$1.88

vs. Modelos Similares

Llama 3.1 Instruct 70BQ:+0.1
$0.56+796%
Ministral 3 3BQ:+0.1
$0.10+60%
Qwen3 30B A3B (Non-reasoning)Q:+0.1
$0.13+113%
Qwen3 4B (Non-reasoning)Q:+0.1
$0.19+201%

Desempenho

119

tokens/seg

Mais rápido que 62% dos modelos

0.47

segundos

Mais rápido que 89% dos modelos

0.47

segundos

Mais rápido que 93% dos modelos

Mediana do Mercado

94 tok/s

27% mais rápido

TTFT Mediano

1.10s

58% mais rápido

Vazão/Dólar

1897

tok/s por $/1M

Comparação de Velocidade

Hy3-preview (Non-reasoning)
119 tok/s+0%
Z.ai: GLM 5.2
119 tok/s+0%
GLM-4.7 (Non-reasoning)
117 tok/s-1%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
43.3%
HLE
3.8%
LiveCodeBenchNão avaliado
SciCode
21.8%
TerminalBench Hard
0.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
38.6%
Long Context Recall
12.0%
Tau2
27.8%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos