Ir para o conteúdo principal
Voltar para Explorar

Granite 3.3 8B (Non-reasoning)

IBM·Lançado em 2025-04-16
Open Source

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.25

por 1M tokens

Combinado

$0.09

por 1M tokens

Mais barato que 86% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.09

Mensal

$2.55

vs. Modelos Similares

LFM2 8B A1BQ:0.0
$0.01-85%
Command-R (Mar '24)Q:+0.3
$0.75+782%
Mistral 7B InstructQ:+0.3
$0.21+142%
Qwen3 1.7B (Non-reasoning)Q:-0.3
$0.19+121%

Desempenho

464

tokens/seg

Mais rápido que 98% dos modelos

20.34

segundos

Mais rápido que 5% dos modelos

20.34

segundos

Mais rápido que 26% dos modelos

Mediana do Mercado

94 tok/s

395% mais rápido

TTFT Mediano

1.10s

1740% mais lento

Vazão/Dólar

5459

tok/s por $/1M

Comparação de Velocidade

LFM2 1.2B
466 tok/s+1%
Granite 4.0 H Small
481 tok/s+4%
HyperNova 60B 2605
413 tok/s-11%

Benchmarks

MMLU-Pro
46.8%
GPQA Diamond
33.8%
HLE
4.2%
LiveCodeBench
12.7%
SciCode
10.1%
TerminalBench Hard
0.0%
MATH-500
66.5%
AIME
4.7%
AIME 2025
6.7%
IFBench
22.4%
Long Context Recall
4.3%
Tau2
10.5%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos