Ir para o conteúdo principal
Voltar para Explorar

Granite 3.3 8B (Non-reasoning)

IBM·Lançado em 2025-04-16
Open Source

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.25

por 1M tokens

Combinado

$0.09

por 1M tokens

Mais barato que 86% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.09

Mensal

$2.55

vs. Modelos Similares

LFM2 8B A1BQ:0.0
$0.01-85%
Command-R (Mar '24)Q:+0.3
$0.75+782%
Mistral 7B InstructQ:+0.3
$0.21+142%
Qwen3 1.7B (Non-reasoning)Q:-0.3
$0.19+121%

Desempenho

362

tokens/seg

Mais rápido que 98% dos modelos

20.34

segundos

Mais rápido que 5% dos modelos

20.34

segundos

Mais rápido que 25% dos modelos

Mediana do Mercado

94 tok/s

283% mais rápido

TTFT Mediano

1.11s

1728% mais lento

Vazão/Dólar

4255

tok/s por $/1M

Comparação de Velocidade

Google: Gemini 2.5 Flash Lite Preview 09-2025
353 tok/s-2%
Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)
347 tok/s-4%
gpt-oss-120b (low)
340 tok/s-6%

Benchmarks

MMLU-Pro
46.8%
GPQA Diamond
33.8%
HLE
4.2%
LiveCodeBench
12.7%
SciCode
10.1%
TerminalBench Hard
0.0%
MATH-500
66.5%
AIME
4.7%
AIME 2025
6.7%
IFBench
22.4%
Long Context Recall
4.3%
Tau2
10.5%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos