Ir para o conteúdo principal
Voltar para Explorar

Gemma 3 4B Instruct

Google·Lançado em 2025-03-12
Open SourceMultimodal

Preços

Entrada

$0.04

por 1M tokens

Saída

$0.08

por 1M tokens

Combinado

$0.05

por 1M tokens

Mais barato que 90% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.05

Mensal

$1.50

vs. Modelos Similares

Llama 3.2 Instruct 1BQ:0.0
$0.050%
Gemma 3n E4B InstructQ:+0.1
$0.03-50%
Llama 3 Instruct 8BQ:+0.1
$0.07+40%
Apertus 8B InstructQ:-0.1
$0.13+150%

Desempenho

34

tokens/seg

Mais rápido que 3% dos modelos

1.19

segundos

Mais rápido que 44% dos modelos

1.19

segundos

Mais rápido que 63% dos modelos

Mediana do Mercado

94 tok/s

64% mais lento

TTFT Mediano

1.11s

7% mais lento

Vazão/Dólar

685

tok/s por $/1M

Comparação de Velocidade

OpenAI: o3 Pro
34 tok/s-0%
Claude 4 Opus (Reasoning)
34 tok/s+0%
Llama 3.1 Instruct 70B
35 tok/s+2%

Benchmarks

MMLU-Pro
41.7%
GPQA Diamond
29.1%
HLE
5.2%
LiveCodeBench
11.2%
SciCode
7.3%
TerminalBench Hard
0.8%
MATH-500
76.6%
AIME
6.3%
AIME 2025
12.7%
IFBench
28.3%
Long Context Recall
5.7%
Tau2
5.0%
Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos