Ir para o conteúdo principal
Voltar para Explorar

Olmo 3 7B Instruct

Allen AI·Lançado em 2025-11-20
Open Source7B66K ctxApache 2.0

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.20

por 1M tokens

Combinado

$0.13

por 1M tokens

Mais barato que 80% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.13

Mensal

$3.75

vs. Modelos Similares

Jamba 1.5 MiniQ:-0.1
$0.25+100%
Jamba 1.6 MiniQ:-0.2
$0.25+100%
Qwen3 1.7B (Reasoning)Q:-0.2
$0.40+218%
Microsoft: Phi 4 Mini InstructQ:+0.2
$0.15+18%

Desempenho

76

tokens/seg

Mais rápido que 38% dos modelos

0.42

segundos

Mais rápido que 94% dos modelos

0.42

segundos

Mais rápido que 96% dos modelos

Mediana do Mercado

94 tok/s

19% mais lento

TTFT Mediano

1.10s

62% mais rápido

Vazão/Dólar

607

tok/s por $/1M

Comparação de Velocidade

DeepSeek: DeepSeek V4 Pro
75 tok/s-1%
MiniMax: MiniMax M3
75 tok/s-1%
NVIDIA Nemotron Nano 9B V2 (Reasoning)
75 tok/s-1%

Janela de Contexto

66K

tokens

Maior que 13% dos modelos

Saída Máxima

66K

tokens

100% do contexto

Benchmarks

MMLU-Pro
52.2%
GPQA Diamond
40.0%
HLE
5.8%
LiveCodeBench
26.6%
SciCode
10.3%
TerminalBench Hard
0.0%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
41.3%
IFBench
32.8%
Long Context Recall
0.0%
Tau2
12.6%
Média do MercadoMelhor Score
apache-2.07BGGUF / GPTQ / AWQ
Downloads

753.2K

Curtidas

128

VRAM (FP16)

8-16 GB

GPU

RTX 4070 / M2 Pro

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos