Olmo 3.1 32B Instruct

Allen AI·Lançado em 2026-01-13

Open Source66K ctx

Sobre

Olmo 3.1 32B Instruct is a large-scale, 32-billion-parameter instruction-tuned language model engineered for high-performance conversational AI, multi-turn dialogue, and practical instruction following. As part of the Olmo 3.1 family, this...

Modelos Relacionados

Olmo 3.1 32B Think2025-12-12 AllenAI: Olmo 3 32B Think2025-11-21 Olmo 3 7B Think2025-11-20 Olmo 3 7B Instruct2025-11-20 OLMo 2 0425 1B2025-04-17 AllenAI: Olmo 2 32B Instruct2025-03-14 OLMo 2 32B2025-03-13 OLMo 2 7B2024-11-26

Índice de Qualidade

6.5

419th de 537

Top 78%

Índice de Código

5.6

395th de 447

Top 89%

Preço/1M

$0.30

255th mais barato

45% abaixo da mediana

Top 38%

Velocidade

54 tok/s

Top 78%

TTFT

0.29s

Janela de Contexto

66K

376th maior

Top 87%

Posição no Mercado

Olmo 3.1 32B InstructMédia do Mercado

Preços

Entrada

$0.20

por 1M tokens

Saída

$0.60

por 1M tokens

Combinado

$0.30

por 1M tokens

Mais barato que 62% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.30

Mensal

$9.00

vs. Modelos Similares

Sarvam 30B (high)Q:+0.1

$0.05-84%

AllenAI: Olmo 3 32B ThinkQ:-0.1

$0.24-21%

Mistral: SabaQ:-0.1

$0.300%

IBM: Granite 4.1 8BQ:+0.2

$0.06-79%

Desempenho

tokens/seg

Mais rápido que 22% dos modelos

0.29

segundos

Mais rápido que 97% dos modelos

0.29

segundos

Mais rápido que 99% dos modelos

Mediana do Mercado

94 tok/s

42% mais lento

TTFT Mediano

1.11s

74% mais rápido

Vazão/Dólar

181

tok/s por $/1M

Comparação de Velocidade

Qwen3 Max (Preview)

54 tok/s+0%

GLM-4.6 (Reasoning)

55 tok/s+1%

MoonshotAI: Kimi K2.6

54 tok/s-1%

Janela de Contexto

66K

tokens

Maior que 13% dos modelos

Saída Máxima

16K

tokens

25% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

53.9%

HLE

4.9%

LiveCodeBenchNão avaliado

SciCode

16.7%

TerminalBench Hard

0.0%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

39.2%

Long Context Recall

0.0%

Tau2

21.3%

Média do MercadoMelhor Score

Open Source

Comparação Rápida

Modelos Similares

AllenAI: Olmo 3 32B Think

Allen AI

Q: 6.4$0.24/1M66K ctx

Mais barato: 21%Código: +4.9

Mistral: Saba

Mistral

Q: 6.4$0.30/1M33K ctx

Janela de Contexto: 2x menor

DeepSeek R1 Distill Llama 8B

DeepSeek

Q: 6.4N/A/1M

Sarvam 30B (high)

Sarvam

Q: 6.6$0.05/1M

Mais rápido: 348%Mais barato: 84%

Gemini 2.0 Flash Thinking Experimental (Dec '24)

Google

Q: 6.6N/A/1M

DeepSeek-V2.5

DeepSeek

Q: 6.6N/A/1M

Comparar todos os 7 modelos