OpenAI: gpt-oss-120b

OpenAI·Lançado em 2025-08-05

Open Source120B131K ctxApache 2.0

Comparar Testar via OpenRouter Ver no HuggingFace

Sobre

gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized...

Modelos Relacionados

OpenAI: GPT Chat Latest2026-05-05 OpenAI: GPT-5.52026-04-24 OpenAI: GPT-5.5 Pro2026-04-24 GPT-5.5 (high)2026-04-23 GPT-5.5 (medium)2026-04-23 GPT-5.5 (low)2026-04-23 GPT-5.5 (Non-reasoning)2026-04-23 OpenAI: GPT-5.4 Image 22026-04-21

Índice de Qualidade

33.3

120th de 507

Top 24%

Índice de Código

28.6

129th de 417

Top 31%

Índice de Matemática

93.4

15th de 269

Top 6%

Preço/1M

$0.07

85th mais barato

87% abaixo da mediana

Top 13%

Velocidade

244 tok/s

Top 6%

TTFT

0.51s

Janela de Contexto

131K

201st maior

Top 67%

Posição no Mercado

OpenAI: gpt-oss-120bMédia do Mercado

Preços

Entrada

$0.04

por 1M tokens

Saída

$0.18

por 1M tokens

Combinado

$0.07

por 1M tokens

Mais barato que 87% dos modelos. Preço mediano é $0.56/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.07

Mensal

$2.23

vs. Modelos Similares

OpenAI: o4 MiniQ:-0.2

$1.93+2493%

Google: Gemini 3.1 Flash Lite PreviewQ:+0.2

$0.56+658%

Claude 4 Opus (Non-reasoning)Q:-0.3

$32.81+44093%

Claude 4 Sonnet (Non-reasoning)Q:-0.3

$6.56+8739%

Desempenho

244

tokens/seg

Mais rápido que 94% dos modelos

0.51

segundos

Mais rápido que 81% dos modelos

8.69

segundos

Mais rápido que 41% dos modelos

Mediana do Mercado

86 tok/s

185% mais rápido

TTFT Mediano

1.07s

53% mais rápido

Vazão/Dólar

3292

tok/s por $/1M

Comparação de Velocidade

Qwen3.5 Omni Flash

244 tok/s-0%

gpt-oss-120B (low)

254 tok/s+4%

Google: Gemini 2.5 Flash Lite

259 tok/s+6%

Janela de Contexto

131K

tokens

Maior que 33% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro

80.8%

GPQA Diamond

78.2%

HLE

18.5%

LiveCodeBench

87.8%

SciCode

38.9%

TerminalBench Hard

23.5%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

93.4%

IFBench

69.0%

Long Context Recall

50.7%

Tau2

65.8%

Média do MercadoMelhor Score

Open Source

HuggingFace

apache-2.0120BGGUF / GPTQ / AWQ

Downloads

4.4M

Curtidas

4.8K

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

OpenAI: o4 Mini

OpenAI

Q: 33.1$1.93/1M200K ctx

Mais lento: 46%Mais caro: 2493%

Google: Gemini 3.1 Flash Lite Preview

Google

Q: 33.5$0.56/1M1.0M ctx

Mais rápido: 29%Mais caro: 658%

Doubao Seed Code

ByteDance

Q: 33.5N/A/1M

Claude 4 Sonnet (Non-reasoning)

Anthropic

Q: 33.0$6.56/1M

Mais lento: 81%Mais caro: 8739%

Claude 4 Opus (Non-reasoning)

Anthropic

Q: 33.0$32.81/1M

Mais lento: 85%Mais caro: 44093%

GPT-5.2 (Non-reasoning)

OpenAI

Q: 33.6$4.81/1M

Mais lento: 74%Mais caro: 6382%

Comparar todos os 7 modelos

Usado por Agentes

Gobii

nanobot

Índice de Qualidade

33.3

120th de 507

Top 24%

Índice de Código

28.6

129th de 417

Top 31%

Índice de Matemática

93.4

15th de 269

Top 6%

Preço/1M

$0.07

85th mais barato

87% abaixo da mediana

Top 13%

Velocidade

244 tok/s

Top 6%

TTFT

0.51s

Janela de Contexto

131K

201st maior

Top 67%

Posição no Mercado

OpenAI: gpt-oss-120bMédia do Mercado