gpt oss 120b

OpenAI·Lançado em 2025-08-04

Open Source120B131K ctxApache 2.0

Comparar Testar modelo Ver repositório do modelo

Sobre

gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized...

Modelos Relacionados

GPT-5.5 Instant (May 2026)2026-05-05 OpenAI: GPT Chat Latest2026-05-05 OpenAI: GPT-5.52026-04-24 OpenAI: GPT-5.5 Pro2026-04-24 GPT-5.5 (high)2026-04-23 GPT-5.5 (medium)2026-04-23 GPT-5.5 (low)2026-04-23 GPT-5.5 (Non-reasoning)2026-04-23

Índice de Qualidade

23.8

158th de 537

Top 30%

Índice de Código

30.4

145th de 447

Top 32%

Índice de Matemática

93.4

15th de 269

Top 6%

Preço/1M

$0.06

77th mais barato

89% abaixo da mediana

Top 12%

Velocidade

302 tok/s

Top 4%

TTFT

0.54s

Janela de Contexto

131K

236th maior

Top 73%

Posição no Mercado

gpt oss 120bMédia do Mercado

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 88% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.06

Mensal

$1.80

vs. Modelos Similares

Claude 4.5 Haiku (Non-reasoning)Q:-0.1

$2.00+3233%

Qwen: Qwen3 MaxQ:+0.2

$1.56+2500%

Claude 3.7 Sonnet (Non-reasoning)Q:-0.3

$6.00+9900%

MoonshotAI: Kimi K2 0905Q:-0.3

$1.07+1692%

Desempenho

302

tokens/seg

Mais rápido que 96% dos modelos

0.54

segundos

Mais rápido que 84% dos modelos

7.16

segundos

Mais rápido que 43% dos modelos

Mediana do Mercado

94 tok/s

222% mais rápido

TTFT Mediano

1.10s

51% mais rápido

Vazão/Dólar

5033

tok/s por $/1M

Comparação de Velocidade

Llama 3.1 Nemotron Instruct 70B

300 tok/s-1%

Nemotron 3 Nano Omni 30B A3B Reasoning

298 tok/s-1%

NVIDIA Nemotron Nano 12B v2 VL (Reasoning)

292 tok/s-3%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro

80.8%

GPQA Diamond

78.2%

HLE

18.5%

LiveCodeBench

87.8%

SciCode

38.9%

TerminalBench Hard

23.5%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

93.4%

IFBench

69.0%

Long Context Recall

50.7%

Tau2

65.8%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.0120BGGUF / GPTQ / AWQ

Downloads

4.1M

Curtidas

4.9K

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

Google

Q: 23.8N/A/1M

Código: -5.8

Claude 4.5 Haiku (Non-reasoning)

Anthropic

Q: 23.7$2.00/1M

Mais lento: 66%Mais caro: 3233%

Qwen: Qwen3 Max

Alibaba

Q: 24.0$1.56/1M262K ctx

Mais lento: 80%Mais caro: 2500%

MoonshotAI: Kimi K2 0905

Kimi

Q: 23.5$1.07/1M262K ctx

Mais lento: 91%Mais caro: 1692%

Claude 3.7 Sonnet (Non-reasoning)

Anthropic

Q: 23.5$6.00/1M200K ctx

Mais caro: 9900%Código: -3.7

Qwen3.6 35B A3B (Non-reasoning)

Alibaba

Q: 24.2$0.84/1M

Mais lento: 53%Mais caro: 1307%

Comparar todos os 7 modelos

Usado por Agentes

Roo Code Ver todos os 9 agentes →