Ir para o conteúdo principal
Voltar para Explorar

gpt oss 120b

OpenAI·Lançado em 2025-08-04
Open Source120B131K ctxApache 2.0

Sobre

gpt-oss-120b is an open-weight, 117B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized...

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.15

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 88% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.06

Mensal

$1.80

vs. Modelos Similares

Claude 4.5 Haiku (Non-reasoning)Q:-0.1
$2.00+3233%
Qwen: Qwen3 MaxQ:+0.2
$1.56+2500%
Claude 3.7 Sonnet (Non-reasoning)Q:-0.3
$6.00+9900%
MoonshotAI: Kimi K2 0905Q:-0.3
$1.07+1692%

Desempenho

302

tokens/seg

Mais rápido que 96% dos modelos

0.54

segundos

Mais rápido que 84% dos modelos

7.16

segundos

Mais rápido que 43% dos modelos

Mediana do Mercado

94 tok/s

222% mais rápido

TTFT Mediano

1.10s

51% mais rápido

Vazão/Dólar

5033

tok/s por $/1M

Comparação de Velocidade

Llama 3.1 Nemotron Instruct 70B
300 tok/s-1%
Nemotron 3 Nano Omni 30B A3B Reasoning
298 tok/s-1%
NVIDIA Nemotron Nano 12B v2 VL (Reasoning)
292 tok/s-3%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro
80.8%
GPQA Diamond
78.2%
HLE
18.5%
LiveCodeBench
87.8%
SciCode
38.9%
TerminalBench Hard
23.5%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
93.4%
IFBench
69.0%
Long Context Recall
50.7%
Tau2
65.8%
Média do MercadoMelhor Score
apache-2.0120BGGUF / GPTQ / AWQ
Downloads

4.1M

Curtidas

4.9K

VRAM (FP16)

Multi-GPU

GPU

8x A100 / H100

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos