OpenAI: gpt-oss-20b

OpenAI·Lançado em 2025-08-05

Open Source20B131K ctxApache 2.0

Comparar Testar via OpenRouter Ver no HuggingFace

Sobre

gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license. It uses a Mixture-of-Experts (MoE) architecture with 3.6B active parameters per forward pass, optimized for...

Modelos Relacionados

OpenAI: GPT Chat Latest2026-05-05 OpenAI: GPT-5.52026-04-24 OpenAI: GPT-5.5 Pro2026-04-24 GPT-5.5 (high)2026-04-23 GPT-5.5 (medium)2026-04-23 GPT-5.5 (low)2026-04-23 GPT-5.5 (Non-reasoning)2026-04-23 OpenAI: GPT-5.4 Image 22026-04-21

Índice de Qualidade

24.5

200th de 507

Top 40%

Índice de Código

18.5

211th de 417

Top 51%

Índice de Matemática

89.3

30th de 269

Top 12%

Preço/1M

$0.06

70th mais barato

90% abaixo da mediana

Top 11%

Velocidade

285 tok/s

Top 5%

TTFT

0.38s

Janela de Contexto

131K

201st maior

Top 67%

Posição no Mercado

OpenAI: gpt-oss-20bMédia do Mercado

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.14

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 89% dos modelos. Preço mediano é $0.56/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.06

Mensal

$1.73

vs. Modelos Similares

gpt-oss-120B (low)Q:0.0

$0.26+356%

Nova 2.0 Lite (low)Q:+0.1

$0.85+1378%

Perplexity: Sonar Reasoning ProQ:+0.1

$3.50+5987%

GPT-5.4 nano (Non-Reasoning)Q:-0.1

$0.46+705%

Desempenho

285

tokens/seg

Mais rápido que 95% dos modelos

0.38

segundos

Mais rápido que 92% dos modelos

7.40

segundos

Mais rápido que 43% dos modelos

Mediana do Mercado

86 tok/s

232% mais rápido

TTFT Mediano

1.07s

65% mais rápido

Vazão/Dólar

4953

tok/s por $/1M

Comparação de Velocidade

Llama 3.1 Nemotron Instruct 70B

284 tok/s-0%

Gemini 2.5 Flash-Lite (Reasoning)

288 tok/s+1%

Ministral 3 3B

295 tok/s+3%

Janela de Contexto

131K

tokens

Maior que 33% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro

74.8%

GPQA Diamond

68.8%

HLE

9.8%

LiveCodeBench

77.7%

SciCode

34.4%

TerminalBench Hard

10.6%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

89.3%

IFBench

65.1%

Long Context Recall

30.7%

Tau2

60.2%

Média do MercadoMelhor Score

Open Source

HuggingFace

apache-2.020BGGUF / GPTQ / AWQ

Downloads

7.2M

Curtidas

4.6K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

gpt-oss-120B (low)

OpenAI

Q: 24.5$0.26/1M

Mais caro: 356%

Perplexity: Sonar Reasoning Pro

Perplexity

Q: 24.6$3.50/1M128K ctx

Mais caro: 5987%

GPT-5.4 nano (Non-Reasoning)

OpenAI

Q: 24.4$0.46/1M

Mais lento: 50%Mais caro: 705%

Nova 2.0 Lite (low)

Amazon

Q: 24.6$0.85/1M

Mais lento: 37%Mais caro: 1378%

MiniMax M1 80k

MiniMax

Q: 24.4$0.96/1M

Mais caro: 1575%Código: -4.0

NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)

NVIDIA

Q: 24.3$0.10/1M

Mais lento: 45%Mais caro: 67%

Comparar todos os 7 modelos

Índice de Qualidade

24.5

200th de 507

Top 40%

Índice de Código

18.5

211th de 417

Top 51%

Índice de Matemática

89.3

30th de 269

Top 12%

Preço/1M

$0.06

70th mais barato

90% abaixo da mediana

Top 11%

Velocidade

285 tok/s

Top 5%

TTFT

0.38s

Janela de Contexto

131K

201st maior

Top 67%

Posição no Mercado

OpenAI: gpt-oss-20bMédia do Mercado