OpenAI: gpt-oss-20b

OpenAI·Lançado em 2025-08-05

Open Source20B131K ctxApache 2.0

Comparar Testar modelo Ver repositório do modelo

Sobre

gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license. It uses a Mixture-of-Experts (MoE) architecture with 3.6B active parameters per forward pass, optimized for...

Modelos Relacionados

GPT-5.5 Instant (May 2026)2026-05-05 OpenAI: GPT Chat Latest2026-05-05 OpenAI: GPT-5.52026-04-24 OpenAI: GPT-5.5 Pro2026-04-24 GPT-5.5 (high)2026-04-23 GPT-5.5 (medium)2026-04-23 GPT-5.5 (low)2026-04-23 GPT-5.5 (Non-reasoning)2026-04-23

Índice de Qualidade

14.9

253rd de 537

Top 47%

Índice de Código

20.7

225th de 447

Top 50%

Índice de Matemática

89.3

30th de 269

Top 12%

Preço/1M

$0.06

75th mais barato

90% abaixo da mediana

Top 11%

Velocidade

232 tok/s

Top 7%

TTFT

0.57s

Janela de Contexto

131K

236th maior

Top 73%

Posição no Mercado

OpenAI: gpt-oss-20bMédia do Mercado

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.14

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 89% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.06

Mensal

$1.70

vs. Modelos Similares

Nemotron 3 Nano Omni 30B A3B ReasoningQ:0.0

$0.13+131%

Mistral: Mistral Medium 3.1Q:-0.1

$0.80+1310%

Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Q:+0.2

$0.17+208%

GPT-5 (ChatGPT)Q:+0.4

$3.44+5958%

Desempenho

232

tokens/seg

Mais rápido que 93% dos modelos

0.57

segundos

Mais rápido que 80% dos modelos

9.19

segundos

Mais rápido que 42% dos modelos

Mediana do Mercado

94 tok/s

146% mais rápido

TTFT Mediano

1.11s

48% mais rápido

Vazão/Dólar

4090

tok/s por $/1M

Comparação de Velocidade

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

232 tok/s-0%

LFM2.5-8B-A1B

231 tok/s-0%

xAI: Grok 4.20

234 tok/s+1%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro

74.8%

GPQA Diamond

68.8%

HLE

9.8%

LiveCodeBench

77.7%

SciCode

34.4%

TerminalBench Hard

10.6%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

89.3%

IFBench

65.1%

Long Context Recall

30.7%

Tau2

60.2%

Média do MercadoMelhor Score

Open Source

Ver repositório do modelo

apache-2.020BGGUF / GPTQ / AWQ

Downloads

7.0M

Curtidas

4.7K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Nemotron 3 Nano Omni 30B A3B Reasoning

NVIDIA

Q: 14.9$0.13/1M

Mais rápido: 28%Mais caro: 131%

Mistral: Mistral Medium 3.1

Mistral

Q: 14.8$0.80/1M131K ctx

Mais lento: 63%Mais caro: 1310%

Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)

Google

Q: 15.1$0.17/1M

Mais rápido: 49%Mais caro: 208%

Solar Open 100B (Reasoning)

Upstage

Q: 15.1N/A/1M

Código: -10.2

Grok 3 Reasoning Beta

xAI

Q: 15.1N/A/1M

GPT-5 (ChatGPT)

OpenAI

Q: 15.3$3.44/1M

Mais caro: 5958%

Comparar todos os 7 modelos

Usado por Agentes

ZeroClaw