Ir para o conteúdo principal
Voltar para Explorar

OpenAI: gpt-oss-20b

OpenAI·Lançado em 2025-08-05
Open Source20B131K ctxApache 2.0

Sobre

gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license. It uses a Mixture-of-Experts (MoE) architecture with 3.6B active parameters per forward pass, optimized for...

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.14

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 89% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.06

Mensal

$1.70

vs. Modelos Similares

Nemotron 3 Nano Omni 30B A3B ReasoningQ:0.0
$0.13+131%
Mistral: Mistral Medium 3.1Q:-0.1
$0.80+1310%
Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Q:+0.2
$0.17+208%
GPT-5 (ChatGPT)Q:+0.4
$3.44+5958%

Desempenho

232

tokens/seg

Mais rápido que 93% dos modelos

0.57

segundos

Mais rápido que 80% dos modelos

9.19

segundos

Mais rápido que 42% dos modelos

Mediana do Mercado

94 tok/s

146% mais rápido

TTFT Mediano

1.11s

48% mais rápido

Vazão/Dólar

4090

tok/s por $/1M

Comparação de Velocidade

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)
232 tok/s-0%
LFM2.5-8B-A1B
231 tok/s-0%
xAI: Grok 4.20
234 tok/s+1%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro
74.8%
GPQA Diamond
68.8%
HLE
9.8%
LiveCodeBench
77.7%
SciCode
34.4%
TerminalBench Hard
10.6%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
89.3%
IFBench
65.1%
Long Context Recall
30.7%
Tau2
60.2%
Média do MercadoMelhor Score
apache-2.020BGGUF / GPTQ / AWQ
Downloads

7.0M

Curtidas

4.7K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos

Usado por Agentes