Ir para o conteúdo principal
Voltar para Explorar

OpenAI: gpt-oss-20b

OpenAI·Lançado em 2025-08-05
Open Source20B131K ctxApache 2.0

Sobre

gpt-oss-20b is an open-weight 21B parameter model released by OpenAI under the Apache 2.0 license. It uses a Mixture-of-Experts (MoE) architecture with 3.6B active parameters per forward pass, optimized for...

Preços

Entrada

$0.03

por 1M tokens

Saída

$0.14

por 1M tokens

Combinado

$0.06

por 1M tokens

Mais barato que 89% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.06

Mensal

$1.70

vs. Modelos Similares

Nemotron 3 Nano Omni 30B A3B ReasoningQ:0.0
$0.13+131%
Mistral: Mistral Medium 3.1Q:-0.1
$0.80+1310%
Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)Q:+0.2
$0.17+208%
GPT-5 (ChatGPT)Q:+0.4
$3.44+5958%

Desempenho

238

tokens/seg

Mais rápido que 93% dos modelos

0.57

segundos

Mais rápido que 80% dos modelos

8.98

segundos

Mais rápido que 42% dos modelos

Mediana do Mercado

94 tok/s

154% mais rápido

TTFT Mediano

1.10s

48% mais rápido

Vazão/Dólar

4193

tok/s por $/1M

Comparação de Velocidade

Grok 4.20 0309 (Reasoning)
240 tok/s+1%
xAI: Grok 4.20
235 tok/s-1%
NVIDIA Nemotron 3 Super 120B A12B (Reasoning)
234 tok/s-2%

Janela de Contexto

131K

tokens

Maior que 27% dos modelos

Saída Máxima

131K

tokens

100% do contexto

Benchmarks

MMLU-Pro
74.8%
GPQA Diamond
68.8%
HLE
9.8%
LiveCodeBench
77.7%
SciCode
34.4%
TerminalBench Hard
10.6%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
89.3%
IFBench
65.1%
Long Context Recall
30.7%
Tau2
60.2%
Média do MercadoMelhor Score
apache-2.020BGGUF / GPTQ / AWQ
Downloads

7.0M

Curtidas

4.7K

VRAM (FP16)

24-48 GB

GPU

A6000 / M3 Ultra

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos

Usado por Agentes