Ir para o conteúdo principal
Voltar para Explorar

Inception: Mercury 2

Inception·Lançado em 2026-03-04
128K ctx

Sobre

Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM). Instead of generating tokens sequentially, Mercury 2 produces and refines multiple tokens in parallel, achieving...

Preços

Entrada

$0.25

por 1M tokens

Saída

$0.75

por 1M tokens

Combinado

$0.38

por 1M tokens

Mais barato que 57% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.38

Mensal

$11.25

vs. Modelos Similares

DeepSeek V3.2 Exp (Reasoning)Q:+0.1
$0.31-17%
NVIDIA Nemotron 3 Super 120B A12B (Reasoning)Q:+0.1
$0.41+10%
Claude 4 Opus (Non-reasoning)Q:+0.2
$30.00+7900%
Claude 4 Sonnet (Non-reasoning)Q:+0.2
$6.00+1500%

Desempenho

1039

tokens/seg

Mais rápido que 100% dos modelos

2.88

segundos

Mais rápido que 19% dos modelos

2.88

segundos

Mais rápido que 49% dos modelos

Mediana do Mercado

94 tok/s

1009% mais rápido

TTFT Mediano

1.10s

161% mais lento

Vazão/Dólar

2770

tok/s por $/1M

Comparação de Velocidade

LFM2.5-1.2B-Instruct
526 tok/s-49%
LFM2.5-VL-1.6B
518 tok/s-50%
Granite 4.0 H Small
481 tok/s-54%

Janela de Contexto

128K

tokens

Maior que 16% dos modelos

Saída Máxima

50K

tokens

39% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
77.0%
HLE
15.5%
LiveCodeBenchNão avaliado
SciCode
38.7%
TerminalBench Hard
26.5%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
69.8%
Long Context Recall
36.3%
Tau2
70.8%
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos