Inception: Mercury 2

Inception·Lançado em 2026-03-04

128K ctx

Sobre

Mercury 2 is an extremely fast reasoning LLM, and the first reasoning diffusion LLM (dLLM). Instead of generating tokens sequentially, Mercury 2 produces and refines multiple tokens in parallel, achieving...

Modelos Relacionados

Inception: Mercury2025-06-26 Inception: Mercury Coder2025-04-30

Índice de Qualidade

25.3

145th de 537

Top 27%

Índice de Código

30.6

142nd de 447

Top 32%

Preço/1M

$0.38

292nd mais barato

31% abaixo da mediana

Top 43%

Velocidade

1039 tok/s

Top 0%

TTFT

2.88s

Janela de Contexto

128K

329th maior

Top 84%

Posição no Mercado

Inception: Mercury 2Média do Mercado

Preços

Entrada

$0.25

por 1M tokens

Saída

$0.75

por 1M tokens

Combinado

$0.38

por 1M tokens

Mais barato que 57% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.38

Mensal

$11.25

vs. Modelos Similares

DeepSeek V3.2 Exp (Reasoning)Q:+0.1

$0.31-17%

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)Q:+0.1

$0.41+10%

Claude 4 Opus (Non-reasoning)Q:+0.2

$30.00+7900%

Claude 4 Sonnet (Non-reasoning)Q:+0.2

$6.00+1500%

Desempenho

1039

tokens/seg

Mais rápido que 100% dos modelos

2.88

segundos

Mais rápido que 19% dos modelos

2.88

segundos

Mais rápido que 49% dos modelos

Mediana do Mercado

94 tok/s

1009% mais rápido

TTFT Mediano

1.10s

161% mais lento

Vazão/Dólar

2770

tok/s por $/1M

Comparação de Velocidade

LFM2.5-1.2B-Instruct

526 tok/s-49%

LFM2.5-VL-1.6B

518 tok/s-50%

Granite 4.0 H Small

481 tok/s-54%

Janela de Contexto

128K

tokens

Maior que 16% dos modelos

Saída Máxima

50K

tokens

39% do contexto

Benchmarks

MMLU-ProNão avaliado

GPQA Diamond

77.0%

HLE

15.5%

LiveCodeBenchNão avaliado

SciCode

38.7%

TerminalBench Hard

26.5%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025Não avaliado

IFBench

69.8%

Long Context Recall

36.3%

Tau2

70.8%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

NVIDIA

Q: 25.4$0.41/1M

Mais lento: 77%Código: +7.1

DeepSeek V3.2 Exp (Reasoning)

DeepSeek

Q: 25.4$0.31/1M

Mais lento: 92%Mais barato: 17%

Claude 4 Sonnet (Non-reasoning)

Anthropic

Q: 25.5$6.00/1M

Mais lento: 95%Mais caro: 1500%

Claude 4 Opus (Non-reasoning)

Anthropic

Q: 25.5$30.00/1M

Mais lento: 97%Mais caro: 7900%

GLM-4.6 (Reasoning)

Z AI

Q: 25.1$0.96/1M

Mais lento: 95%Mais caro: 157%

Step 3.5 Flash

StepFun

Q: 25.5$0.15/1M

Mais lento: 81%Mais barato: 60%

Comparar todos os 7 modelos