MiMo-V2-Flash (Non-reasoning)

Xiaomi·Lançado em 2025-12-16

262K ctx

Sobre

MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a...

Modelos Relacionados

Xiaomi: MiMo-V2.5-Pro2026-04-22 MiMo-V2.52026-04-22 MiMo-V2.5-Pro (Non-reasoning)2026-04-22 Xiaomi: MiMo-V2.52026-04-22 MiMo-V2-Omni-03272026-03-27 MiMo-V2-Omni2026-03-19 MiMo-V2-Pro2026-03-18 MiMo-V2-Flash (Feb 2026)2025-12-16

Índice de Qualidade

24.7

152nd de 537

Top 29%

Índice de Código

49.8

34th de 447

Top 8%

Índice de Matemática

67.7

102nd de 269

Top 38%

Preço/1M

$0.15

159th mais barato

72% abaixo da mediana

Top 25%

Velocidade

92 tok/s

Top 51%

TTFT

1.88s

Janela de Contexto

262K

110th maior

Top 38%

Posição no Mercado

MiMo-V2-Flash (Non-reasoning)Média do Mercado

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.30

por 1M tokens

Combinado

$0.15

por 1M tokens

Mais barato que 75% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M

100K100M

Diário

$0.15

Mensal

$4.50

vs. Modelos Similares

DeepSeek: DeepSeek V3.2Q:0.0

$0.26+72%

Gemma 4 31B (Non-reasoning)Q:+0.1

$0.20+37%

Grok 4.3 (Non-reasoning)Q:+0.1

$1.56+942%

Arcee AI: Trinity Large ThinkingQ:-0.2

$0.39+158%

Desempenho

tokens/seg

Mais rápido que 49% dos modelos

1.88

segundos

Mais rápido que 24% dos modelos

1.88

segundos

Mais rápido que 51% dos modelos

Mediana do Mercado

94 tok/s

2% mais lento

TTFT Mediano

1.10s

70% mais lento

Vazão/Dólar

614

tok/s por $/1M

Comparação de Velocidade

Hermes 4 - Llama-3.1 70B (Reasoning)

92 tok/s+0%

Qwen3 32B (Non-reasoning)

91 tok/s-1%

Reka Flash 3

93 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

66K

tokens

25% do contexto

Benchmarks

MMLU-Pro

74.4%

GPQA Diamond

65.6%

HLE

8.0%

LiveCodeBench

40.2%

SciCode

25.9%

TerminalBench Hard

25.8%

MATH-500Não avaliado

AIMENão avaliado

AIME 2025

67.7%

IFBench

39.9%

Long Context Recall

31.3%

Tau2

83.9%

Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

DeepSeek: DeepSeek V3.2

DeepSeek

Q: 24.7$0.26/1M131K ctx

Mais caro: 72%Código: -15.2

K-EXAONE (Reasoning)

LG AI Research

Q: 24.7N/A/1M

Código: -22.8

Gemma 4 31B (Non-reasoning)

Google

Q: 24.8$0.20/1M

Mais lento: 37%Mais caro: 37%

Grok 4.3 (Non-reasoning)

xAI

Q: 24.8$1.56/1M

Mais rápido: 31%Mais caro: 942%

Arcee AI: Trinity Large Thinking

Arcee AI

Q: 24.5$0.39/1M262K ctx

Mais rápido: 130%Mais caro: 158%

Qwen: Qwen3.5-9B

Alibaba

Q: 25.0$0.11/1M262K ctx

Mais lento: 37%Mais barato: 25%

Comparar todos os 7 modelos