Ir para o conteúdo principal
Voltar para Explorar

MiMo-V2-Flash (Non-reasoning)

Xiaomi·Lançado em 2025-12-16
262K ctx

Sobre

MiMo-V2-Flash is an open-source foundation language model developed by Xiaomi. It is a Mixture-of-Experts model with 309B total parameters and 15B active parameters, adopting hybrid attention architecture. MiMo-V2-Flash supports a...

Preços

Entrada

$0.10

por 1M tokens

Saída

$0.30

por 1M tokens

Combinado

$0.15

por 1M tokens

Mais barato que 75% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.15

Mensal

$4.50

vs. Modelos Similares

DeepSeek: DeepSeek V3.2Q:0.0
$0.26+72%
Gemma 4 31B (Non-reasoning)Q:+0.1
$0.20+37%
Grok 4.3 (Non-reasoning)Q:+0.1
$1.56+942%
Arcee AI: Trinity Large ThinkingQ:-0.2
$0.39+158%

Desempenho

92

tokens/seg

Mais rápido que 49% dos modelos

1.88

segundos

Mais rápido que 24% dos modelos

1.88

segundos

Mais rápido que 51% dos modelos

Mediana do Mercado

94 tok/s

2% mais lento

TTFT Mediano

1.10s

70% mais lento

Vazão/Dólar

614

tok/s por $/1M

Comparação de Velocidade

Hermes 4 - Llama-3.1 70B (Reasoning)
92 tok/s+0%
Qwen3 32B (Non-reasoning)
91 tok/s-1%
Reka Flash 3
93 tok/s+1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

66K

tokens

25% do contexto

Benchmarks

MMLU-Pro
74.4%
GPQA Diamond
65.6%
HLE
8.0%
LiveCodeBench
40.2%
SciCode
25.9%
TerminalBench Hard
25.8%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
67.7%
IFBench
39.9%
Long Context Recall
31.3%
Tau2
83.9%
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos