Ir para o conteúdo principal
Voltar para Explorar

inclusionAI: Ling-2.6-flash

InclusionAI·Lançado em 2026-04-21
262K ctx

Sobre

Ling-2.6-flash is an instant (instruct) model from inclusionAI with 104B total parameters and 7.4B active parameters, designed for real-world agents that require fast responses, strong execution, and high token efficiency....

Preços

Entrada

$0.01

por 1M tokens

Saída

$0.03

por 1M tokens

Combinado

$0.01

por 1M tokens

Mais barato que 92% dos modelos. Preço mediano é $0.54/1M tokens.

Calculadora de Custo

Tokens por dia1M
100K100M

Diário

$0.01

Mensal

$0.45

vs. Modelos Similares

MoonshotAI: Kimi K2 0711Q:+0.1
$1.00+6583%
OpenAI: GPT-4.1Q:+0.1
$3.50+23233%
Qwen3 Max (Preview)Q:-0.1
$2.40+15900%
GLM-4.5 (Reasoning)Q:+0.2
$1.00+6567%

Desempenho

196

tokens/seg

Mais rápido que 86% dos modelos

0.95

segundos

Mais rápido que 59% dos modelos

0.95

segundos

Mais rápido que 71% dos modelos

Mediana do Mercado

94 tok/s

110% mais rápido

TTFT Mediano

1.10s

14% mais rápido

Vazão/Dólar

13096

tok/s por $/1M

Comparação de Velocidade

Qwen: Qwen3.7 Max
197 tok/s+0%
GPT-5 (ChatGPT)
198 tok/s+1%
Qwen: Qwen3 Next 80B A3B Instruct
194 tok/s-1%

Janela de Contexto

262K

tokens

Maior que 62% dos modelos

Saída Máxima

33K

tokens

13% do contexto

Benchmarks

MMLU-ProNão avaliado
GPQA Diamond
59.3%
HLE
6.2%
LiveCodeBenchNão avaliado
SciCode
27.1%
TerminalBench Hard
21.2%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025Não avaliado
IFBench
57.4%
Long Context Recall
25.0%
Tau2
86.0%
Média do MercadoMelhor Score

Comparação Rápida

Modelos Similares

Comparar todos os 7 modelos