Voltar para Explorar
Hermes 4 - Llama-3.1 405B (Non-reasoning)
Nous Research·Lançado em 2025-08-27
Open Source
Modelos Relacionados
Hermes 4 - Llama-3.1 70B (Reasoning)2025-08-27Hermes 4 - Llama-3.1 405B (Reasoning)2025-08-27Hermes 4 - Llama-3.1 70B (Non-reasoning)2025-08-27Nous: Hermes 4 405B2025-08-26Nous: Hermes 4 70B2025-08-26Nous: Hermes 3 70B Instruct2024-08-18Nous: Hermes 3 405B Instruct2024-08-16Nous: Hermes 3 405B Instruct (free)2024-08-16
Preços
Entrada
$1.00
por 1M tokens
Saída
$3.00
por 1M tokens
Combinado
$1.50
por 1M tokens
Mais barato que 29% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$1.50
Mensal
$45.00
vs. Modelos Similares
Gemini 2.0 Flash-Lite (Feb '25)Q:0.0
$0.13-91%
NVIDIA Nemotron Nano 9B V2 (Reasoning)Q:0.0
$0.07-95%
Qwen3.5 2B (Non-reasoning)Q:0.0
$0.04-97%
Gemma 4 E4B (Non-reasoning)Q:+0.1
$0.54-64%
Desempenho
39
tokens/seg
Mais rápido que 7% dos modelos
0.79
segundos
Mais rápido que 66% dos modelos
0.79
segundos
Mais rápido que 75% dos modelos
Mediana do Mercado
94 tok/s
59% mais lento
TTFT Mediano
1.11s
29% mais rápido
Vazão/Dólar
26
tok/s por $/1M
Comparação de Velocidade
Magistral Medium 1.2
39 tok/s-0%
OpenAI: GPT-4 Turbo
38 tok/s-1%
Qwen3.6 Max Preview
38 tok/s-2%
Benchmarks
MMLU-Pro
72.9%
GPQA Diamond
53.6%
HLE
4.2%
LiveCodeBench
54.6%
SciCode
34.6%
TerminalBench Hard
9.8%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
15.3%
IFBench
34.8%
Long Context Recall
20.0%
Tau2
26.6%
Média do MercadoMelhor Score