Voltar para Explorar
Hermes 4 - Llama-3.1 405B (Non-reasoning)
Nous Research·Lançado em 2025-08-27
Open Source
Modelos Relacionados
Hermes 4 - Llama-3.1 70B (Reasoning)2025-08-27Hermes 4 - Llama-3.1 405B (Reasoning)2025-08-27Hermes 4 - Llama-3.1 70B (Non-reasoning)2025-08-27Nous: Hermes 4 405B2025-08-26Nous: Hermes 4 70B2025-08-26Nous: Hermes 3 70B Instruct2024-08-18Nous: Hermes 3 405B Instruct2024-08-16Nous: Hermes 3 405B Instruct (free)2024-08-16
Preços
Entrada
$1.00
por 1M tokens
Saída
$3.00
por 1M tokens
Combinado
$1.50
por 1M tokens
Mais barato que 29% dos modelos. Preço mediano é $0.54/1M tokens.
Calculadora de Custo
Tokens por dia1M
100K100M
Diário
$1.50
Mensal
$45.00
vs. Modelos Similares
Gemini 2.0 Flash-Lite (Feb '25)Q:0.0
$0.13-91%
NVIDIA Nemotron Nano 9B V2 (Reasoning)Q:0.0
$0.07-95%
Qwen3.5 2B (Non-reasoning)Q:0.0
$0.04-97%
Gemma 4 E4B (Non-reasoning)Q:+0.1
$0.54-64%
Desempenho
40
tokens/seg
Mais rápido que 9% dos modelos
0.81
segundos
Mais rápido que 65% dos modelos
0.81
segundos
Mais rápido que 76% dos modelos
Mediana do Mercado
94 tok/s
58% mais lento
TTFT Mediano
1.10s
27% mais rápido
Vazão/Dólar
27
tok/s por $/1M
Comparação de Velocidade
Devstral 2
40 tok/s+0%
Qwen3.5 4B (Non-reasoning)
40 tok/s-0%
Devstral Small (Jul '25)
40 tok/s+0%
Benchmarks
MMLU-Pro
72.9%
GPQA Diamond
53.6%
HLE
4.2%
LiveCodeBench
54.6%
SciCode
34.6%
TerminalBench Hard
9.8%
MATH-500Não avaliado
AIMENão avaliado
AIME 2025
15.3%
IFBench
34.8%
Long Context Recall
20.0%
Tau2
26.6%
Média do MercadoMelhor Score