Hermes 4 acaba de demostrar que la IA de código abierto puede vencer a OpenAI.

2025-09-03 00:4210 minuto de lectura

Introducción al contenido

El video discute la introducción de Hermes 4, un modelo de lenguaje avanzado de código abierto que cuenta con 405 mil millones de parámetros y destaca en razonamiento, logrando puntuaciones superiores al 96% en pruebas. Además, cubre el modelo de lenguaje de regresión de Google (RLM), que tiene como objetivo predecir el comportamiento de sistemas complejos con notable precisión, aprovechando texto estructurado en lugar de enfoques tradicionales. Se resalta el contraste entre los métodos innovadores de Hermes 4 y los modelos tradicionales, mostrando las capacidades de Hermes 4 para proporcionar un razonamiento flexible y más profundo mientras mantiene el contexto y asegura la seguridad. El rendimiento del RLM supera significativamente a los antiguos modelos de regresión, demostrando su adaptabilidad y eficiencia en el procesamiento de formatos de datos complejos. Finalmente, el video enfatiza el potencial de estos avances para mejorar la utilidad de la IA en varios dominios y las ventajas de plataformas como Magi que agilizan el uso de la IA, haciendo que los modelos avanzados sean más accesibles.

Información Clave

  • Hermes 4 es un poderoso modelo de inteligencia artificial con 405 mil millones de parámetros que destaca en pruebas de razonamiento con puntuaciones superiores al 96%.
  • Google ha introducido un nuevo marco de Modelo de Lenguaje de Regresión (RLM) diseñado para predecir comportamientos de sistemas complejos con alta precisión.
  • RLM representa un cambio significativo en la IA al permitir la predicción y el manejo de datos en formatos de texto estructurados, mejorando la velocidad y la adaptabilidad.
  • Hermes 4 presenta un enfoque de razonamiento híbrido, respondiendo directamente a consultas simples y participando en un razonamiento detallado para preguntas complejas.
  • Los modelos están diseñados para proporcionar medidas de confianza junto con las predicciones, haciéndolos más efectivos para simulaciones y gemelos digitales.
  • Magi es una plataforma que agrega varios modelos de IA, permitiendo a los usuarios interactuar con múltiples herramientas en un solo espacio de trabajo, optimizando los flujos de trabajo.
  • Los precios de Magi ofrecen planes asequibles, lo que lo hace accesible para usuarios individuales y equipos.

Análisis de la línea de tiempo

Palabras clave del contenido

Hermes 4

Hermes 4 es un modelo de IA de 405 mil millones de parámetros que destaca en el razonamiento y muestra toda su cadena de pensamiento, logrando puntuaciones superiores al 96% en pruebas de razonamiento. Está disponible en múltiples versiones, incluyendo una con 14 mil millones de parámetros y otra con 70 mil millones, todas construidas sobre Meta Lama 3.1. El modelo incorpora técnicas innovadoras post-entrenamiento, demostrando la eficiencia de los desarrollos de código abierto.

Razonamiento Híbrido

Hermes 4 demuestra una capacidad única de razonamiento híbrido, lo que le permite alternar entre respuestas directas y procesos de razonamiento detallados según sea necesario. Esto añade un equilibrio de simplicidad para consultas directas mientras proporciona explicaciones extensas para aquellas más complejas.

Data Forge

Data Forge es un sistema innovador utilizado en el desarrollo de Hermes 4, que crea materiales de entrenamiento sintéticos en lugar de utilizar datos desordenados tradicionales de internet. Emplea una estructura gráfica compleja para reconfigurar los datos, ampliando los límites de cómo se generan los datos de entrenamiento.

Google RLM

El marco del Modelo de Lenguaje de Regresión (RLM) de Google tiene como objetivo mejorar las predicciones para sistemas grandes al redefinir los procesos de regresión como texto a texto. Este nuevo enfoque simplifica la predicción de comportamientos complejos de sistemas sin necesidad de una extensa ingeniería de características, haciendo que el sistema sea adaptable y eficiente.

Plataforma de Integración de IA

Magi es una plataforma integral que permite a los usuarios acceder a más de 50 modelos de IA líderes, incluidos GPT-5 y Claude Pro, en un único espacio de trabajo. Facilita los flujos de trabajo al permitir a los usuarios cambiar de modelos en medio de una conversación sin perder contexto, beneficiando a los profesionales de la creación de contenido y el marketing.

Preguntas y respuestas relacionadas

¿Qué es Hermes 4?

Hermes 4 es un nuevo modelo de IA con 405 mil millones de parámetros que puede demostrar una cadena completa de pensamiento y alcanzar puntajes de prueba de razonamiento superiores al 96%.

¿Cuántas versiones de Hermes 4 hay?

Hermes 4 viene en tres versiones: 14 mil millones de parámetros, 70 mil millones de parámetros y la versión completa con 405 mil millones de parámetros.

¿Qué avances logró Hermes 4 en las pruebas de razonamiento?

Hermes 4 aplastó las pruebas de razonamiento con puntajes superiores al 96%.

¿Cuáles son los avances mencionados en relación con Hermes 4?

Hubo dos avances significativos: el lanzamiento de Hermes 4 y la introducción de un sistema de modelo de lenguaje de regresión por parte de Google.

¿Qué técnicas se utilizaron para desarrollar Hermes 4 sin conjuntos de datos secretos?

Hermes 4 se basó en técnicas inteligentes aplicadas después del entrenamiento base en lugar de utilizar conjuntos de datos secretos o canales cerrados.

El término 'razonamiento híbrido' se refiere en el contexto de Hermes 4 a la combinación de diferentes enfoques de razonamiento, que pueden incluir tanto métodos lógicos como probabilísticos.

El razonamiento híbrido significa que Hermes 4 puede proporcionar respuestas directas a preguntas simples y cambiar a un modo de razonamiento para consultas más complejas, delineando su lógica completa paso a paso.

¿Qué sistema innovador sostiene la capacidad de razonamiento de Hermes 4?

La capacidad de razonamiento de Hermes 4 está respaldada por un sistema llamado DataForge, que genera material de entrenamiento sintético.

¿Cómo fue entrenado Hermes 4?

Hermes 4 fue entrenado con 5 millones de muestras que totalizan 19 mil millones de tokens, con ejemplos sobredimensionados para mejorar las capacidades de razonamiento en formato largo.

Atropos, in relation to Hermes 4, typically refers to one of the three Fates (or Moirai) in Greek mythology. Atropos is the Fate who cuts the thread of life, determining the moment of death for mortals. Hermes, on the other hand, is often seen as a messenger of the gods, as well as a guide for souls to the afterlife.Atropos, en relación con Hermes 4, típicamente se refiere a una de las tres Parcas (o Moiras) en la mitología griega. Atropos es la Parca que corta el hilo de la vida, determinando el momento de la muerte de los mortales. Hermes, por otro lado, es visto a menudo como un mensajero de los dioses, así como un guía para las almas hacia el más allá.

Atropos es un entorno de aprendizaje por refuerzo de código abierto utilizado por Noose Research para mejorar la calidad de Hermes 4.

¿Qué es el sistema RLM de Google?

El marco del modelo de lenguaje de regresión (RLM) tiene como objetivo abordar los desafíos de predecir cómo se comportan los sistemas complejos, ofreciendo un enfoque más eficiente y adaptable en comparación con los métodos tradicionales.

¿Cómo mejora RLM en comparación con los métodos de regresión tradicionales?

RLM permite hacer predicciones utilizando texto estructurado en lugar de requerir aplanar los datos en tablas y puede adaptarse rápidamente a nuevas tareas con ejemplos mínimos.

Más recomendaciones de videos

Compartir a: