xAI, la compañía de Elon Musk, ha lanzado
Grok 4.1, una versión avanzada de su modelo de IA. Esta actualización destaca por ofrecer conversaciones más humanas, con mejor empatía, más creatividad y mucha más precisión en sus respuestas. El chatbot ya se está implementando en
grok.com,
X y en las aplicaciones de
iOS y Android.
Lidera los rankings de la industria
Grok 4.1 obtuvo el primer lugar en
LMArena’s Text Arena, con una puntuación de
1.483 Elo, superando por 31 puntos al segundo lugar. Incluso sin funciones extendidas de razonamiento, logró
1.465 Elo, por encima de los modelos más avanzados de la competencia.
Durante una prueba silenciosa de dos semanas, los usuarios prefirieron Grok 4.1 frente a la versión anterior
casi el 65% de las veces.
Mejor empatía y menos errores
El modelo logró
1.586 puntos en EQ-Bench3, una prueba estricta de inteligencia emocional. Esto representa una mejora enorme respecto a los
1.206 puntos de Grok 4.
xAI explica que esta mejora se debe a un nuevo método de entrenamiento, usando otros sistemas avanzados de IA como evaluadores para ayudar al modelo a entender mejor el tono y las emociones.
En cuanto a precisión factual, los errores bajaron notablemente:
- De 12,09% a 4,22% en preguntas reales.
- En FActScore, que evalúa biografías, los fallos bajaron de 9,89% a menos del 3%.
Gran avance en escritura creativa
En pruebas de escritura creativa, Grok 4.1 alcanzó
1.708,6 Elo, colocándose entre los mejores modelos del mundo.
xAI señala que ahora el chatbot:
- Mantiene mejor la personalidad de la conversación
- Interpreta mejor las intenciones del usuario
- Es más consistente y colaborativo
- Mantiene precisión técnica mientras escribe
Con todas estas mejoras, Grok 4.1 se presenta como la versión más humana, precisa y creativa de la serie Grok hasta ahora.