Antrópico, la inteligencia artificial ha revelado que un grupo hacker patrocinado por el Estado chino manipuló su sistema de IA Claude para llevar a cabo una campaña de ciberespionaje a gran escala dirigida a grandes corporaciones y agencias gubernamentales en todo el mundo. Se informa que los atacantes utilizaron las capacidades autónomas de Claude para ejecutar ciberataques sofisticados con supervisión humana mínima. "A mediados de septiembre de 2025, detectamos actividad sospechosa que una investigación posterior determinó como una campaña de espionaje altamente sofisticada. Los atacantes utilizaron las capacidades "agentiales" de la IA en un grado sin precedentes, empleando la IA no solo como asesora, sino para ejecutar los ciberataques ellos mismos."
Resultados electorales 2025
Resultados electorales en Bihar: la NDA lidera en más de 150 escaños, el MGB va por detrás; JD(U) es el partido más grande hasta ahora
Resultado de Raghopur: El heredero del RJD Tejashwi Yadav lidera en tendencias; Satish Yadav, del BJP, va por detrás
NDA gana ventaja; BJP y JD(U) mantienen ventaja sobre RJD en las primeras tendencias — aspectos destacados
Anthropic 'culpa' a un grupo de hackers chinos
Anthropic ha revelado que en la investigación descubrió que los actores amenazantes explotaron Claude Code, una variante centrada en desarrolladores del modelo Claude, haciendo jailbreak de sus protocolos de seguridad y disfrazando tareas maliciosas como operaciones legítimas de ciberseguridad. La empresa reveló además que los hackers chinos intentaron engañar a Claude haciéndole creer que el agente de IA estaba realizando pruebas defensivas que le permitían:
ul1- li1Sistemas de infiltración de más de 30 objetivos globales
- li1Recopilar credenciales y exfiltrar datos sensibles
- li1Crear puertas traseras y documentar estrategias de ataque de forma autónoma
"El actor de amenaza—a quien evaluamos con gran confianza como un grupo patrocinado por el Estado chino—manipuló nuestra herramienta Claude Code para intentar infiltrarse en unos treinta objetivos globales y tuvo éxito en un pequeño número de casos.
La operación se dirigió a grandes empresas tecnológicas, instituciones financieras, empresas manufactureras de productos químicos y agencias gubernamentales", añadió la compañía. Anthropic también destacó que este es el primer caso documentado de un ciberataque ejecutado principalmente por un agente de IA, con Claude realizando entre el 80 y el 90% de las tareas de la campaña. Estas incluían reconocimiento, escaneo de vulnerabilidades, desarrollo de exploits y extracción de datos, a velocidades y escalas inalcanzables para hackers humanos." Esta campaña tiene implicaciones sustanciales para la ciberseguridad en la era de los agentes de IA", afirmó Anthropic. "Las barreras para realizar ciberataques sofisticados han disminuido sustancialmente."
Cómo funcionó el ciberataque
Anthropic también explicó el proceso completo de cómo se produjo el ciberataque. El ataque se basó en varias características de los modelos de IA que no existían, o estaban en una forma mucho más incipiente, hace apenas un año:
- li1Inteligencia. Los niveles generales de capacidad de los modelos han aumentado hasta el punto de que pueden seguir instrucciones complejas y comprender el contexto de manera que hacen posibles tareas muy sofisticadas. No solo eso, sino que varias de sus habilidades específicas bien desarrolladas, en particular, la codificación de software, se prestan a ser utilizadas en ataques cibernéticos.
- li1Agencia. Los modelos pueden actuar como agentes, es decir, pueden ejecutarse en bucles en los que toman acciones autónomas, encadenan tareas y toman decisiones con solo una participación humana mínima y ocasional.
- li1Herramientas. Los modelos tienen acceso a una amplia gama de herramientas de software (a menudo a través del protocolo de contexto del modelo de estándar abierto). Ahora pueden buscar en la web, recuperar datos y realizar muchas otras acciones que antes eran dominio exclusivo de los operadores humanos. En el caso de los ciberataques, las herramientas pueden incluir descifradores de contraseñas, escáneres de red y otro software relacionado con la seguridad.
Fortalecimiento de las defensas y la transparencia
En respuesta, Anthropic:
ul1- li1Cuentas comprometidas prohibidas
- li1Organizaciones afectadas notificadas
- li1Coordinado con las autoridades mundiales
- li1Herramientas de detección y clasificadores mejorados para identificar futuros usos indebidos
La compañía está instando a la comunidad tecnológica y de seguridad en general a adoptar estrategias de defensa impulsadas por IA, incluida la detección automatizada de amenazas y los sistemas de respuesta a incidentes.