OpenAI idenfiticó a más de 20 ataques cibernéticos y de manipulación recientes que involucraron el uso de su modelo de inteligencia artificial (IA) generativa con fines maliciosos, según un informe publicado este mes. El reporte expone cómo actores estatales, incluidos hackers vinculados a China, Irán y Rusia, han utilizado herramientas como ChatGPT para desarrollar malware, ejecutar ataques de phishing y llevar a cabo campañas de desinformación en redes sociales.
El grupo SweetSpecter, con sede en China, fue uno de los actores destacados en el informe. Este grupo ejecutó ataques de spear-phishing dirigidos contra gobiernos asiáticos y personal de OpenAI. En uno de los casos, los atacantes enviaron correos electrónicos que simulaban problemas con servicios de ChatGPT e incluían archivos ZIP con malware oculto, conocido como “SugarGh0st RAT”. Si el archivo era abierto, el malware tomaba control del dispositivo afectado, permitiendo a los atacantes ejecutar comandos y robar datos sin ser detectados.
Por otro lado, CyberAv3ngers, un grupo vinculado a la Guardia Revolucionaria Islámica de Irán, utilizó ChatGPT para explorar vulnerabilidades en sistemas industriales y hackear equipos de control de agua en Estados Unidos e Irlanda. En noviembre de 2023, lograron interrumpir temporalmente el suministro de agua en la localidad de Aliquippa, Pensilvania. En otro incidente, causaron un apagón de dos días en servicios hídricos en el condado de Mayo, Irlanda. Las investigaciones revelaron que los atacantes se apoyaron en herramientas de IA para diseñar y refinar scripts maliciosos.
Asimismo, STORM-0817, otro grupo iraní, centró sus esfuerzos en el desarrollo de malware dirigido a dispositivos Android. Su software permitía extraer información confidencial, como registros de llamadas, contactos y archivos de mensajería. El grupo también buscó asistencia en ChatGPT para depurar códigos y perfeccionar técnicas de raspado de datos de redes sociales como Instagram, lo que revela cómo los modelos de IA están siendo integrados en múltiples fases de ataques complejos.
El informe no solo documenta ataques cibernéticos, sino también campañas de influencia basadas en la generación de contenido con IA.
La operación conocida como A2Z es un ejemplo de cómo se pueden gestionar campañas de desinformación a gran escala mediante ChatGPT. Este grupo utilizó el modelo para crear biografías y comentarios en varias lenguas, los cuales fueron publicados en plataformas como X (anteriormente Twitter) y Facebook. Los mensajes en inglés e italiano, por ejemplo, promovían la imagen de Azerbaiyán como proveedor clave de energía para Europa y minimizaban las críticas sobre su historial de derechos humanos.
Otra operación denominada Stop News, de origen ruso, utilizó ChatGPT para producir artículos y comentarios en inglés, francés y ruso. El grupo creó una serie de sitios web que simulaban ser medios de comunicación en África y el Reino Unido, aunque la mayoría de sus publicaciones no alcanzó gran repercusión. Además, acompañaron los artículos con imágenes generadas por DALL·E, una herramienta generativa de OpenAI, aunque estas tampoco lograron atraer una audiencia significativa.
Un incidente inusual documentado en el informe fue un engaño vinculado a trolls rusos. En este caso, los operadores difundieron un mensaje falso en X que aparentaba ser un error generado por ChatGPT al intentar apoyar contenido favorable al ex presidente estadounidense Donald Trump. La publicación ganó tracción en redes sociales y se viralizó rápidamente, lo que, según el informe, refleja cómo la desinformación puede amplificarse incluso cuando no proviene directamente de la IA
Aunque las investigaciones de OpenAI concluyen que los actores maliciosos no lograron desarrollar variantes completamente nuevas de malware mediante IA, el informe subraya que las herramientas de inteligencia artificial han facilitado a estos grupos la ejecución de ataques más rápidos y eficientes. Los modelos de IA, como ChatGPT, fueron particularmente útiles para realizar tareas intermedias, como la depuración de códigos y la elaboración de correos maliciosos, lo que optimizó la capacidad operativa de los atacantes sin necesidad de desarrollar conocimientos técnicos avanzados.
El informe subraya que la combinación de herramientas de IA con técnicas tradicionales plantea un desafío significativo para la industria de la ciberseguridad. Los modelos de lenguaje permiten a los atacantes reducir tiempos de desarrollo, identificar vulnerabilidades de forma más precisa y diseñar campañas de phishing más personalizadas, incrementando el potencial de daño.
En respuesta a estas amenazas, OpenAI dijo que ha fortalecido sus protocolos de seguridad y ha creado equipos especializados en la detección y prevención de usos maliciosos de sus modelos. La empresa también está trabajando en colaboración con otras compañías tecnológicas y organizaciones gubernamentales para compartir información sobre amenazas emergentes y coordinar acciones preventivas. “La cooperación es esencial para anticipar riesgos y garantizar que nuestras herramientas se utilicen con fines positivos”, señaló OpenAI en el informe.
El documento destaca que la industria tecnológica debe adoptar una postura proactiva ante estos desafíos. “No es solo responsabilidad de OpenAI”, advierte el informe, instando a las otras empresas de inteligencia artificial generativa a implementar medidas de seguridad efectivas. Esto incluye la creación de algoritmos más robustos capaces de detectar y bloquear actividades maliciosas antes de que se conviertan en amenazas reales.