San José, 6 de diciembre (elmundo.cr) – La inteligencia artificial ha cambiado las reglas del juego en todas las áreasy la ciberseguridad no escapa a esta afirmación. Hasta el punto de que puede ser un elemento clave Prevención y detección de ciberataques y también una herramienta para amplificar acciones maliciosas. Pero la IA también puede ser engañada y servir como vector para dañar a las víctimas. ESETLíder en detección proactiva de amenazas, la técnica PromptFix, conocida como inyección rápida, analiza qué consecuencias puede tener esto para las víctimas y cómo pueden protegerse de esta amenaza.
PromptFix es una variante especial de inyección rápida que se utiliza para engañar a los asistentes integrados en los navegadores. Utilizando instrucciones ocultas, engaña a la IA para que interactúe con sitios web maliciosos o de phishing. El término surge como un mayor desarrollo de la tecnología. Haga clic en «Reparar».que engaña a los usuarios para que hagan clic en confirmaciones falsas para realizar acciones maliciosas.
«Los actores maliciosos insertan instrucciones ocultas en contenido aparentemente legítimo para que la IA realice ciertas acciones sin que el usuario lo sepa o tenga que intervenir. Por ejemplo, hacer clic en botones invisibles que simulan verificación, descargar archivos maliciosos o interactuar con enlaces fraudulentos». comenta Martina López, investigadora de seguridad informática de ESET Latinoamérica.
Para que un ataque PromptFix sea efectivo, los ciberdelincuentes ocultan instrucciones maliciosas en sitios web comprometidos o en el contenido que controlan, incluso en redes sociales o plataformas públicas (comentarios en Reddit, publicaciones en Facebook). Algunas técnicas pueden incluir ocultar instrucciones en texto invisible o comentarios HTML, insertar texto oculto en imágenes u ocultar información en archivos digitales sin cambiar su apariencia.
El ataque funciona cuando un usuario navega por un sitio web comprometido y utiliza el asistente de inteligencia artificial del navegador para resumir el contenido o extraer puntos clave. El modelo procesa todo el texto sin distinguir entre datos e instrucciones. De esta forma, los comandos ocultos se interpretan como si fueran solicitudes legítimas de los usuarios. Esto puede hacer que el agente realice acciones no deseadas, como interactuar con enlaces fraudulentos o iniciar descargas.
Algunas consecuencias de un ataque PromptFix pueden provocar que la IA descargue archivos maliciosos infectados con malware, haga clic en botones ocultos para omitir los pasos de validación o siga enlaces de phishing y revele credenciales.
Dado que un rasgo característico de un ataque PromptFix es que puede realizar acciones sin la intervención y/o conocimiento de la víctima, ESET destaca algunos buenos hábitos para proteger y prevenir:
- No permitir acciones automáticas de forma predeterminada: Si la inteligencia artificial quiere hacer clic, enviar archivos o completar formularios, primero debe preguntar y recibir confirmación del usuario.
- Restringir al agente: No le dé permiso a la IA para navegar libremente por Internet, acceder a contraseñas guardadas o utilizar la función de autocompletar.
- Verifique imágenes y archivos antes de procesarlos: Dado que los ciberatacantes pueden ocultar instrucciones en imágenes o archivos, lo ideal es ejecutar un filtro que busque texto oculto o señales extrañas.
- Utilice listas de sitios web confiables: Permita que el agente interactúe únicamente con sitios web conocidos y confiables. Si ve un enlace sospechoso, debe bloquearlo y solicitar autorización.