Inyección indirecta de prompts: cómo las personas manipulan las redes neuronales

Un estudio de Kaspersky destaca un aumento en la inyección indirecta de prompts, una técnica para manipular modelos de lenguaje como ChatGPT. Aunque no se han reportado daños graves, persiste el riesgo de mal uso.

Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…

Los LLM son herramientas poderosas que se utilizan en diversas aplicaciones, desde el análisis de documentos hasta la contratación de personal e incluso la investigación de amenazas.

Sin embargo, los analistas de Kaspersky han descubierto una vulnerabilidad que permite a los ciberdelincuentes insertar instrucciones ocultas en páginas web y documentos online, las cuales pueden ser recogidas por sistemas basados en LLM, influyendo potencialmente en los resultados de búsqueda o en las respuestas de chatbot.

El estudio identificó varios usos para la inyección indirecta de prompts :

Inyecciones relacionadas con recursos humanos. Los solicitantes de empleo están insertando prompts en sus currículos para manipular los algoritmos de contratación y garantizar resultados favorables o priorización por parte de los sistemas de IA. Se utilizan técnicas como el uso de fuentes pequeñas o la adaptación del color del texto al fondo.
Inyecciones publicitarias. Los anunciantes están colocando inyecciones de prompts en las páginas de destino para influir en los chatbots de búsqueda y hacer que generen reseñas positivas de productos.
Inyección como protesta. Personas que se oponen al uso generalizado de LLMs están insertando prompts de protesta en sus webs personales y perfiles de redes sociales, expresando su desacuerdo a través de instrucciones humorísticas, serias o agresivas.
Inyección como insulto. En las redes sociales, los usuarios están utilizando la inyección de prompts como una forma de insulto o para frenar bots de spam, a menudo con solicitudes para generar poemas, arte ASCII u opiniones sobre temas políticos.

Aunque el estudio no ha encontrado pruebas de uso malicioso con fines lucrativos, pone de relieve posibles riesgos futuros. Por ejemplo, los atacantes podrían manipular LLMs para difundir desinformación o extraer datos sensibles. “La inyección indirecta de prompts es una vulnerabilidad novedosa que destaca la necesidad de medidas de seguridad robustas en la era de la IA. Al entender estos riesgos e implementar salvaguardias apropiadas, podemos asegurar que los LLM se utilicen de manera segura y responsable”, comenta Vladislav Tushkanov, gerente del Grupo de Desarrollo de Investigación en el Equipo de Investigación de Tecnología de Aprendizaje Automático de Kaspersky.

Te puede interesar

Albert Triola, Vicepresidente Sénior, Ventas de Renovación de Soporte EMEA y Country Leader Oracle España

Oracle CloudWorld Tour Madrid: Oracle ampliará por cinco su infraestructura cloud en España en 2025

Para proteger tus sistemas actuales y futuros basados en modelos de lenguaje grande (LLM), considera los siguientes consejos:

Comprende las posibles vulnerabilidades en tus sistemas basados en LLM y evalúa los riesgos asociados con los ataques de inyección de prompts.
Ten en cuenta los riesgos reputacionales, ya que los bots de marketing pueden ser manipulados para hacer declaraciones radicales, lo que podría dañar tu reputación.
Respeta los límites de la protección. La protección completa contra la inyección de prompts no es posible, especialmente con ataques más complejos como las inyecciones multimodales.
Utiliza herramientas de moderación de entradas y salidas para filtrar las de los LLM, aunque puede que no ofrezcan una seguridad total.
Reconoce los riesgos que surgen al procesar contenido no fiable o no verificado en sistemas LLM.
Restringe las capacidades de toma de decisiones de los sistemas de IA para prevenir acciones no intencionadas.
Asegúrate de que todos los ordenadores y servidores que ejecuten sistemas basados en LLM estén protegidos con herramientas y prácticas de seguridad actualizadas.

Etiquetas

chatbot ciberdelincuentes ia generativa inteligencia artificial kaspersky llm prompts

Hernán Rodríguez

Editor en La Ecuación Digital. Consultor de Innovación y Estrategia Digital.

Inyección indirecta de prompts: cómo las personas manipulan las redes neuronales

Bit2Me STX completa pruebas del bono tokenizado de Valorix ante la CNMV

Samsung activa IA visual en tiempo real en móviles Galaxy S25

El Gobierno aprueba el DNI digital para uso presencial a través de MiDNI

CIOs del IBEX 35 analizan la digitalización empresarial en ASLAN 2025

Servicios financieros embebidos e IA impulsan la digitalización bancaria en 2025

Huawei y Meliá avanzan en la digitalización hotelera con hoteles inteligentes

Colaboración de Gaia-X y empresas japonesas impulsa intercambio de datos

Europa impulsa su soberanía digital con Gaia-X y el Reglamento EHDS

Datos y digitalización: aliados estratégicos para el futuro del sector agrario

Telefónica aprueba dividendo de 0,30€ y ratifica a Murtra como consejero

Atlassian expande su plataforma de IA Rovo a todos los planes de Jira

Reino Unido contrata a Atos para renovar el servicio TI del DEFRA por 150 millones

La UE y Corea del Sur firman un acuerdo de comercio digital

Atlassian expande su plataforma de IA Rovo a todos los planes de Jira

Cobas AM automatiza atención al cliente con IA de IBM e Integra

Legalpin certifica comunicaciones digitales válidas en juicios

Startups españolas aplican IA sanitaria en programa de Google

OVHcloud selecciona las finalistas del Fast Forward AI Accelerator

Madrid lanza DesafIA para impulsar startups con retos tecnológicos

Datos, IA y trabajo híbrido: Cisco plantea los retos digitales clave en el Cisco Engage 2025

La inteligencia artificial lidera el programa de VivaTech 2025 en París

IA y turismo: cómo la tecnología fintech ayuda a gestionar gastos en los viajes

La revolución LendTech en el sector financiero: retos y oportunidades

Unicaja entra en el consejo de administración de Bit2Me y se convierte en el banco de referencia de la fintech española

Microsoft y CCOO ofrecerán formación en IA a más de un millón de afiliados

MasOrange y Fundación Orange formarán en digitalización a 26.000 personas

KeepCoding lanza becas tecnológicas para fomentar empleo digital en zonas rurales

Telefónica aprueba dividendo de 0,30€ y ratifica a Murtra como consejero

OpenAI se valora en 300.000 millones tras cerrar financiación con SoftBank

Huawei eleva ingresos un 22% en 2024 pese a sanciones y baja del beneficio