Question 1

Qué es la seguridad de LLM?

Accepted Answer

La seguridad de LLM es la disciplina de proteger las aplicaciones construidas sobre grandes modelos de lenguaje frente a ataques que apuntan al propio modelo, incluyendo la inyección de prompts, los jailbreaks, la divulgación de información sensible, el envenenamiento de datos y de modelos, y la agencia excesiva. Como el modelo no puede separar de forma fiable las instrucciones de los datos, la seguridad de LLM se construye sobre la defensa en profundidad: apilando barreras de entrada, endurecimiento del prompt de sistema, entrenamiento de alineación, barreras de salida, mínimo privilegio, registro y supervisión humana.

Question 2

Qué es el OWASP Top 10 para Aplicaciones de LLM?

Accepted Answer

Es la lista de referencia del sector con los riesgos más críticos de las aplicaciones de LLM, encabezada por la inyección de prompts en el número uno (LLM01). La lista también cubre la divulgación de información sensible, los riesgos de la cadena de suministro, el envenenamiento de datos y de modelos, el manejo inadecuado de la salida, la agencia excesiva, la fuga del prompt de sistema, las debilidades de vectores y embeddings, la desinformación y el consumo no acotado. OWASP también mantiene listas complementarias para el Model Context Protocol y para los agentes autónomos.

Question 3

Cuáles son las cuatro capas de defensa de un LLM?

Accepted Answer

La mayoría de las aplicaciones de LLM usan cuatro capas defensivas: barreras de entrada que filtran el prompt, endurecimiento del prompt de sistema que aísla la entrada no confiable con delimitación o datamarking, entrenamiento de alineación y adversario integrado en el modelo, y barreras de salida que examinan la respuesta en busca de filtraciones o contenido dañino. Cada capa tiene un bypass documentado, así que se despliegan juntas junto con el mínimo privilegio, la limitación de tasa, el registro y una persona en el bucle para las acciones de alto riesgo.

Question 4

En qué se diferencia la seguridad de LLM de la seguridad de aplicaciones tradicional?

Accepted Answer

La seguridad de aplicaciones tradicional a menudo puede eliminar por completo una clase de bug, como las sentencias preparadas acaban con la inyección SQL al separar el código de los datos. La seguridad de LLM no puede, porque el modelo no tiene esa frontera, así que el riesgo principal no tiene una solución completa. El trabajo se desplaza del parcheo a la reducción de riesgos: apilar controles imperfectos, limitar el radio de impacto con mínimo privilegio, monitorizar de forma agresiva y hacer red teaming de manera continua a medida que aparecen nuevas técnicas de ataque.

Blog

Guías de carrera

Glosario

Certificaciones

Comparativas

Herramientas

Autores

Formación corporativa

Contrata nuestro talento

LLM Security

Por qué importa

Cómo funciona

Cómo probarlo

Prevención

Cómo enseñamos LLM Security