Question 1

Cos'è la sicurezza degli LLM?

Accepted Answer

La sicurezza degli LLM è la disciplina che protegge le applicazioni costruite su large language model dagli attacchi che prendono di mira il modello stesso, tra cui la prompt injection, i jailbreak, la divulgazione di informazioni sensibili, l'avvelenamento di dati e modelli e l'eccesso di autonomia. Poiché il modello non riesce a separare in modo affidabile le istruzioni dai dati, la sicurezza degli LLM si fonda sulla difesa in profondità: stratificando guardrail di input, hardening del prompt di sistema, addestramento all'allineamento, guardrail di output, privilegio minimo, logging e supervisione umana.

Question 2

Cos'è la OWASP Top 10 per le applicazioni LLM?

Accepted Answer

È la lista di riferimento del settore dei rischi più critici nelle applicazioni LLM, guidata dalla prompt injection al numero uno (LLM01). La lista copre anche la divulgazione di informazioni sensibili, i rischi della supply chain, l'avvelenamento di dati e modelli, la gestione impropria dell'output, l'eccesso di autonomia, la fuga del prompt di sistema, le debolezze di vettori ed embedding, la disinformazione e il consumo senza limiti. OWASP mantiene anche liste complementari per il Model Context Protocol e per gli agenti autonomi.

Question 3

Quali sono i quattro livelli di difesa degli LLM?

Accepted Answer

La maggior parte delle applicazioni LLM usa quattro livelli difensivi: guardrail di input che filtrano il prompt, hardening del prompt di sistema che isola l'input non attendibile con delimitazione o datamarking, addestramento all'allineamento e avversariale integrato nel modello, e guardrail di output che analizzano la risposta alla ricerca di fughe o contenuti dannosi. Ogni livello ha un bypass documentato, quindi vengono adottati insieme al privilegio minimo, al rate limiting, al logging e a un umano nel circuito decisionale per le azioni ad alto rischio.

Question 4

In cosa differisce la sicurezza degli LLM dalla sicurezza applicativa tradizionale?

Accepted Answer

La sicurezza applicativa tradizionale può spesso eliminare del tutto una classe di bug, come i prepared statement annullano la SQL injection separando il codice dai dati. La sicurezza degli LLM non può, perché il modello non ha un simile confine, quindi il rischio principale non ha una soluzione completa. Il lavoro passa dal patching alla riduzione del rischio: sovrapporre controlli imperfetti, limitare il raggio d'azione con il privilegio minimo, monitorare in modo aggressivo e fare red teaming di continuo man mano che compaiono nuove tecniche di attacco.

Blog

Guide alla carriera

Glossario

Certificazioni

Confronti

Strumenti

Autori

Formazione aziendale

Assumi i nostri talenti

Sicurezza degli LLM

Perché è importante

Come funziona

Come testarla

Prevenzione

Come insegniamo Sicurezza degli LLM