Question 1

Was ist LLM-Sicherheit?

Accepted Answer

LLM-Sicherheit ist die Disziplin, auf großen Sprachmodellen aufgebaute Anwendungen vor Angriffen zu schützen, die auf das Modell selbst abzielen, darunter Prompt Injection, Jailbreaks, Offenlegung sensibler Informationen, Daten- und Modellvergiftung sowie übermäßige Handlungsfreiheit. Da das Modell Anweisungen nicht zuverlässig von Daten trennen kann, baut die LLM-Sicherheit auf Defense in Depth: das Schichten von Eingabe-Guardrails, Härtung des System-Prompts, Alignment-Training, Ausgabe-Guardrails, Least Privilege, Logging und menschlicher Aufsicht.

Question 2

Was sind die OWASP Top 10 für LLM-Anwendungen?

Accepted Answer

Es ist die Branchenreferenzliste der kritischsten Risiken in LLM-Anwendungen, angeführt von der Prompt Injection auf Platz eins (LLM01). Die Liste deckt außerdem die Offenlegung sensibler Informationen, Lieferkettenrisiken, Daten- und Modellvergiftung, unsachgemäße Ausgabeverarbeitung, übermäßige Handlungsfreiheit, das Leaken des System-Prompts, Schwächen bei Vektoren und Embeddings, Fehlinformation und unbegrenzten Verbrauch ab. OWASP pflegt zudem begleitende Listen für das Model Context Protocol und für autonome Agenten.

Question 3

Was sind die vier Ebenen der LLM-Verteidigung?

Accepted Answer

Die meisten LLM-Anwendungen nutzen vier Verteidigungsebenen: Eingabe-Guardrails, die den Prompt sieben, Härtung des System-Prompts, die nicht vertrauenswürdige Eingaben mit Trennzeichen oder Datamarking isoliert, Alignment- und adversariales Training, das in das Modell eingebacken ist, und Ausgabe-Guardrails, die die Antwort auf Lecks oder schädliche Inhalte prüfen. Jede Ebene hat einen dokumentierten Bypass, also werden sie zusammen eingesetzt, ergänzt um Least Privilege, Rate Limiting, Logging und einen Menschen in der Schleife für risikoreiche Aktionen.

Question 4

Wie unterscheidet sich LLM-Sicherheit von traditioneller Anwendungssicherheit?

Accepted Answer

Traditionelle Anwendungssicherheit kann eine Fehlerklasse oft vollständig beseitigen, so wie Prepared Statements die SQL-Injection töten, indem sie Code von Daten trennen. LLM-Sicherheit kann das nicht, weil das Modell keine solche Grenze hat, sodass das oberste Risiko keine vollständige Lösung hat. Die Arbeit verlagert sich vom Patchen zur Risikoreduktion: das Stapeln unvollkommener Kontrollen, das Begrenzen des Schadensradius mit Least Privilege, aggressives Monitoring und fortlaufendes Red Teaming, sobald neue Angriffstechniken auftauchen.

Blog

Karriere-Guides

Glossar

Zertifizierungen

Vergleiche

Tools

Autoren

Unternehmensschulung

Unsere Talente Einstellen

LLM Security

Warum es wichtig ist

Wie es funktioniert

Wie man darauf testet

Prävention

Wie wir LLM Security unterrichten