Question 1

Was ist Prompt Injection in einfachen Worten?

Accepted Answer

Prompt Injection bedeutet, eine KI auszutricksen, damit sie Ihren Anweisungen statt denen ihres Besitzers folgt. Ein großes Sprachmodell liest die Regeln des Entwicklers und Ihre Nachricht als einen einzigen Textblock. Wenn Sie also etwas schreiben, das wie ein Befehl aussieht, befolgt das Modell es möglicherweise. Das kann bedeuten, dass es seine verborgenen Anweisungen offenlegt, seine Beschränkungen ignoriert oder ein verbundenes Tool missbraucht. OWASP stuft es als das Risiko Nummer eins für LLM-Anwendungen ein.

Question 2

Ist Prompt Injection dasselbe wie ein Jailbreak?

Accepted Answer

Sie überschneiden sich, unterscheiden sich aber. Prompt Injection missbraucht die Anwendungsebene und nutzt aus, dass das Modell Entwickleranweisungen nicht von Nutzerdaten trennen kann, oft um einen System-Prompt offenzulegen oder ein Tool zu kapern. Ein Jailbreak zielt direkt auf das Sicherheitstraining des Modells ab, um es dazu zu bringen, Inhalte zu erzeugen, die es zu verweigern gelernt hat. Ein Jailbreak kann ein Schritt innerhalb einer Prompt-Injection-Kampagne sein, doch das eine kann auch ohne das andere auftreten.

Question 3

Lässt sich Prompt Injection beheben?

Accepted Answer

Nicht vollständig. Die Ursache ist architektonisch: Innerhalb des Modells gibt es keine Grenze zwischen Anweisungen und Daten, also gibt es kein Äquivalent zum Prepared Statement, das die SQL-Injection behoben hat. Verteidiger setzen auf Defense in Depth und stapeln Eingabefilter, Härtung des System-Prompts, Alignment-Training und Ausgabefilter, dazu Least Privilege und menschliche Überprüfung. Das erhöht die Kosten eines Angriffs, beseitigt aber nicht die Schwachstelle.

Question 4

Warum ist Prompt Injection gefährlich, wenn sie nur einen Chatbot betrifft?

Accepted Answer

Sie endet selten beim Chatbot. Moderne Assistenten sind mit Tools, Datenbanken und APIs verdrahtet, sodass eine erfolgreiche Injection Rückerstattungen auslösen, private Datensätze lesen, E-Mails versenden oder Daten über ein gerendertes Markdown-Bild exfiltrieren kann. Je mehr Fähigkeiten eine Anwendung ihrem Modell gibt, desto mehr ist eine einzige Injection wert, weshalb agentische Systeme den Einsatz drastisch erhöhen.

Blog

Karriere-Guides

Glossar

Zertifizierungen

Vergleiche

Tools

Autoren

Unternehmensschulung

Unsere Talente Einstellen

Prompt Injection

Warum es wichtig ist

Wie es funktioniert

Wie man darauf testet

Prävention

Wie wir Prompt Injection unterrichten