Agentic AI vs. Determinismus: Die Architektur für Security-Tests

KI im Security-Kontext: Wenn Unberechenbarkeit zum Risiko wird

Wenige Technologien haben den Sprung vom Experimentierlabor zum direkten Boardroom-Mandat so rasant vollzogen wie Künstliche Intelligenz. Investoren und Führungskräfte setzen KI flächendeckend durch – auch und gerade in der Cybersicherheit. Laut dem AI Security and Exposure Report 2026 von Pentera nutzen mittlerweile 100 Prozent der befragten CISOs KI in ihren Organisationen. Die logische Konsequenz: Auch das Security-Testing muss sich wandeln. Statische Testlogik reicht längst nicht mehr aus, um hochdynamische Umgebungen und adaptive Angriffstechniken abzubilden. Wer Angreifern – und zunehmend deren eigenen KI-Agenten – Paroli bieten will, muss Feuer mit Feuer bekämpfen.

Doch während der Einsatz von KI im Security-Testing unstrittig ist, offenbart sich bei der Architektur dieser Systeme eine fundamentale Diskrepanz. Der aktuelle Hype dreht sich um sogenannte Agentic AI – vollautonome Systeme, bei denen die KI von Anfang bis Ende die Kontrolle über die Ausführung übernimmt. Das klingt verlockend: größere Autonomie, tiefere Exploration, weniger Abhängigkeit von vordefinierter Logik. Doch für strukturierte Sicherheitsprogramme, die auf Wiederholbarkeit, kontrolliertes Retesting und messbare Ergebnisse angewiesen sind, ist dieses Modell ein Rohrkrepierer.

Das Problem der Probabilistik

In vielen KI-Anwendungen ist Varianz ein Feature. Ein Coding-Assistent mag für ein Problem drei verschiedene Lösungswege vorschlagen, ein Research-Modell unterschiedliche Argumentationslinien verfolgen. Diese probabilistische Natur fördert Kreativität und Entdeckung. Beim Benchmarking von Sicherheitskontrollen ist diese Variabilität jedoch ein Bug, kein Feature.

Wenn die Testmethodik bei jedem Durchlauf schwankt, wird es unmöglich zu validieren, ob eine Sicherheitslücke wirklich geschlossen wurde oder ob das KI-System einfach nur einen anderen Weg gewählt hat. In einem vollständig agentischen Modell steuert die KI die Ausführung von A bis Z. Das bedeutet: Die Techniken können sich zwischen zwei Testläufen drastisch ändern, einfach weil das System in der zweiten Runde andere Entscheidungen trifft.

Der naheliegende Ausweg – Human-in-the-loop – löst dieses Grundproblem nicht. Zwar können Analysten Entscheidungen prüfen und Aktionen freigeben, was Sicherheit und Kontrolle erhöht. Die Probabilistik des Systems bleibt jedoch bestehen. Bei identischen Startbedingungen kann die KI weiterhin völlig unterschiedliche Aktionssequenzen generieren. Die Last der Konsistenzsicherung wird somit komplett auf den menschlichen Analysten verlagert. Der manuelle Aufwand steigt, der Mehrwert der Automatisierung sinkt.

Die Hybrid-Architektur: Intelligenz mit Leitplanken

Die Lösung liegt nicht in der Abschaffung von Agentic AI, sondern in ihrer Domestizierung. Ein hybrider Ansatz trennt die Orchestrierung von der Adaptivität. Deterministische Logik definiert, wie Angriffsketten ausgeführt werden, und schafft so eine stabile, wiederholbare Struktur. Die KI wiederum reichert diesen Prozess an, indem sie Payloads adaptiert, Umgebungssignale interpretiert und Techniken basierend auf den vorgefundenen Gegebenheiten anpasst.

Der Unterschied ist in der Praxis entscheidend: Wird eine Privilege Escalation entdeckt, kann diese unter exakt denselben Bedingungen reproduziert werden. Nachdem ein Patch eingespielt wurde, läuft dieselbe Sequenz erneut. Ist die Lücke geschlossen, wissen wir: Das Problem ist behoben – und nicht, dass der Test-Engine einfach ein anderer Weg eingefallen ist. Es geht nicht darum, die KI zu fesseln, sondern sie zu verankern. KI stärkt die Validierung genau dann, wenn sie ein stabiles Ausführungsmodell erweitert, anstatt es bei jedem Lauf neu zu erfinden.

Vom Stresstest zur Continuous Validation

Diese Architekturfrage wird umso drängender, da sich die Art des Testens selbst wandelt. Security-Tests sind keine isolierten Events mehr, die einmal im Jahr stattfinden. Moderne Teams testen wöchentlich oder täglich, um Remediation abzusichern, Kontrollen zu benchoken und die Exposure über die Zeit hinweg zu tracken.

In diesem Tempo können Teams die Argumentationskette der KI hinter jedem einzelnen Test nicht manuell auditieren. Sie benötigen die Gewissheit, dass die Plattform ein konsistentes Modell anwendet, sodass Veränderungen in den Ergebnissen auch reale Veränderungen in der IT-Umgebung widerspiegeln. Der hybride Ansatz liefert genau das: Deterministische Orchestrierung bewahrt stabile Baselines, während die KI die Ausführung an die Realität des Zielsystems anpasst.

Genau dieses Modell bildet das Fundament von Penteras Plattform – einem deterministic attack engine, strukturiert durch jahrelange Forschung in Pentera Labs, ergänzt durch KI, die Techniken anhand von Umgebungsdaten anpasst. Für die Exposure Validation lautet die Antwort daher nicht Determinismus oder Agentic AI, sondern ein symbiotisches Sowohl als auch.

Fazit: Ein Weckruf an die Industrie

Der Diskurs um KI in der Cybersicherheit droht sich in Binäritäten zu verfangen: Entweder traditionelle Skripte oder vollautonome Agenten. Die Realität komplexer Enterprise-Netzwerke verlangt jedoch nach Nuancen. Wer Agentic AI ohne deterministische Leitplanken in Security-Tests entfesselt, opfert die Messbarkeit auf dem Altar der Autonomie. Die Erkenntnis, dass KI-Systeme in sicherheitskritischen Bereichen verankerte und wiederholbare Strukturen benötigen, ist ein wichtiger Schritt zur Reife der Branche. KI soll den Angreifer realistischer simulieren – aber der Verteidiger muss am Ende des Tages noch genau wissen, was eigentlich getestet wurde.

Quelle: The Hacker News

Agentic AI vs. Determinismus: Die Architektur für Security-Tests

KI im Security-Kontext: Wenn Unberechenbarkeit zum Risiko wird

Das Problem der Probabilistik

Die Hybrid-Architektur: Intelligenz mit Leitplanken

Vom Stresstest zur Continuous Validation

Fazit: Ein Weckruf an die Industrie

Kommentare

Cisco stopft kritische Lücken in ISE und Webex: RCE und Identitätsdiebstahl drohen

IT-Forensik als Druckmittel: Wenn Ausländerbehörden Handys ausspionieren

KI-Phishing und Datenklau: UAC-0247 greift ukrainische Kliniken an