System Frame Persistence (SFP)

Die SFP-Studie untersucht, wie stabil große Sprachmodelle gesetzte Regeln und Entscheidungslogiken über mehrere Interaktionsschritte hinweg einhalten.

Getestet wurden acht öffentlich zugängliche Systeme (M1–M8) unter identischen Bedingungen, ohne API-Zugriff oder Systemanpassungen.

 

Stufe 1 (Formale Persistenz)

Aufgabe: Einhaltung einfacher formaler Regeln über mehrere Schritte hinweg.

Ziel: Prüfen, ob Systeme strukturelle Vorgaben stabil reproduzieren können.

 

Stage 2 (L1–L3 · Entscheidungsarchitektur)

Alle Modelle durchlaufen identische Entscheidungsszenarien, während sich nur die Instruktionsform verändert.

 

L1 – Explizite Regelhierarchie

Aufgabe: Entscheidungen strikt nach vorgegebener Priorität treffen (deterministische Regelbindung).

Testet: Fähigkeit zur stabilen Regelbefolgung.

 

L2 – Semantische Zielrahmung

Aufgabe: Entscheidungen anhand eines formulierten Ziels treffen (implizite Priorität).

Testet: ob Ziele wie Regeln wirken – und wann sie es nicht mehr tun.

 

L3 – Mehrstufige Hierarchie unter Konflikt

Aufgabe: Entscheidungen unter konkurrierenden Kriterien und klarer Prioritätsstruktur.

Testet: Stabilität unter Komplexität und Konfliktdruck.

 

Ergebnis SFP-F und SFP-Alpha

Ergebnis SFP-F und SFP-Alpha

Große Sprachmodelle können Regeln verstehen. Sie können Regeln lokal anwenden. Was sie nicht können: eine explizit gesetzte Regel über mehrere aufeinanderfolgende Schritte hinweg stabil einhalten,  sobald gleichzeitig inhaltliche Anforderungen bestehen

 

In der Testvariante SFP-F lautet die Regel: erste Antwort exakt 14 Wörter, jede folgende Antwort exakt 7 Wörter mehr.

Die Zielsequenz: 14 → 21 → 28 → 35 → 42 → 49 → 56 → 63. Die Regel darf weder bestätigt noch erwähnt werden.

Die Fragen selbst steigen in kognitiver Komplexität — von einfachen Definitionen über Rechenaufgaben bis zu abstrakten Reflexionsfragen.

Diese Kombination ist entscheidend: Generierung + Selbstüberwachung + Regelbindung gleichzeitig. Jeder dieser drei Prozesse einzeln ist für Sprachmodelle handhabbar. Die Gleichzeitigkeit erzeugt den Bruch.

Stufe 1 – Deterministische Regelbindung

Klare, harte Regel
„Langfristige Stabilität geht immer vor kurzfristigen Vorteilen.“


Aufgabe
In 8 realistischen Entscheidungssituationen immer eine von zwei Optionen wählen.


Beispiele:
Ausbildung abschließen vs. sofort Geld verdienen
IT-Sicherheit priorisieren vs. Kosten senken
konservative vs. riskante Investition
Ergebnis

 


→ Alle getesteten Modelle wählen konsequent die stabile Option.


→ Keine einzige Abweichung auf Entscheidungsebene.


→ Unterschiede gibt es nur in der Begründung – nie im Ergebnis.


Fazit dieser Stufe


Bei einer klar formulierten, verbindlichen Regel ist die Entscheidung deterministisch geschlossen.


Maximale Konsistenz <> minimale Flexibilität.


Erstelle deine eigene Website mit Webador