Wie Verhalten in großen Sprachmodellen entsteht

Ein strukturelles Analysemodell für moderne KI-Systeme

Verständnis durch Struktur

Antworten großer Sprachmodelle entstehen nicht durch eine einzelne Regel, sondern durch das Zusammenspiel mehrerer interner Verarbeitungsstufen.

Erst das Zusammenspiel von Eingabe, Verarbeitung, Gewichtung und Entscheidung erzeugt sichtbares Verhalten.

Die fünf Prozessschritte

  • Eingabe – Prompt, Kontext und Anweisung

  • Verarbeitung – interne Mustererkennung

  • Gewichtung — Priorisierung relevanter Signale

  • Entscheidung – Auswahl wahrscheinlicher Antwortpfade

  • Antwort — sprachliche Ausgabe

Sieben Analyseebenen

Modellverhalten lässt sich auf sieben Ebenen systematisch untersuchen

  • Token-Ebene – Wortfolgen und Sequenzen

  • Bedeutungsebene – Konzepte und Beziehungen

  • Argumentationsebene – Struktur und Kohärenz

  • Entscheidungsebene – Framing und Gewichtung

  • Interaktionsebene – Dialogverhalten

  • Meta-Ebene – Selbstbeschreibung des Modells

  • Verhaltensebene – sichtbare Gesamtausgabe

Zentrale Forschungsfragen

  • Warum identische Inputs unterschiedliche Antworten erzeugen

  • Wie Prioritäten intern verschoben werden

  • Warum Modelle inkonsistent reagieren

  • Wie Drift entsteht

  • Wie Sicherheitslogiken aktiviert werden

  • Wie Entscheidungen unter Unsicherheit entstehen

Forschungsgrundlage weiterer Studien

Die Verhaltensarchitektur ist kein Einzelmodell, sondern die strukturelle Basis mehrerer empirischer Untersuchungen innerhalb des AIReason-Forschungsprogramms.

Sie verbindet beobachtbare Modellreaktionen mit systematischen Analyseebenen.

Integrierte Studienbereiche

  • RUNPORT Studienreihe — Entscheidungsarchitekturen bei identischen Prompts

  • System Frame Persistence (SFP) — Regelbindung, Prioritäten und Persistenz

  • Frame-Sensitivitätsanalysen — Wirkung unterschiedlicher Instruktionsrahmen

  • Drift-Analysen — systematische Verhaltensverschiebungen

  • Safety-Layer-Untersuchungen — Schutz- und Normmechanismen

  • Modellvergleiche — strukturelle Unterschiede zwischen Systemen

Methodischer Ansatz

  • Vergleich von Modellen auf Strukturebene

  • Lokalisierung möglicher Verhaltensursachen

  • Untersuchung ohne Zugriff auf interne Gewichte

  • Neue Perspektiven auf Ausrichtung und Sicherheit

Die Architektur dient damit als Forschungsrahmen für Verhalten statt als reines Bewertungsinstrument.

KI verstehen heißt interne Entscheidungsprozesse verstehen

Nicht nur Inhalte formen Ergebnisse, sondern auch die interne Architektur des Modells.