Untersucht wurden:

  • Variabilität bei identischen Prompt
  • stabile Begründungsstrukturen
  • Unterschiede zwischen Modellen
  • Verhalten über mehrere Läufe hinweg

Untersucht wurden:

  • Regeltreue über Antwortschritte
  • Prioritätsstabilität unter Komplexität
  • Bruchpunkte in Sequenzen 
  • Persistenz trotz Kontextwechsel

PARADOX-TEST

Studie zu rahmenabhängigem Antwortverhalten

Untersucht wurden:

  • Umgang mit logischen Widersprüchen
  • Einfluss von Umformulierungen
  • Stabilität über Dialogschritte
  • Wechsel von Lösungsstrategien

SL-20 SICHERHEITSSCHICHT HÄUFIGKEITSANALYSE

Welche Sicherheitsmuster aktivieren sich und wie oft?

Analysiert wurden:

  • Aktivierung sprachlicher Schutzmuster
  • Häufigkeit bestimmter Reaktionen
  • Trigger durch sinnvolle Eingaben
  • Stabilitätssignale im Verlauf

Qualitative Frame-Sensitivitätsanalyse von Entscheidungsargumentation großer Sprachmodelle

Klicken Sie hier, um einen Text zu schreiben.

Sie interessieren sich für KI-Evaluation, Forschung oder Zusammenarbeit ?

Erstelle deine eigene Website mit Webador