Untersucht wurden:

  • Variabilität bei identischen Prompt
  • stabile Begründungsstrukturen
  • Unterschiede zwischen Modellen
  • Verhalten über mehrere Läufe hinweg

Untersucht wurden:

  • Regeltreue über Antwortschritte
  • Prioritätsstabilität unter Komplexität
  • Bruchpunkte in Sequenzen 
  • Persistenz trotz Kontextwechsel

Untersucht wurden:

  • Umgang mit logischen Widersprüchen
  • Einfluss von Umformulierungen
  • Stabilität über Dialogschritte
  • Wechsel von Lösungsstrategien

Analysiert wurden:

  • Aktivierung sprachlicher Schutzmuster
  • Häufigkeit bestimmter Reaktionen
  • Trigger durch verschiedene Eingaben
  • Stabilität über mehrere Testläufe

Qualitative Frame-Sensitivitätsanalyse von Entscheidungsargumentation großer Sprachmodelle

Sie interessieren sich für KI-Evaluation, Forschung oder Zusammenarbeit ?