
Untersucht wurden:
- Variabilität bei identischen Prompt
- stabile Begründungsstrukturen
- Unterschiede zwischen Modellen
- Verhalten über mehrere Läufe hinweg
Untersucht wurden:
- Regeltreue über Antwortschritte
- Prioritätsstabilität unter Komplexität
- Bruchpunkte in Sequenzen
- Persistenz trotz Kontextwechsel
Untersucht wurden:
- Umgang mit logischen Widersprüchen
- Einfluss von Umformulierungen
- Stabilität über Dialogschritte
- Wechsel von Lösungsstrategien
Analysiert wurden:
- Aktivierung sprachlicher Schutzmuster
- Häufigkeit bestimmter Reaktionen
- Trigger durch verschiedene Eingaben
- Stabilität über mehrere Testläufe
Qualitative Frame-Sensitivitätsanalyse von Entscheidungsargumentation großer Sprachmodelle
Sie interessieren sich für KI-Evaluation, Forschung oder Zusammenarbeit ?
Erstelle deine eigene Website mit Webador