Untersucht wurden:

Variabilität bei identischen Prompt
stabile Begründungsstrukturen
Unterschiede zwischen Modellen
Verhalten über mehrere Läufe hinweg

RUNPORT Studienreihe ansehen

Untersucht wurden:

Regeltreue über Antwortschritte
Prioritätsstabilität unter Komplexität
Bruchpunkte in Sequenzen
Persistenz trotz Kontextwechsel

SFP- Studie ansehen

Untersucht wurden:

Umgang mit logischen Widersprüchen
Einfluss von Umformulierungen
Stabilität über Dialogschritte
Wechsel von Lösungsstrategien

Paradox-Test ansehen

Analysiert wurden:

Aktivierung sprachlicher Schutzmuster
Häufigkeit bestimmter Reaktionen
Trigger durch verschiedene Eingaben
Stabilität über mehrere Testläufe

Qualitative Frame-Sensitivitätsanalyse von Entscheidungsargumentation großer Sprachmodelle

Analyse Entscheidungsstrukturen

Sie interessieren sich für KI-Evaluation, Forschung oder Zusammenarbeit ?

Kontakt aufnehmen

Erstelle deine eigene Website mit Webador