Gerechtere Richtlinien für Schwellenwerte

Wie stellt man sicher, dass ein Prüfungsergebnis wirklich ein faires Abbild dessen ist, was ein Kandidat leisten kann? Die Antwort liegt nicht nur in der Qualität der Fragen, sondern auch in der Grenzpunktzahl. Doch in der Praxis werden Grenzpunktzahlen immer noch überraschend oft willkürlich gewählt oder einfach auf einen Standard-Schwellenwert wie 55 Prozent festgelegt.

Monika Vaheoja, Datenwissenschaftlerin und Psychometrikerin, schreibt in ihren Blogs regelmäßig über faire Entscheidungsfindung bei Prüfungen. In ihrem Blog Angoff-Methode: Wie bestimmt man eine faire Grenzpunktzahl?macht sie eine prägnante Beobachtung: „Ein fester Schwellenwert von 55 % ist keine Grenzpunktzahl-Strategie. Es ist das Aufschieben einer substanziellen Entscheidung.“ Dabei unterstreicht sie die Bedeutung der Festlegung von Grenzpunktzahlen basierend auf Inhalten, Lernzielen und Leistungserwartungen.

‍

Warum ein Standardprozentsatz nicht immer funktioniert

Über die Bestimmung eines fundierten Prozentsatzes hinaus gibt es viele weitere wichtige Entscheidungen bei der Festlegung einer Grenzpunktzahl. Eine einzelne Grenzpunktzahl, zum Beispiel X % der insgesamt verfügbaren Punkte, mag einfach erscheinen, doch sie spiegelt oft nicht die Komplexität einer Prüfung wider. Nicht jede Komponente ist gleich wichtig, und nicht jeder Teil einer Prüfung sollte durch die Leistung in einem anderen Abschnitt kompensierbar sein. Wenn alles zu einer Gesamtpunktzahl zusammengeführt wird, besteht die Gefahr, dass diese Unterschiede nivelliert werden.

Bei einer einzelnen Grenzpunktzahl werden alle Punkte addiert, und die Endsumme entscheidet, ob ein Kandidat besteht. In vielen Fällen funktioniert dies einwandfrei, doch es gibt auch Situationen, in denen dieser Ansatz zu kurz greift. Man denke an Prüfungen, bei denen bestimmte Komponenten weitaus kritischer sind als andere, oder an Situationen, in denen eine schwache Leistung bei wesentlichen Kompetenzen leicht durch eine starke Leistung an anderer Stelle ausgeglichen werden kann. Darüber hinaus kann eine Gesamtpunktzahl allein unzureichende Einblicke in das zugrunde liegende Wissen und die Fähigkeiten eines Kandidaten geben.

Ein konkretes Beispiel ist ein Kandidat, der bei anwendungsbasierten Fragen schlecht abschneidet, aber dennoch besteht, weil er bei reproduktionsbasierten Fragen (oft Multiple-Choice- oder Abruffragen) hohe Punktzahlen erzielt. Formal mag das Ergebnis korrekt sein, doch es bleibt die Frage, ob dieses Ergebnis tatsächlich wünschenswert ist. Um Monika noch einmal zu zitieren: „Eine inhaltsbasierte Grenzpunktzahl beantwortet eine andere Frage: Was kann der Studierende, der gerade so besteht, tatsächlich leisten? Und ist das genug?“

Vielleicht ist es akzeptabel, dass ein Kandidat hauptsächlich aufgrund von Reproduktionsfragen besteht. Doch was, wenn das nie die Absicht war? Was, wenn vom Kandidaten auch erwartet wurde, die Fähigkeit zur praktischen Anwendung von Wissen zu zeigen? In diesem Fall sollte die Grenzpunktzahl diese Anforderung widerspiegeln. Zum Beispiel, indem anwendungsbasierten Fragen ein höheres Gewicht beigemessen wird, oder indem eine Mindestpunktzahl bei diesen Fragen erforderlich ist, um die gesamte Prüfung zu bestehen.

‍

Von einem einzelnen Schwellenwert zur mehrstufigen Bewertung

Hier kommt eine zusammengesetzte oder mehrstufige Grenzpunktzahl ins Spiel. Bei diesem Ansatz wird eine Prüfung in separate Komponenten unterteilt, jede mit ihrer eigenen Grenzpunktzahl. Zusätzlich zur Festlegung von Grenzpunktzahlen pro Komponente können unterschiedliche Gewichtungen zugewiesen werden, um die Möglichkeit der Kompensation zwischen den Abschnitten zu verringern.

Wenn eine zusätzliche Gewichtung immer noch unzureichend ist, weil Wissen in einem bestimmten Bereich als kritisch erachtet wird, kann eine Bestehensgrenze für diese spezifische Komponente obligatorisch gemacht werden. Das bedeutet, dass ein Kandidat die Gesamtprüfung nicht bestehen kann, ohne diesen Abschnitt zu bestehen. Dies kann besonders relevant sein in Sektoren, in denen Kompetenz in spezifischen Bereichen unerlässlich ist, wie im Gesundheitswesen, in der Luftfahrt und in der öffentlichen Sicherheit.

Neben diesen prüfungsbezogenen Vorteilen profitieren auch Studierende von mehrstufigen Grenzpunktzahlen. Wenn sie ihre Ergebnisse einsehen dürfen, können sie sehen, wie sie bei den einzelnen Komponenten abgeschnitten haben, und erkennen, wo zusätzliche Aufmerksamkeit oder Verbesserung erforderlich ist.

‍

Eine Grenzpunktzahl, die faire Ergebnisse unterstützt

Eine gestufte oder zusammengesetzte Bestehensgrenze hilft Bewertungsverantwortlichen, gerechtere und transparentere Bewertungen zu erstellen. Sie verhindert unerwünschte Kompensationseffekte und gewährleistet eine stärkere Übereinstimmung mit den Bildungszielen. Kurz gesagt, ist sie eine wirksame Methode, die Qualität der Bewertung zu verbessern.

Das könnte dir auch gefallen