Prüfungsleistungen an Kriterien messen
Anders als beispielsweise an Schulen bestehen an Universitäten große Spielräume hinsichtlich der Möglichkeiten, zu einem Notenurteil zu gelangen. Neben dem verbreiteten eher intuitiven Vorgehen, bei dem die Prüfungsleistung aus sich heraus beurteilt wird, ohne explizit zuvor formulierte Kriterien anzulegen, werden auch im universitären Kontext oft Kriterienkataloge zur Leistungsbeurteilung angesetzt. Sie bieten den Vorteil, dass die Beurteilung in einem stärker standardisierten Prozess erfolgen kann, und dass sichergestellt wird, dass jede Prüfungsleistung an denselben Kriterien gemessen wird. Kriterienkataloge zu nutzen führt daher sowohl bei Lehrenden als auch bei Studierenden eher dazu, dass eine Beurteilung als gerecht empfunden wird.
Kriterienkataloge können ganz unterschiedlich gestaltet sein, wobei meist eine Form der Skalierung verwendet wird. Verbreitet ist, Kriterien in sechs Abstufungen zu skalieren, so dass die Einschätzung mit der Nutzung der herkömmlichen Ziffernnoten assoziiert wird. Hiermit wird suggeriert, dass die endgültige Note im arithmetischen Mittel der Einzelnoten liegt. Da damit aber kaum Spielräume zur individuellen Gewichtung bestehen, empfehlen wir Ihnen, eine geringere Menge an Abstufungen zu verwenden. Eine ungerade Zahl – sinnvollerweise also drei oder fünf Kriterien – begünstigen, dass die Mitte gewählt wird, wenn eine Leistung in Bezug auf ein Kriterium nicht eindeutig gut oder schlecht umgesetzt wurde. Um Leistungen schnell zu beurteilen, ist dies sinnvoll, es ist aber nicht unbedingt im Sinne einer differenzierten Beurteilung. Wir empfehlen Ihnen, ruhig mehrere Skalierungsweisen zu erproben, bevor Sie sich endgültig für eine entscheiden.
Wenn Sie bei der Beurteilung einer Leistung anhand der Skalierung oftmals unsicher sind, wo genau Sie sie einordnen möchten, ist es hilfreich, ein sogenanntes Rubric für diese konkrete Prüfung zu erstellen. Dabei wird für jedes einzelne Kriterium und jede Stufe der Skalierung ausformuliert, welche Kennzeichen eine Leistung hat, die genau dieser Skalierungsstufe zugeordnet wird.
Einen solchen Kriterienkatalog zu nutzen geht in der Regel mit der Entscheidung einher, die Beurteilung zumindest schwerpunktmäßig an der sachlichen Bezugsnorm auszurichten. Die soziale Bezugsnorm dient dann als Form des Korrektivs, so wenn die Noten aller Prüflinge um eine Notenstufe angehoben werden, falls der Notendurchschnitt zu niedrig war. Hier kann aus den verhältnismäßig schlechten Ergebnissen der Schluss gezogen werden, dass die Lernziele der Veranstaltungen nicht ideal erreicht werden konnten. Auch dient die soziale Bezugsnorm als Entscheidungshilfe bei der Beurteilung qualitativ ähnlicher Prüfungsleistungen. Die individuelle Bezugsnorm nutzen viele Lehrende bei der Beurteilung von schriftlichen Arbeiten, die von internationalen Studierenden geschrieben wurden – dass deren Arbeit auf sprachlicher Ebene nicht der einer Muttersprachlerin entspricht, kann und sollte nicht stark ins Gewicht fallen (es sei denn vielleicht bei einem Germanistikstudium). Umgekehrt könnte die Anwendung einer individuellen Bezugsnorm auch bedeuten, dass an das russische Essay von Studierenden in der Slavistik, deren Muttersprache Russisch ist, strengere Maßstäbe angelegt werden als an die Arbeiten von deutschsprachigen Studierenden.
Um sich nicht dem eigenen und fremden Vorwurf auszusetzen, ungerecht zu benoten, können Sie sich bewusst für die Anwendung der Bezugsnorm entscheiden und Ihre Entscheidung, wenn nötig, offen legen. Um diese Entscheidung treffen zu können, kann es hilfreich sein, zu überlegen, welche Funktion die Benotung in der konkreten Situation primär erfüllen soll: z. B. einen Leistungsvergleich in der Gruppe herzustellen, eine lernorientierte Rückmeldung zu geben oder einen bestimmten Leistungsstand zu bescheinigen, der für das weitere Studium oder den Beruf vorausgesetzt wird.