Bildungsbewertung im 21. Jahrhundert: Neue Technologien

Über richtig-falsch hinausgehen

Bei praktisch jeder groß angelegten Bewertung werden die Antworten auf Testaufgaben schließlich als richtig oder falsch bewertet (mit einer gewissen Genauigkeit). Diese Antworten, die die tatsächliche Auswahl der bevorzugten Antworten in einem Multiple-Choice-Test oder die tatsächliche schriftliche Textantwort auf ein offenes Item sind, werden dann erfasst und verwendet, um den Umfang einer vermuteten Kompetenz anzugeben – das Konstrukt (manchmal auch als a . bezeichnet latente Eigenschaft ).





Die Tatsache, dass wir Tests manchmal so entwerfen, dass sie den Grad der Korrektheit berücksichtigen, sagt uns, dass die Richtig-Falsch-Dichotomie nicht immer nützlich oder ausreichend ist. Dies kann nützlich sein, wenn wir uns mit faktenbasierten Problemen befassen, aber nicht, wenn wir Nuancen oder Prozesse erfassen möchten. Dementsprechend gab es Versuche, über diesen absolutistischen Ansatz hinauszugehen. Frederiksen gehörte zu den ersten, die den Weg zu Messungen geebnet haben, die mehr Informationen erfassen als nur richtig oder falsch. 1984, Frederiksen argumentierte dass Formate für Multiple-Choice-Fragen (MCQ) nur eine Teilmenge relevanter Fähigkeiten messen, und äußerte Bedenken, dass eine übermäßige Verwendung des Formats dazu führen kann, dass nur eine begrenzte Anzahl von Fähigkeiten vermittelt wird.



Mehrere Jahrzehnte später wird die überwiegende Mehrheit der groß angelegten Tests immer noch im MCQ-Format bereitgestellt. Sofern nicht sehr viele gut geschriebene Items zur Verfügung stehen, ermöglicht dieses Bewertungsmedium keine fein abgestimmte Bewertung des Lernens der Schüler. Eine große Anzahl von Items führt zu einem großen Zeitaufwand für die Lernzeit der Schüler.



Prozesse erfassen – nicht nur Antworten

Technologie kann verwendet werden, um die Messungen konventioneller Kernkompetenzen (z. B. Rechnen und Lesen) zu erweitern und zu verbessern. Diese Verbesserungen konzentrieren sich darauf, Proxy-Maße enger mit dem latenten Merkmal zu verknüpfen, indem die Menge der erfassten Informationen erhöht wird. Die Technologie kann die Daten auch erweitern, um die Problemlösungsprozesse der Schüler zu verstehen, indem zusätzlich zu den üblichen Testantworten Aufgabenaktionen erfasst werden. Aktionen, die Prozesse darstellen, oft als Indikatoren bezeichnet, werden digital erfasst und können von einfach bis komplex reichen, wie in den Beispielen in Abbildung 1 gezeigt.



Abbildung 1: Beispiele für Prozessindikatoren nach Komplexität

global_20170227_neue Technologien



Wie groß ist die durchschnittliche Entfernung von der Erde zur Sonne?

Abbildung 1 erhebt keinen Anspruch auf Vollständigkeit, gibt aber ein Bild davon, wie Prozesse erfasst werden können, die sogar für die Messung konventioneller Kompetenzen wie Lesen und Schreiben relevant sind. Beachten Sie, dass diese Beispiele viele der Beobachtungen widerspiegeln, die ein Lehrer im Rahmen der normalen Unterrichtspraxis im Klassenzimmer machen würde. Zum Beispiel können Lehrer Erwartungen haben, wie lange Aufgaben dauern sollten, und können die Schüler informell nach der Zeit für die Aufgabe im Klassenzimmer bewerten. In ähnlicher Weise können Lehrer die Abfolge von Prozessen beobachten, denen die Schüler beim Durchdenken von Aufgaben folgen, um zu bewerten, inwieweit sie ihr Gelerntes als Teil der Unterrichtspraxis anwenden können.



Das Potenzial webbasierter Assessments

Der Übergang zu einer digitalen Testumgebung eröffnet in den Ländern, in denen der Internetzugang fast universell ist, eine Fülle von Möglichkeiten. Abgesehen von den Vorteilen der Skaleneffekte bietet diese Fähigkeit webbasierter Plattformen zur Erfassung von Prozessdaten den Zugang zu einer ganzheitlicheren Bewertung. Und vor allem bieten solche Anwendungen ein Medium sowohl für das Lehren, Lernen als auch für die Bewertung, wie Initiativen wie SimScientist entwickelt von WestEd. Obwohl in erster Linie ein Lehr- und Lernwerkzeug, ist die Kapazität solcher Anwendungen zur Erfassung von Prozessdaten enorm. Eine solche Erfassung kann nicht nur die individuelle Bewertung von Schülern unterstützen, sondern auch umfangreiche Daten für die Analyse der Ansätze der Schüler zur Problemlösung innerhalb traditioneller Domänen liefern.

[eins] Shute et al., 2009