Wenn Staaten ESSA-Pläne vorlegen, müssen politische Entscheidungsträger verantwortungsvolle Schulbewertungssysteme entwickeln

Ist es möglich, die Leistung einer Schule fair und genau in einer einzigen Bewertung zusammenzufassen? Schulen sind komplexe Organisationen, die einer Vielzahl von Zwecken dienen, und es ist bekannt, dass es schwierig ist, ihren Fortschritt in Richtung dieser Ziele zu messen. Können wir wirklich sagen, dass diese Schule ein B+ ist und die Schule die Straße runter ist ein D? Sollten wir?





Bildungspolitiker im ganzen Land setzen sich mit diesen Fragen auseinander, während die Bundesstaaten ihre Pläne zur Umsetzung des Every Student Succeeds Act (ESSA) entwickeln. Elf Staaten haben dem Bildungsministerium bereits Pläne vorgelegt, die einen ersten Einblick in den Umgang der Bundesstaaten mit dem heiklen Thema summativer Leistungsmaße geben.



Werfen wir einen Blick auf die summativen Schulbewertungen, mit besonderem Fokus darauf, was die Forschung zu ihren Auswirkungen und Implikationen nahelegt.



Hintergrund und Debatte zu Schulbewertungen

Summative Bewertungen, wie Schulbuchstabennoten oder Sternbewertungen, dienen mehreren Zwecken. Staatliche Rechenschaftspflichtsysteme verwenden diese Bewertungen als Grundlage für Sanktionen oder Interventionen, während die Öffentlichkeit diese Bewertungen verwendet, um Schulen zu vergleichen und auszuwählen, zu entscheiden, wo sie wohnen möchten, Schulvorstandsmitglieder zu bewerten und mehr.



Das Erstellen einer einzelnen summativen Schulbewertung ist ein mehrstufiger Prozess. Es verlangt von den politischen Entscheidungsträgern:



  1. Identifizieren Sie Kriterien für die Bewertung von Schulen
  2. Wählen Sie Kennzahlen aus, die diesen Kriterien entsprechen
  3. Bestimmen Sie, wie viel Gewicht jeder Maßnahme beigemessen werden soll
  4. Daten sammeln
  5. Berechnen Sie Punktzahlen und wandeln Sie sie in eine Bewertung um

Jeder Schritt dieses Prozesses ist Gegenstand von Debatten und Meinungsverschiedenheiten. Die Schritte 1 und 2 sind anfällig für Kritik, dass die heutigen schulischen Leistungsmessungen fehlerhaft oder in ihrem Umfang eingeschränkt sind. Schritt 3 ist anfällig für Streitigkeiten über die Abwägung von Maßnahmen wie Wachstum und Leistungsfähigkeit, mit der politischen Herausforderung, dass unterschiedliche Gewichtungsschemata unterschiedliche Gewinner und Verlierer hervorbringen. Stufe 5 ist anfällig für allgemeinere Einwände, dass schulische Leistungen mehrdimensional seien und reduktive Bewertungen irreführend seien. Wir könnten zum Beispiel befürchten, dass eine Schule, die für ein Kind gut ist, für ein anderes Kind schlecht wäre, und dass reduktive Bewertungen den Schulen fälschlicherweise unterstellen könnten, dass entweder alles ist gut oder alles muss sich ändern.



Ein Blick auf den Umgang mit summativen Ratings in den ersten eingereichten ESSA-Staatsplänen, zusammengestellt von Andrew Ujifusa bei EdWeek , zeigt die unterschiedlichen Wege auf, wie Staaten mit diesen Problemen umgegangen sind. Zu den Vorschlägen gehören: A-F-Buchstabennoten für New Mexico und Tennessee; Sternebewertungen für Nevada und Washington, D.C.; farbcodierte Ziele für Vermont; benannte Stufen für Illinois (von der Beispielschule bis zur Schule mit der niedrigsten Leistung) und Massachusetts (von Stufe 1 bis Stufe 6); und ein numerischer Index für Connecticut und New Jersey (mit den Werten von New Jersey einschließlich einer Perzentilrangliste). Diese Variante ist nichts Neues. Eine Bewertung von der Bildungskommission der Länder im Jahr 2013 und noch eins von Richard Waliser im Jahr 2016 zeigen eine Vielzahl von Ansätzen, wobei viele der frühen ESSA-Pläne mit früheren staatlichen Politiken übereinstimmen.

Wie können sich summative Bewertungen auf Schüler und Schulen auswirken?

Der Grundgedanke der summativen Schulbewertungen besteht darin, dass sie ein klares Qualitätssignal liefern, um die Smog von Daten, die ansonsten die Entscheidungsfindung der Menschen trüben können. Dieses Argument wird durch die Forschung der kognitiven Psychologie und des Verbraucherverhaltens gestützt. Studien zu Themen wie Krankenhausbewertungen zu Gourmet-Marmelade-Käufe weisen darauf hin, dass die Entscheidungsfindung leiden kann, wenn die Menge der Informationen, die wir erhalten, unsere Kapazität für die Verarbeitung übersteigt. Vereinfachte Bewertungen können dazu beitragen, die Qualität der Schulinformationen leichter handhabbar zu machen. Bewertende Bewertungen, wie farbcodierte Buchstabennoten, können auch emotionale Reaktionen hervorrufen, die die Entscheidungsfindung motivieren und organisieren.



Um summative Bewertungen verantwortungsvoll zu gestalten, müssen politische Entscheidungsträger die Auswirkungen sowohl auf die Nutzer von Schulbewertungen (einschließlich Eltern und Öffentlichkeit) als auch auf die Subjekte von Schulbewertungen (einschließlich Verwaltung und Lehrer) berücksichtigen.



Eltern sind vielleicht die aktivsten Nutzer von Schulbewertungen, insbesondere bei der Auswahl der Schulen für ihre Kinder. Zumindest theoretisch sieht sich ein Elternteil der Schulwahl einem mehrstufigen Prozess gegenüber, der dem oben beschriebenen Prozess sehr ähnlich ist. Sie entscheidet, welche Schulmerkmale für sie am wichtigsten sind, welche Informationen sie über diese Merkmale sammeln und wie sie Kompromisse eingehen kann. Sie sammelt Daten und trifft reduktive Urteile darüber, wie gut Schulen ihrem Kind dienen würden. Der Prozess kann entmutigend sein, vor allem, wenn die Datentools überwältigend sind , und könnte sie dazu bringen, meidet diesen rationalen Schulwahlprozess und sucht nach Abkürzungen für ihre Entscheidungsfindung . Eine summative Schulbewertung, wenn sie die Prioritäten der Eltern widerspiegelt, kann diesen Prozess beherrschbar machen. Tatsächlich ergab eine Studie aus Charlotte-Mecklenburg, dass die Bereitstellung vereinfachter Leistungsberichte dazu führte, dass mehr Eltern fordern Highscore-Schulen an . Eine weitere besonders interessante Studie – von Rebecca Jacobsen, Jeffrey Snyder und Andrew Saultz – zeigte, dass Personen, die nach dem Zufallsprinzip zugewiesen wurden, Schulleistungen in Buchstabennoten dargestellt sehen wahrgenommene größere Qualitätsunterschiede zwischen Schulen mit hoher und niedriger Punktzahl als Personen, denen numerische Leistungsindizes, Leistungsrankings (z.

Schulleistungsbewertungen wirken sich auch auf das Verhalten derjenigen aus, die für Schulen arbeiten. Ob diese Effekte positiv oder negativ sind, hängt davon ab, wie gut die Verhaltensweisen, die von Bewertungssystemen belohnt werden, mit den Verhaltensweisen übereinstimmen, die Schulen verfolgen möchten. Floridas Rechenschaftslegungssystem A+ mit seiner Verwendung von A-F-Schreibnoten (und den entsprechenden Konsequenzen) scheint dies induziert zu haben sinnvolle Änderungen in der Unterrichtspraxis und verbesserte Leistung von minderwertigen Schulen. Auf der anderen Seite Forschung zu Blaseneffekte in K-12-Ausbildung und institutionelle Reaktionen auf die Ranglisten der US-Nachrichten und des Weltberichts in der Hochschulbildung warnen davor, dass die Kombination aus intensivem Rechenschaftsdruck und spielbaren Rechenschaftspflichten dazu führen kann, dass Menschen Abstriche machen. Während Rechenschaftspflichtsysteme mit oder ohne summative Bewertungen Druck erzeugen können, können Bewertungen diesen Druck durch erhöhte Sichtbarkeit und erhöhte Einsätze verstärken.



Der Weg nach vorn

Es scheint also, dass die Frage, ob ein summatives Rating erstellt werden soll, davon abhängt, welche Art von Rating der politische Prozess des Staates erzeugen würde. Eine gute summative Bewertung – eine, die konstruktive Praktiken fördert und Schulen danach bewertet, wie sie ihren Gemeinschaften dienen und nicht welchen Gemeinschaften sie dienen – ist besser als keine summative Bewertung, während keine summative Bewertung besser ist als eine schlechte. Ein klares Signal, den Smog der Schuldaten zu durchdringen, kann wertvoll sein, aber nur, wenn es den Menschen in hilfreiche Richtungen führt.



Einige Bundesstaaten entscheiden sich möglicherweise für einen eher praktischen Ansatz und bieten Schul-Dashboards ohne Bewertungen an. Dieser Ansatz ist verlockend. Es lädt ein, nach eigenen Kriterien ein eigenes Urteil zu fällen, und adressiert den grundsätzlich richtigen Einwand, dass summative Bewertungen der Schule nicht gerecht werden können. Dies ist jedoch mit echten Kosten verbunden. Durch die Weigerung, Schulen zu bewerten, vermeidet ein Staat nicht, dass andere dies tun müssen. Es fordert einfach Eltern und die Öffentlichkeit auf, dies selbst zu tun. Das ist eine täuschend schwere Aufgabe, und ein umfassendes Dashboard ohne einen Schwerpunkt wie eine Bewertung kann mehr frustrieren und verwirren, als es verdeutlicht.

Andere Staaten könnten sich für einen Mittelweg-Ansatz entscheiden und unterschiedliche Bewertungen für verschiedene Domänen bereitstellen. Zum Beispiel kann eine Schule eine A für akademisches Wachstum erhalten, aber eine C für außerschulische Möglichkeiten. Vorsichtig gemacht, könnte dies funktionieren. Unachtsam durchgeführt, könnte dies den vereinfachenden Wert summativer Bewertungen verlieren oder unbeabsichtigt Impressionen von gleicher Bedeutung in den bewerteten Domänen erzeugen. Wenn die Politik der Meinung ist, dass akademisches Wachstum wichtiger ist als außerschulische Möglichkeiten, sollten die Schulnoten dies sowohl in ihrer Berechnung als auch in ihrer Darstellung widerspiegeln.



Die erfolgreiche Gestaltung eines Schulbewertungssystems erfordert nicht nur die Bestimmung, wie die Schulleistung gemessen wird, sondern auch politische Überlegungen und das Verständnis der Psychologie vereinfachter Bewertungen. Wir werden die ESSA-Pläne der Staaten prüfen, ob sie der Aufgabe gewachsen sind.