Ein dringender Bedarf an kurzen klinischen Studien im Bildungsbereich

Wenn Sie mir gesagt haben, machen wir Fortschritte bei der [U.S. Bildungsreform] oder nicht, ich könnte noch lange reden,
aber eine nummer kann ich dir nicht nennen.

–Bill Gates mit David Rubenstein, Sanders Theater, 21. September 2013




In den drei Jahrzehnten seit der Veröffentlichung des

Nation in Gefahr

Bericht, haben die US-amerikanischen Bildungsreformbemühungen keinen Aufschwung erreicht.
Warum ist das so?
Unabhängig von der Reformstrategie – ob neue Standards oder Rechenschaftspflicht, kleine Schulen oder Wahlmöglichkeiten der Eltern oder Effektivität der Lehrer – gibt es eine zugrunde liegende Schwäche im US-amerikanischen Bildungssystem, die behindert hat
jeden
bisherigen Bemühungen: Die meisten folgenschweren Entscheidungen werden von Bezirks- und Landesvorsitzenden getroffen, doch fehlt diesen Führungskräften die Infrastruktur, um schnell zu lernen, was funktioniert und was nicht. Sie starten neue Initiativen ohne detaillierte Analyse ihrer Auswirkungen. Bestenfalls erfassen sie aggregierte Messgrößen wie Gesamtkompetenzen und Abschlussquoten, die die Konsequenzen für die einzelnen Schulen oder die tatsächlich von ihren Initiativen betroffenen Schulstufen oder Fächer verbergen können. Und bei Fluktuation sind neue Führungskräfte gezwungen, das Rad neu zu erfinden, blind für die Fehler und Erfolge ihrer Vorgänger. Philanthropen ihrerseits finanzieren neue Initiativen in ihren örtlichen Schulen und wissen nie, ob ihre Mittel für die Kinder etwas bewirkt haben.

heller Blitz am Himmel heute Nacht

Uns fehlt es nicht an Innovation im US-amerikanischen Bildungswesen. Uns fehlt die Fähigkeit, aus unseren Innovationen zu lernen.





In den letzten zehn Jahren hat das US-Bildungsministerium eine robuste Infrastruktur für die Evaluierung von Programmen auf Bundesebene aufgebaut. Das National Center for Education Evaluation hat seit 2002 mehr als 34 groß angelegte Wirkungsbewertungen finanziert. Diese kosten durchschnittlich 12 Millionen US-Dollar und haben 5,6 Jahre gedauert. In Ländern, in denen bildungspolitische Entscheidungen auf Bundesebene getroffen werden und eine größere Kontinuität der Führung besteht, könnte ein solches System ausreichend sein. Leider stellen staatliche und lokale Entscheidungsträger, die im US-System eine entscheidende Rolle spielen, zu selten die Verbindung zwischen den Erkenntnissen aus staatlich finanzierten Evaluierungen und ihren eigenen politischen Entscheidungen her. Wir brauchen ein neues Modell als Ergänzung zu diesen Bemühungen des Bundes, das schneller, kostengünstiger und stärker an die Entscheidungen der Länder und Gemeinden gebunden ist.

Die Common Core-Standards und die neuen Richtlinien zur Lehrerbewertung sind ein gutes Beispiel. Obwohl die Bundesregierung bei der Schaffung des politischen Rahmens mitgewirkt hat, werden seine endgültigen Auswirkungen von Tausenden von Umsetzungs- und politischen Entscheidungen auf Landes- und lokaler Ebene bestimmt. Wie können wir also sicherstellen, dass staatliche und lokale Führungskräfte die Beweise erhalten, die sie benötigen, um die besten Lösungen zu finden?



Hier ist ein Überblick über einen Ansatz, den eine Gruppe von Staaten und großen Distrikten gemeinsam verfolgen könnte:

  1. Angenommen, eine Gruppe von Staaten würde Lehrergremien einladen, Materialpakete zusammenzustellen, die auf die anspruchsvollsten neuen Standards in jeder Jahrgangsstufe und jedem Fach ausgerichtet sind. Jedes Paket sollte eine Trainingskomponente und eine Feedbackkomponente enthalten. Zum Beispiel können Lehrer zusätzlich zu Schulungs- und Lehrplanmaterialien Kameras erhalten, um Videos ihrer Unterrichtsstunden, in denen die neuen Standards vermittelt werden, einzureichen, um sie von Kollegen, Schulleitern und Inhaltsexperten zu kommentieren. (Die Umsetzung der neuen Standards erfordert eine massive Verhaltensänderung von Erwachsenen. Und jede Verhaltensänderung von Erwachsenen erfordert Feedback. Die Durchführung von Lehrerbewertungen zu verschieben, wäre wie die Einführung eines Weight Watchers-Programms ohne Personenwaage oder Spiegel für die Teilnehmer.)
  2. Zur Teilnahme an den Studien werden Lehrerteams aus allen teilnehmenden Staaten eingeladen, die nach Klassenstufe und Fach in den Schulen geordnet sind.
  3. Die Staaten würden einen Partner finden, der die Versuche organisiert, um die Pakete zu testen. Von den freiwilligen Schulen würde eine Untergruppe per Lotterie ausgewählt, um die Behandlungen in bestimmten Klassenstufen und Fächern zu erhalten. (Eine Schule könnte in einer Klasse und einem Fach im Lotto gewinnen, in anderen jedoch nicht. Sie würden als Kontrollgruppenschulen in den Klassen und Fächern dienen, in denen sie nicht zur Behandlung ausgewählt wurden.) Die zufällige Zuweisung von Behandlungen auf Schul-/Klassenebene würde die Notwendigkeit, Daten auf Schülerebene zu analysieren. Das Zusammenstellen und Bereinigen von Daten auf Schülerebene macht einen Großteil der Kosten und Verzögerungen bei herkömmlichen Auswertungen aus.
  4. Die Forschung würde Huckepack auf Bundesdaten-Berichterstattungsanforderungen (unter Verwendung von Mitteln auf Schulebene und Untergruppen nach Jahrgangsstufe und Fach statt auf Schülerebene) zurückgreifen. Auf diese Weise konnten die Tabellen im Voraus erstellt und im Sommer nach jedem Schuljahr innerhalb von Tagen nach der staatlichen Berichterstattung Abschätzungen der Auswirkungen erstellt werden.

Zunächst müssten die Bemühungen mit staatlicher oder philanthropischer Unterstützung gestartet werden. Wenn ein solches Programm sofort starten würde, könnte die Gruppe diesen Sommer Materialien nach dem Zufallsprinzip zuteilen. Bis zum nächsten Sommer (Sommer 2015) könnte die Gruppe auf erfolgreiche Modelle für die Kombination von Lehrerausbildung und Lehrerevaluation hinweisen, die durch starke Evidenz gestützt werden.

Der dringende Bedarf an knackigen Evidenz durch randomisierte Studien ist nicht zu unterschätzen. Seltsamerweise sprechen Bildungsverantwortliche von effektiver beruflicher Entwicklung genauso wie Außenpolitiker vom Frieden im Nahen Osten: Alle sagen, es sei wichtig, aber niemand scheint daran zu glauben, dass es funktionieren kann! Das ist ein Problem, denn es ist unmöglich, Unterstützung zu gewinnen, es sei denn, Sie glauben (und können demonstrieren), dass Ihre Strategie funktioniert. Staats- und Distriktsleiter haben ein kurzes Zeitfenster – vielleicht höchstens zwei oder drei Jahre –, um dies zu beweisen. (Sonst wird der nächste Reformerzyklus das Rad neu erfinden.)



wie viele ringe hat die sonne

Dies wäre nur der erste Schritt. Nicht jede Intervention würde sich für eine zufällige Zuordnung eignen. Universitäten müssen Mitarbeiter staatlicher und lokaler Behörden darin schulen, ihre Daten zur Bewertung von Politiken und Programmen zu verwenden. Softwareanbieter müssen die statistischen Algorithmen automatisieren, die von Analytikern auf Doktoratsstufe in den teureren kundenspezifischen Auswertungen verwendet werden. Sobald sie die Auszahlung gesehen haben, müssen die Staats- und Bezirksleiter die Ressourcen finden, die sie benötigen, um sie einzustellen.