Hat man dann die Studie geplant und optimal umgesetzt (Folge #4), haben wir immer noch ein «Problem» (ihr wisst, wie ich das meine): Die Probanden – also die Schülerinnen und Schüler.
Da Schulklassen bekanntlich sehr heterogen sind, z.B. aufgrund ihres Vorwissens, ihrer Motivation, ihrer metakognitiven Fähigkeiten etc., braucht man eine grosse Stichprobe, um aussagekräftige Ergebnisse zu erhalten. Denn sonst variieren weitere Faktoren als nur die Methode (siehe auch Folge #2) und somit ist ein Lernerfolg nicht mehr eindeutig auf die Methode zurückzuführen. Es könnte ja sein, dass bspw. die eine Gruppe generell schon bessere Voraussetzungen hatte. Daher braucht man möglichst grosse Gruppen. Ihr kennt das von grossen Tests, wie z.B. Ländervergleichen, wo man sogar von repräsentativen Stichproben spricht. Dort sind dann auch Ost/West, Stadt/Land, Geschlecht und viele weitere Faktoren repräsentativ für das ganze Land und Ergebnisse können daher auch auf das gesamte Land generalisiert werden. Dies ist jedoch bei den meisten kleineren Studien nicht möglich, diese liefern also immer nur Hinweise und können nicht generalisiert werden. Häufig behilft man sich auch mit dem Zufall. Man mischt die Gruppen also und teilt sie zufällig einer Methode zu. So kann man davon ausgehen, dass die Voraussetzungen zufällig verteilt sind und keine Gruppe Vorteile hat. Dann spricht man von einem experimentellen Design, das dann auch kausale Schlüsse (etwa: die Methode ist die Ursache für grössere Lernzuwächse) zulässt. Das bedeutet zusammengefasst: ob eine Methode lernwirksam ist, hängt auch davon ab, an wem sie getestet wurde.
Weiter zu Folge #6.