(2008). Lehrbuch der Pädagogischen Diagnostik (6. Aufl.). Weinheim: Beltz.
Jang, Eunice E. & Wagner, Maryam. (2014). Diagnostic feedback in the classroom. In Antony J. Kunnan (Hrsg.), The companion to language assessment. Vol. II: Approaches and development (S. 693–711). Chichester: Wiley-Blackwell. doi: 0.1002/9781405198431.wbeal0042
Jones, Neil & Saville, Nick. (2016). Learning oriented assessment: A systemic approach. Cambridge: Cambridge University Press.
Katz, Anne & Gottlieb, Margo. (2013). Assessment in the classroom. In Carol A. Chapelle (Hrsg.), The encyclopedia of applied linguistics (S. 1–8). Chichester: Wiley-Blackwell. doi: 0.1002/9781405198431.wbeal0042
Kieweg, Werner. (Hrsg.). (2010). Diagnostizieren und fördern [Thementeil]. Der Fremdsprachliche Unterricht Englisch, 44(105).
Kleppin, Karin. (2008). Selbstevaluation. In Bernd Tesch, Eynar Leupold & Olaf Köller (Hrsg.), Bildungsstandards Französisch: konkret. Sekundarstufe I: Grundlagen, Aufgabenbeispiele und Unterrichtsanregungen (S. 205–215). Berlin: Cornelsen Scriptor.
KMK [Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland]. (Hrsg.). (2004). Bildungsstandards für die erste Fremdsprache (Englisch/Französisch) für den Mittleren Schulabschluss. Beschluss vom 4.12.2003. Neuwied: Luchterhand. [abrufbar unter http://www.kmk.org/bildung-schule/qualitaetssicherung-in-schulen/bildungsstandards/dokumente.html]
Kniffka, Gabriele. (2016). Verfahren der Lernstandserhebung. In Eva Burwitz-Melzer, Grit Mehlhorn, Claudia Riemer, Karl-Richard Bausch & Hans-Jürgen Krumm (Hrsg.), Handbuch Fremdsprachenunterricht (6., völlig überarb. und erweiterte Aufl., S. 403–407). Tübingen: Francke.
Knoch, Ute. (2009). Diagnostic writing assessment: The development and validation of a rating scale. Frankfurt am Main: Lang.
Köller, Olaf, Knigge, Michel & Tesch, Bernd. (Hrsg.). (2010). Sprachliche Kompetenzen im Ländervergleich. Münster: Waxmann.
Lee, Yong-Won. (2015). Diagnosing diagnostic language assessment. Language Testing, 32(3), 299–316. doi: 0.1177/0265532214565387
Moss, Pamela A. (2016). Shifting the focus of validity for test use. Assessment in Education: Principles, Policy & Practice, 23(2), 236–251. doi: 10.1080/0969594X.2015.1072085
Oscarson, Mats. (2014). Self-assessment in the classroom. In Antony J. Kunnan (Hrsg.), The companion to language assessment. Vol. II: Approaches and development (S. 712–729). Chichester: Wiley-Blackwell.
Petermann, Franz & Eid, Michael. (Hrsg.). (2006). Handbuch der Psychologischen Diagnostik. Göttingen: Hogrefe.
Pižorn, Karmen & Huhta, Ari. (2016). Assessment in educational settings. In Dina Tsagari & Jayanti Banerjee (Hrsg.), Handbook of second language assessment (S. 239–254). Boston: De Gruyter.
Purpura, James E. (2016). Second and foreign language assessment. The Modern Language Journal, 100(Supplement S1), 190–208. doi: 10.1111/modl.12308
Roche, Jörg. (2010). Fremdevaluation und Selbstevaluation. In Wolfgang Hallet & Frank G. Königs (Hrsg.), Handbuch Fremdsprachendidaktik (S. 228–231). Seelze-Velber: Kallmeyer.
Rossa, Henning. (2016a). Wie verändern Bildungsstandards und zentrale Prüfungen den Fremdsprachenunterricht? Skizze eines Forschungsdesiderats zu intendierten und beobachteten Effekten der Standard- und Kompetenzorientierung. Zeitschrift für Fremdsprachenforschung, 27(1), 99–122.
Rossa, Henning. (2016b). Testen und Prüfen. In Eva Burwitz-Melzer, Grit Mehlhorn, Claudia Riemer, Karl-Richard Bausch & Hans-Jürgen Krumm (Hrsg.), Handbuch Fremdsprachenunterricht (6., völlig überarb. und erweiterte Aufl., S. 399–403). Tübingen: Francke.
Sawaki, Yasuyo. (2016). Norm-referenced vs. criterion-referenced approach to assessment. In Dina Tsagari & Jayanti Banerjee (Hrsg.), Handbook of second language assessment (S. 45–60). Boston: De Gruyter.
Stanat, Petra, Böhme, Katrin, Schipolowski, Stefan & Haag, Nicole. (Hrsg.). (2016). JQB – Bildungstrend 2015: Sprachliche Kompetenzen am Ende der 9. Jahrgangsstufe im zweiten Ländervergleich. Münster: Waxmann. [abrufbar unter http://www.iqb.hu-berlin.de/bt/BT2015/Bericht]
Suomela-Salmi, Eija. (2010). What is alternative assessment? In Fred Dervin & Eija Suomela-Salmi (Hrsg.), New approaches to assessing language and (inter-)cultural competences in higher education/Nouvelles approches de l’évaluation des compétences langagières et (inter-)culturelles dans l’enseignement supérieur (S. 209–233). Frankfurt am Main: Lang.
Tsagari, Dina & Csépes, Ildikó. (Hrsg.). (2011). Classroom-based language assessment. Frankfurt am Main: Lang.
Turner, Carolyn E. & Purpura, James E. (2016). Learning-oriented assessment in second and foreign language classrooms. In Dina Tsagari & Jayanti Banerjee (Hrsg.), Handbook of second language assessment (S. 255–273). Boston: De Gruyter.
Yin, Muchun. (2014). Portfolio assessment in the classroom. In Antony J. Kunnan (Hrsg.), The companion to language assessment. Vol. II: Approaches and development (S. 659–676). Chichester: Wiley-Blackwell.
4 GütekriterienGütekriterien bei der Evaluation von Schreibkompetenzen
Rüdiger Grotjahn & Karin Kleppin
Die Qualität einer Evaluation wird üblicherweise anhand von bestimmten GütekriterienGütekriterien beurteilt. Nur wenn diese hinreichend erfüllt sind, lassen sich die Interpretationen (z.B. von Punktwerten im Hinblick auf die Kompetenzstufen des GERGemeinsamer europäischer Referenzrahmen) und die auf der Basis der Punktwertinterpretationen getroffenen Entscheidungen (z.B. hinsichtlich unterrichtlicher Maßnahmen) rechtfertigen. In welchem Ausmaß die einzelnen GütekriterienGütekriterien erfüllt sein müssen, hängt von den mit der Evaluation verbundenen Zielen und Konsequenzen ab. Sollen z.B. spezifische Aussagen über einzelne Individuen formuliert werden, sind in der Regel höhere Ansprüche an die Messgenauigkeit zu stellen, als wenn globale Aussagen über Gruppen gemacht werden sollen. Handelt es sich darüber hinaus um eine High-Stakes-Evaluation, d.h. um eine Evaluation mit weitreichenden Konsequenzen für die Betroffenen wie z.B. im Fall des Abiturs (vgl. Kapitel 3), sind ebenfalls höhere Ansprüche an die Präzision der Messung zu stellen als im Fall einer Evaluation ohne gravierende Konsequenzen.
Mittlerweile besteht Einigkeit darüber, dass die jeweilige Verwendung eines Evaluationsinstruments sowie die sich hieraus ergebenden Konsequenzen bei der Beurteilung der Qualität einer Evaluation stets mit zu berücksichtigen sind. Auf diesen Sachverhalt weist auch Purpura (2016) in einem aktuellen Überblicksartikel zur Evaluation von zweit- und fremdsprachlichen Kompetenzen explizit hin:
Most now recognize that assessments are used to make decisions in real-world contexts, involving factors outside the assessmentassessment itself, where the probability of making the ‘right’ decision about individual attributes or research questions is not only a function of the quality of the assessment and the related interpretations, but also a function of the use of the assessment for some intended purpose, together with the consequences of making those decisions. (S. 192f.)
4.1 Evaluation von Schreibkompetenzen: Spezifika
Während zur Evaluation von Lese- und HörverstehenskompetenzenHörverstehen zumeist geschlossene und (weitgehend) objektiv auswertbare AufgabenAufgaben zum Einsatz kommen, ist ein Spezifikum einer kompetenz- und handlungsorientierten Überprüfung von Schreibfähigkeiten,1KompetenzTestkonstrukt dass in der Regel offene AufgabenformateAufgabenformate mit einem beträchtlichen Bewertungsspielraum eingesetzt werden. Ein entscheidendes Merkmal ist dabei, dass die Aufgaben wesentliche Merkmale der lebensweltlichen Schreibhandlungen simulieren oder zumindest prototypisch abbilden, die die Testteilnehmenden außerhalb der Testsituation bewältigen sollen