mehrsprachig auf „ja“ oder „nein“). Als Maß der zentralen Tendenz lässt sich der Modalwert (häufigster Wert) ermitteln.
Ordinalskala/Rangskala: Ordinalskalierte Daten hingegen lassen sich hierarchisch ordnen, allerdings sind die Abstände zwischen den einzelnen Werten nicht quantifizierbar. Die Daten lassen sich jedoch anhand der Relationen „größer/kleiner“ ordnen. Das Maß der zentralen Tendenz ordinalskalierter Daten ist der Median. Beispiele für diese Skala sind Schulnoten, Ratings von z. B. sprachlichen Verhaltensweisen („Kind hält Blickkontakt“ mit den Ausprägungen „nie“ „selten“ „meistens“ „immer“) oder auch Prozentränge, die in normierten Testverfahren angegeben werden.
Intervallskala: Bei intervallskalierten Daten findet man über das ordinalskalierte Niveau hinaus nicht nur die „größer/kleiner“-Relation, sondern auch die Gleichheit von Differenzen zwischen den Messwerten. Somit lässt sich für diese Werte als Maß der zentralen Tendenz das arithmetische Mittel (mathematischer Durchschnitt) berechnen, beispielsweise für Intelligenzquotienten oder T-Werte von (Sprach-)Testverfahren.
Verhältnisskala: Über die intervallskalierten Daten hinausgehend weisen verhältnisskalierte Daten nicht nur die Gleichheit von Differenzen, sondern auch die Gleichheit von Verhältnissen auf. Die Verhältnisskala hat einen natürlichen Nullpunkt. Das wiederum ermittelbare arithmetische Mittel kommt so beispielsweise für Längen- oder Gewichtsmaße zum Einsatz (Hesse/Latzko 2017, 69).
3.1.2 Normorientierung – Normierung
Bezugsnormen
„Diagnostizieren heißt Vergleichen“ (Kany/Schöler 2009, 49). Im Rahmen einer jeden Diagnostik erfolgen Vergleiche auf unterschiedlichen Ebenen. Für die Interpretation der gewonnenen diagnostischen Informationen ist dabei immer eine Orientierung an Normen notwendig. Diese „Bezugsnormen“ erlauben z. B. die Einordnung einer gemessenen Fähigkeit als über- oder unterdurchschnittlich, das Einstufen eines bestimmten beobachteten Verhaltens als altersgerecht oder nicht altersgerecht, die Beurteilung eines Lernfortschritts eines Kindes in einem bestimmten Bereich oder Aussagen über das Erreichen eines definierten Ziels. Dabei geht es zunächst nicht um die Bewertung eines bestimmten Verhaltens (was der Alltagsbegriff von Norm oder Normalität nahelegen könnte), sondern um eine möglichst neutrale Zustandsbeschreibung.
Folgende drei Gruppen von Bezugsnormen können unterschieden werden:
■ Soziale Bezugsnorm
■ Kriteriale/sachliche Bezugsnorm
■ Individuelle Bezugsnorm
Erfolgt ein Vergleich mit einer sozialen Bezugsnorm wird das Ergebnis des Einzelfalls (also des zu begutachtenden Kindes) in Relation zu einer bestimmten Bezugsgruppe gesetzt. Je nach Fragestellung oder Verfahren ist dies z.B. die Gruppe aller fünfjährigen Kinder oder die Gruppe aller Drittklässler.
Die kriteriale Norm bezieht sich auf den Vergleich eines individuellen Ergebnisses mit einem von außen gesetzten Kriterium. Dies wäre z.B. im schulischen Kontext ein bestimmtes, definiertes Lernziel oder ein bestimmtes Sprachniveau, das eine Person erreichen muss, um z.B. zu einer Ausbildung zugelassen zu werden.
Die individuelle Bezugsnorm vergleicht die Leistungen einer Person mit den früheren Leistungen derselben Person. Im Rahmen einer Verlaufsdiagnostik (innerhalb eines therapeutischen Vorgehens) wäre dies z.B. der Vergleich mit bestimmten morphologischen Leistungen zu einem oder mehreren Zeitpunkten vor Beginn und während der Therapie.
Das Bereitstellen geeigneter Normen ist nicht immer einfach und bleibt in manchen Bereichen eine große Herausforderung. So ist es z. B. immer wieder Gegenstand von Diskussionen, welche Bezugsgruppen geeignete soziale Vergleichsgruppen für mehrsprachige Kinder sind.
Im Rahmen der Diagnostik ist es abhängig von der Fragestellung, welche Bezugsnorm verwendet wird. Es kann auch sinnvoll sein, unterschiedliche Normen anzuwenden und diese Vergleiche dann entsprechend zu interpretieren. So ist beispielsweise eine alleinige Fokussierung auf eine individuelle Bezugsnorm ohne den Bezug zur sozialen Norm an irgendeiner Stelle des diagnostischen Prozesses wenig zielführend.
Normorientierung von Verfahren
Um die Einordnung des Ergebnisses eines Testverfahrens oder auch eines Beobachtungsverfahrens vorzunehmen, ist eine sogenannte Normierung des Verfahrens notwendig. Dabei wird ein individuelles Testergebnis mit denen einer sozialen Bezugsgruppe verglichen. Benennt ein Kind beispielsweise in einem aktiven Wortschatztest 35 von 60 Wörtern richtig, sagt dieser sogenannte Rohwert allein nichts aus. Bei einem dreijährigen Kind könnte dieser Wert z. B. auf ein überdurchschnittliches Ergebnis hindeuten, während er bei einem vierjährigen gerade noch als altersgerecht einzustufen wäre. Die Rohwerte müssen also in Werte transformiert werden, die eine Einordnung des individuellen Testergebnisses in Bezug auf eine Vergleichsgruppe (z. B. die Gruppe der vierjährigen Kinder) ermöglichen. Damit werden auch Vergleiche von Testergebnissen unterschiedlicher Testverfahren oder einzelner Untertests möglich.
Um solche Vergleichswerte zu erhalten, wird ein Verfahren (das zunächst den im nächsten Abschnitt beschriebenen Gütekriterien genügen muss) normiert. In den meisten Fällen bedeutet dies, dass die Aufgaben (sog. „Items“) eines Tests einer repräsentativen Gruppe (z.B. von dreijährigen Kindern) vorgelegt werden. Stellt man die erzielten Ergebnisse dieser Gruppe von Kindern als Häufigkeitsverteilung dar, summiert man also auf, welche Rohwerte wie oft von den Kindern erzielt wurden, ähnelt diese Verteilung für die Messung unterschiedlicher (sprachlicher) Merkmale einer sogenannten „Normalverteilung“.
Normalverteilung
Diese ist dadurch gekennzeichnet, dass sich die meisten Werte um einen Mittelwert herum verteilen. Der mittlere Wert kommt dabei am häufigsten vor. Etwa zwei Drittel aller erzielten Werte liegen innerhalb einer Standardabweichung (engl. standard deviation, SD) um den Mittelwert herum. In Abbildung 4 wird dies deutlich: 68 % der Messwerte befinden sich in diesem Bereich, der deshalb auch als engerer Durchschnittsbereich bezeichnet wird. Werte oberhalb der Grenze von einer Standardabweichung werden als überdurchschnittlich, Werte unterhalb als unterdurchschnittlich beschrieben. Liegt ein Kind mit seiner erzielten Leistung beispielsweise in einem Wortschatztest eine Standardabweichung unterhalb des Mittelwertes, so bedeutet dies, dass 16 % aller Kinder der Normgruppe (z. B. der vierjährigen Kinder) schlechter als dieses Kind, insgesamt 84 % aller Kinder besser als das Kind abschneiden. Liegt der Wert eines Kindes zwei Standardabweichungen unter dem Durchschnitt, so sind nur noch 2 % aller Kinder schlechter beim Bewältigen der Anforderungen des jeweiligen Tests.
Abb. 4: Normalverteilung
Normskalen
Um die Leistung eines Kindes in einem Test beschreiben und einordnen zu können, werden die Rohwerte anhand von Tabellen im Manual eines Testverfahrens oder mit Hilfe eines Auswertungsprogramms in allgemein gebräuchliche Normwerte umgewandelt. Die gebräuchlichsten Normskalen sind die T-Wert-Skala (mit einem Mittelwert von 50 und einer Standardabweichung von 10) sowie die IQ-Skala (mit einem Mittelwert von 100 und einer Standardabweichung von 15). Diese Normwerte können bei Bedarf (wenn z.B. das Ergebnis eines Sprachtests mit dem eines Intelligenztests verglichen werden soll) problemlos ineinander überführt werden. In Bezug auf die T-Wert-Skala bedeutet beispielsweise ein Wert von 60, dass dieser eine Standardabweichung oberhalb des Mittelwertes liegt und nur noch ca. 16 % der Kinder der Vergleichsgruppe noch bessere Werte erzielen. Für eine Einordnung dahingehend, welcher Prozentsatz der Kinder in einem speziellen Test besser oder schlechter als das individuelle Kind abschneidet, können außerdem Prozentränge genutzt werden: ein Prozentrang von 7 bedeutet dabei, dass 7 % der Kinder schlechter als dieses, bzw. 93 % der Kinder der Bezugsgruppe die Anforderungen des jeweiligen Tests besser bewältigen konnten. Entspricht die Verteilung der Testwerte in der Normierungsstichprobe keiner Normalverteilung, können ausschließlich Prozentränge angegeben werden.
Welche Werte im Rahmen einer Diagnostik als „auffällig“ bewertet werden, ist abhängig von Definitionen für bestimmte Störungen,