Markus Spreer

Diagnostik von Sprach- und Kommunikationsstörungen im Kindesalter


Скачать книгу

auffällig gewertet – befindet sich die Körpergröße eines Kindes z.B. im Bereich von mehr als zwei Standardabweichungen unterhalb des Mittelwertes, würde dies als ernst zu nehmende Abweichung bezeichnet. Viele Testverfahren im Rahmen der Sprachdiagnostik sprechen schon von auffälligen Werten, wenn diese eine Standardabweichung unterhalb des Durchschnittswertes liegen. Dabei sollte man sich allerdings gewahr sein, dass dies auf 16 % und damit auf einen relativ großen Anteil aller Kinder zutrifft. Die diagnostische Leitlinie zur Diagnostik von umschriebenen Sprachentwicklungsstörungen (AWMF 2011) schlägt ein Abweichungskriterium von eineinhalb Standardabweichungen vor: Liegt die Leistung in einem Sprachtest unterhalb von eineinhalb Standardabweichungen unter dem Mittelwert (also z.B. unterhalb von einem T-Wert von 35) spricht man von bedeutsam abweichenden sprachlichen Minderleistungen in diesem Bereich, was zusammen mit anderen Ein- und Ausschlusskriterien zur Diagnose einer umschriebenen Sprachentwicklungsstörung führen kann (s. Kap. 4).

      Die Rekrutierung einer geeigneten Normierungsgruppe sowie das Bereitstellen entsprechender Normwerte ist nicht banal und stellt oftmals große Herausforderungen dar:

      Normen sind nichts Unumstößliches, sie sind z.B. gesellschaftlichen Veränderungen unterworfen. Sich verändernde Lebensgewohnheiten von Menschen, beispielsweise Leseverhalten im Zusammenhang mit elektronischen Medien, ein gestiegener Lebensstandard etc. können zu einer Veränderung der mittleren sprachlichen Leistungen der Bezugsgruppe führen. Was vor 10 Jahren im statistischen Sinne „normal“ war, könnte heute als leicht auffällig gelten. Im sprachlichen Bereich sind Syntax, Morphologie oder Phonologie weniger Schwankungen unterworfen als Wortschatz oder bestimmte pragmatische Fähigkeiten. In der Konsequenz bedeutet dies, das Testverfahren immer wieder neu normiert werden müssen bzw. die Gültigkeit der bestehenden Normen überprüft werden muss.

      Normgruppen müssen ausreichend groß und repräsentativ sein (keine spezielle soziale Auswahl, keine ausschließlich regionale Sprechergruppe, etc.).

      Normen für mehrsprachig aufwachsende Kinder

      Eine besondere Herausforderung an die Auswahl geeigneter Normierungsgruppen stellt Mehrsprachigkeit dar. Es wurde und wird viel darüber diskutiert, welche Bezugsgruppe hier angemessen wäre (Rinker/Sachse 2009). Derzeit zur Verfügung stehende Testverfahren gehen sehr unterschiedlich mit dem Phänomen Mehrsprachigkeit um: So argumentiert Petermann (2016) im SET 3 –5, dass ein bestimmter Prozentsatz (bis zu 30 %) der Kinder in Deutschland derzeit mit mehr als einer Sprache aufwächst und deshalb dieser Fall als „normal“ zu betrachten ist. Dementsprechend sind mehrsprachige Kinder in der Normierungsgruppe enthalten. Andere Verfahren stellen Normen ausschließlich für einsprachig deutsche Kinder dar. Dies erlaubt den Vergleich der Leistung und v. a. der Leistungsentwicklung eines mehrsprachigen Kindes im Vergleich zu monolingual deutsch aufwachsenden Kindern. Wiederum andere Verfahren versuchen Normwerte speziell für die Gruppe der mehrsprachigen Kinder zur Verfügung zu stellen. Dabei soll die Leistung eines Kindes verglichen werden mit einer Gruppe von Kindern, die z. B. seit einem ähnlich langen Zeitraum Kontakt mit der deutschen Sprache hatte. Streng genommen müssten dann aber Normwerte für alle Sprechergruppen und alle Konstellationen von Mehrsprachigkeit aufgestellt werden. Insgesamt erfordert Sprachdiagnostik mit mehrsprachigen Kindern demnach einen sehr reflektierten Umgang mit möglichen Vergleichsgruppen und der Interpretation der Normwerte im Einzelfall. Ausführliche Überlegungen dazu finden sich in Kap. 11.

      Eine indirekte Messung von Eigenschaften, im vorliegenden Fall also die Messung sprachlicher Leistungen, gelingt nur, wenn ein Verfahren bestimmten Kriterien, den sogenannten „Gütekriterien“ genügt. Man unterscheidet die Hauptgütekriterien Objektivität, Reliabilität und Validität sowie Nebengütekriterien wie Ökonomie, Testfairness oder die Normierung.

      Objektivität

      Die Objektivität eines Testverfahrens beschreibt die Unabhängigkeit eines Testergebnisses vom Testleiter und äußeren Umgebungsbedingungen. Diese Unabhängigkeit vom Beobachter bezieht sich auf verschiedene Bereiche – die Durchführung, die Auswertung und die Interpretation. Berichtet werden sollte die Durchführungsobjektivität, die über eine exakte Beschreibung der Testdurchführung (u.a. genaue, eindeutige Formulierung der Aufgabenstellung, Angabe erlaubter Nachfragen) erreicht wird. Zum anderen ist die Auswertungsobjektivität sicherzustellen. Dafür ist beispielsweise bei einem Wortschatztest sehr detailliert anzugeben, welche Antworten des Kindes auf welche Art und Weise zu werten sind (wenn z.B. Synonyme für Wörter genannt werden). Die Auswertungsobjektivität kann auch berechnet werden, indem beispielsweise unterschiedliche Personen Testprotokolle einer Stichprobe auswerten und mit einem statistischen Maß der Grad der Übereinstimmung zwischen den beiden Auswertern ermittelt wird. Für die Interpretationsobjektivität sollte ein Test angeben, ab welchen Testwerten bspw. von einer sprachlichen Auffälligkeit oder Störung auszugehen ist.

      Damit soll sichergestellt werden, dass unterschiedliche Diagnostiker das gleiche Testergebnis auch in gleicher Weise werten und interpretieren.

      Reliabilität

      Die Reliabilität eines Verfahrens bezieht sich auf dessen Zuverlässigkeit. Ein hoch reliabler Test würde ein und dieselbe Leistung (z.B. die grammatischen Fähigkeiten eines speziellen Kindes) an zwei aufeinander folgenden Tagen exakt gleich quantifizieren. Reliabilität beschreibt also, inwieweit es gelingt, die zu messende Eigenschaft stabil und z.B. unabhängig von der jeweiligen Tagesform etc. zu messen. Obwohl ein gewisser Messfehler bei der Erfassung sprachlicher Fähigkeiten (wie auch aller anderen psychischen Funktionen) nicht zu vermeiden ist, ist eine möglichst hohe Reliabilität für ein Messverfahren unabdingbar und Voraussetzung für dessen Validität. Als Maßzahl für die Reliabilität dient im statistischen Sinn eine Korrelation, die sich zwischen 0 und 1 bewegen kann, wobei eine Reliabilität von 1 eine (nicht zu erreichende) perfekte Zuverlässigkeit wäre.

      Man unterscheidet unterschiedliche Formen zum Nachweis der Reliabilität:

      Retest-Reliabilität: Dafür wird der statistische Zusammenhang (Korrelation) zwischen zwei aufeinander folgenden Messungen mit dem gleichen Verfahren bestimmt.

      Paralleltest-Reliabilität: Hierfür werden aus einem Pool von insgesamt geeigneten Testaufgaben zwei vergleichbare Testversionen zusammengestellt und der identischen Stichprobe zur Bearbeitung gegeben. Anhand der Übereinstimmung der Testergebnisse lässt sich der Reliabilitätskoeffizient berechnen.

      Split-Half-Reliabilität: In diesem Fall werden nicht unterschiedliche Testversionen erstellt, sondern das Verfahren (z. B. die 70 Items eines Wortschatztests) wird zufällig in zwei Gruppen mit ähnlich schwierigen Aufgaben aufgeteilt. Der statistische Zusammenhang dieser beiden Testhälften entspricht dem Reliabilitätskoeffizienten.

      Interne Konsistenz: Zur Ermittlung der internen Konsistenz wird ähnlich vorgegangen wie bei der Ermittlung der Split-Half-Reliabilität. Hierbei wird der Zusammenhang aller möglichen Testhalbierungen ermittelt und häufig über den Alpha-Koeffizienten (Cronbachs Alpha) angegeben.

      Konfidenzintervall

      Dem Umstand, dass die Messung psychischer Eigenschaften niemals perfekt und 100 %ig reliabel erfolgen kann, wird dadurch Rechnung getragen, dass ein sog. Konfidenzintervall angegeben wird. Die sich aus der Reliabilität eines Verfahrens ergebenden Konfidenzintervalle beschreiben einen Bereich, innerhalb dessen das „wahre Testergebnis“ einer Person mit hoher Sicherheit liegt. So kann z.B. bei einem erhaltenen T-Wert von 45 nicht mit Sicherheit gesagt werden, dass dies der wahre Wert der Leistung der Person ist, da die Reliabilität des Verfahrens nicht 1 sein wird. Liest man das übliche Konfidenzintervall (95 %-Intervall) ab, kommt man z. B. zu dem Schluss, dass der wahre Wert der Person mit einer Sicherheit von 95 % innerhalb des T-Wert-Bereiches 40 – 50 liegt. Es handelt sich hierbei also mit hoher Sicherheit um einen völlig unauffälligen Wert.

      Validität

      Unter Validität versteht man die inhaltliche Gültigkeit eines Testverfahrens: Misst der Test das, was er messen will und was er zu messen vorgibt? Werden beispielsweise mit dem Test wirklich grammatische Fähigkeiten und nicht Wortschatzleistungen