In diesem Zusammenhang erscheint die Online-Enzyklopädie Wikipedia besonders interessant, denn als weltweit größte multilinguale Online-Wissensressource bildet die Wikipedia eine wesentliche Quelle der gegenwärtigen Informationsbeschaffung im Internet und ist in Form von mehrsprachigen Korpora verfügbar (vgl. Cölfen 2012: 512f.; Pscheida 2010: 336, Mederake 2016, van Dijk 2010: 86; Lih 2009; Tiedemann 2012; Wołk/ Marasek 2014, Margaretha/Lüngen 2014). Als Online-Enzyklopädie, bei der unter Voraussetzung einer Registrierung ein Jeder mitwirken kann, ist die Wikipedia ein kollaboratives und gemeinnütziges Schreibprojekt auf ehrenamtlicher Basis, bei dem der Textproduktionsprozess einer ständigen Aushandlung innerhalb der Wikipedia-Community unterliegt (Mederake 2016: 179). Die Wikipedia existiert in insgesamt 302 Sprachversionen (Wikipedia: Sprachen6). Die deutsche Version hat nach der englischen und schwedischen die meisten Artikel (Wikipedia: Statistik – Vergleich verschiedener Sprachversionen),7 d.h. es werden sehr große und frei verfügbare Datenmengen auch für die Wissenschaft bereitgestellt, sodass die Wikipedia in unterschiedlichen humanwissenschaftlichen Forschungsrichtungen untersucht wird (vgl. Pscheida 2010: 334), z.B. zum Kooperations- sowie Konfliktlösungsverhalten im Wikipedia-Sozio-System (Wilkinson/Hubermann 2007, Matei/Dobrescu 2006), zur Motivation und Partizipation der Verfasser und Verfasserinnen (Hassel 2007, Möllenkamp 2007), zur Qualität der Wikipedia-Artikel (Blumenstock 2008, Stvilia et al. 2005) sowie zur Wikipedia als Lern- und Lehrplattform für (auto)didaktische Zwecke (Jaschniok 2007, Büffel/Pfeil/Schmalz 2007, Wolf 2007; s.a. den Forschungsstand zur Wikipedia: Wikipedistik8). Für die Linguistik ist die Wikipedia aber nicht nur wegen der verfügbaren Datenmassen und verschiedenen Sprachversionen interessant, sondern auch als Textsorte Enzyklopädie-Artikel, die in einem Aushandlungsprozess der Verfasser und Verfasserinnen als kollaborative Schreibpraxis im Internet entsteht und dieser in der Versionengeschichte und in Diskussionsseiten zu einzelnen Artikeln nachverfolgt werden kann (vgl. Gredel/Mell 2018, Gredel 2018a, b, c). Wikipedianer*innen diskutieren beispielsweise über die Konzeption oder die Struktur von Wikipedia-Artikeln und passen die Inhalte gegebenenfalls an (vgl. Stvilia et al. 2005: 17; van Dijk 2010). Wikipedia-Daten, denen auch Angaben zu Benutzern und Benutzerinnen, wie z.B. der Status innerhalb der Community oder die Anzahl verfasster Artikel, entnommen werden können, eignen sich für diskurslinguistische Fragestellungen nach Macht- und Aushandlungsprozessen in komplexen Sozio-Systemen (vgl. Gredel/Mell 2018, Gredel 2018a, b, c). Zudem gehören Wikipedia-Texte durch ihre Lokalisierung im WWW zu Hypertexten, in denen verschiedene Phänomene internetbasierter Kommunikation, wie z.B. Verlinkungen und Emoticons, aber auch multimodale Elemente in Form von Sprach- und Videoaufnahmen zu finden sind (vgl. Storrer 2018a, b; Gredel/Herzberg/Storrer, 2018; Wikipedia: Artikel mit Video9). Beim Verfassen der Artikel befolgen die Wikipedianer und Wikipedianerinnen Konventionen, die in den Wikipedia-Guidelines zusammengefasst werden und neben Informationen zur Zitierweise oder Angaben zur angemessenen Länge von Artikeln auch Richtlinien zur Verständlichkeit beinhalten (Wikipedia: Wie schreibe ich gute Artikel10):
Ein guter Artikel in Wikipedia soll verständlich sein. Überprüfe neue Artikel oder Änderungen auf allgemeine Verständlichkeit, siehe Checkliste Verständlichkeit. Menschen ohne einschlägige fachliche Vorbildung sollen einen Artikel, zumindest aber die zusammenfassende Einleitung verstehen können. Zur Verständlichkeit erforderliche Erklärungen sollen direkt im Artikel gegeben werden. Verweise geben weiterführende und vertiefende Informationen zum Thema. Artikel, auf die verwiesen wird, sollten ebenfalls verständlich sein. (Wikipedia: Allgemeinverständlichkeit; Hervorhebung im Original11)
Die Richtlinien zur Allgemeinverständlichkeit in Wikipedia-Artikeln beziehen sich auf die Grundsätze des Hamburger Verständlichkeitskonzepts, das z.B. auf die Einfachheit im Ausdruck, die Gliederung des Textes sowie auf die Kürze und Prägnanz der Produktion eines verständlichen Textes setzt (Tausch/Langer/Schulz von Thun 2015; Wikipedia: Hamburger Verständlichkeitskonzept12). Die Qualität sowie die Verständlichkeit der Wikipedia-Artikel konnte nicht nur durch empirische Studien belegt werden (Kurzidim 2004, Wiegand 2007), sondern lässt sich auch mit Klickzahlen im Internet in Verbindung bringen: Neben anderen Online-Diensten wie Google, Facebook oder Amazon gehört die Wikipedia zu den meistaufgerufenen Seiten im WWW der Gegenwart und besetzt Platz 5 (vgl. Wikipedia: Liste der meistaufgerufenen Websites13) bzw. Platz 7 (Chip: Die meistgeklickten Webseiten der Welt14) der weltweiten Ranglisten. Würden Funktionsverbgefüge, wie von Stil- und Schreibratgebern behauptet wird (vgl. Mackowiak 2011: 72), Texte unverständlich machen, dann dürften die schwülstigen Umschreibungen (zitiert nach Daniels 1963: 9f.) nicht in Wikipedia-Artikeln vorkommen. Aus der Korpusstudie von Storrer (2013) geht jedoch hervor, dass die dort untersuchten Funktionsverbgefüge Abbitte leisten, Absage erteilen, Anwendung finden, Entscheidung treffen und Kritik üben im Wikipedia-Korpus sogar häufiger vorkommen als im Vergleichskorpus mit juristischen Texten (vgl. Storrer 2013: 197). Durch den Bezug zu linguistischen Verständlichkeitskonzepten und dem Vorkommen von Nomen-Verb-Verbindungen eignen sich Wikipedia-Artikel hervorragend als Datengrundlage für die Erforschung von Funktionsverbgefügen bezüglich ihrer Leistungen im Textzusammenhang.
Für die Vergleichssprachen der vorliegenden Untersuchung Deutsch und Polnisch15 sind zwei Arten von Korpora mit Wikipedia-Artikeln verfügbar, nämlich die Parallelkorpora der Korpus-Plattform OPUS (Tiedemann 201216; Wołk/Marasek 2014) mit Wikipedia-Artikel-Korpora in 20 Sprachen17 – darunter sind beispielsweise Arabisch, Russisch und Vietnamesisch sowie Englisch, Französisch, Deutsch und Polnisch – und die Vergleichskorpora des Leibniz-Instituts für Deutsche Sprache,18 die mit dem Deutschen in insgesamt neun Sprachversionen zur Verfügung stehen, und zwar in Englisch, Spanisch, Französisch, Italienisch, Norwegisch, Kroatisch, Ungarisch und Polnisch (Margaretha/Lüngen 201419).
Die Parallelkorpora der OPUS-Plattform basieren auf maschinellen Übersetzungen von Originaltexten in eine bzw. mehrere Zielsprachen (Wołk/ Marasek 2014) und eignen sich für Fragestellungen, die sich beispielsweise auf die Ausprägung einer sprachlichen Form bzw. Mehrworteinheit in verschiedenen Sprachsystemen befassen, z.B. wie die Konstruktion Frage stellen im Polnischen widergegeben wird und ob es unterschiedliche Übersetzungsvarianten gibt, was an den folgenden Beispielen aus Linguee demonstriert wird (Hervorhebung S.K.)20
1 Deutsch: Eine Frage stellt sich natürlich immer wieder, nämlich, ob die humanitäre Hilfe die Richtigen erreicht, und hier spielt Transparenz eine sehr wichtige Rolle.Polnisch: Oczywiście rodzi się jedno pytanie – pytanie zadawane od dawna – o to, czy pomoc humanitarna dociera do rzeczywistych odbiorców, przejrzystość odgrywa tu bardzo ważną rolę.
2 Deutsch: Wenn ihm eine Frage gestellt wird, sollte ein Präsident versuchen, sie irgendwie zu beantworten und eine mutige Entscheidung treffen: Er sollte sagen „Ich bin dafür” oder „Ich bin dagegen” und dies begründen.Polnisch: Gdy słyszy pytanie, powinien spróbować na nie odpowiedzieć i podjąć odważną decyzję: oświadczyć „Jestem za” lub „Jestem przeciw”, po czym wyjaśnić, dlaczego.
In keiner der polnischen Übersetzungen erscheint das Funktionsverbgefüge Frage stellen als Nomen-Verb-Verbindung: In (1) wird das Funktionsverbgefüge Frage stellen mit rodzić pytanie übersetzt, was wörtlich ‚eine Frage gebären‘ bedeutet (vgl. Pons online: rodzić21). In (2) wird Wenn ihm eine Frage gestellt wird mit Gdy słyszy pytanie wiedergegeben, was wörtlich ‚wenn er eine Frage hört‘ bedeutet, d.h. in Übersetzung (2) ist kein Funktionsverbgefüge vorhanden, sondern nur das Nomen Frage ‚pytanie‘. Das deutsche Funktionsverbgefüge Frage stellen kann also je nach kontextuellen Erfordernissen auch mit anderen sprachlichen Mitteln übersetzt werden (vgl. Kvam 2010: 55). In Übersetzungen kann es zudem zur Übertragung von Strukturen der Ausgangssprache auf die Zielsprache als Shining-through-Effekte kommen (Teich 2003: 61; Hansen 2006: 115), was sich auf Untersuchungsergebnisse auswirken kann. Die Wikipedia-Übersetzungsmaschine der OPUS-Plattform wird außerdem von den Entwicklern als weiter verbesserungsfähig im Vergleich mit menschlichen Übersetzungen eingestuft (Wołk/ Marasek 2014: 131), was auf zusätzliche Fehlerquellen schließen lässt. Da in der vorliegenden Arbeit deutsche und polnische Funktionsverbgefüge auf systematisierbare Funktionen im Textzusammenhang