Alan T. Norman

Maschinelles Lernen In Aktion


Скачать книгу

von selbst. Deshalb muss ein Datenspezialist dem Computer durch entsprechendes Feedback beibringen, wonach er suchen soll. Wenn der Datenspezialist die Aufgabenstellung nicht präzise definiert, wird auch der beste und auf die größte Datenmenge trainierte Algorithmus nicht die gewünschten Ergebnisse bringen.

      Natürlich ist maschinelles Lernen noch nicht besonders gut darin, auf einer höheren Ebene sinnbildliche Schlussfolgerungen zu ziehen. Ein Algorithmus könnte zum Beispiel in der Lage sein, ein Körbchen, bunte Eier und eine Wiese zu erkennen, nicht aber, dass es sich um eine Ostereier-Suche handelt – was wiederum die meisten Menschen erkennen würden.

      Typischerweise haben Maschinenlernen-Projekte eine eher eng gesteckte Aufgabenstellung, für die es eine Antwort zu finden gilt. Unterschiedliche Aufgabenstellungen erfordern unterschiedliche Vorgehensweisen und möglicherweise auch andere Algorithmen.

2. Die Daten

      Maschinelles Lernen ist in dieser Größenordnung erst möglich geworden aufgrund der Datenmengen, die wir in den vergangenen Jahren gesammelt haben. Diese „Big Data“-Revolution hat komplexes Algorithmustraining erst ermöglicht. Daten sind der Kern beim Anpassen jedes Maschinenlernen-Algorithmus, um richtige Antworten zu finden.

      Weil die Daten von so zentraler Bedeutung für das maschinelle Lernen sind, wirken sich die Eingaben unmittelbar die Resultate aus. Wenn die Daten schon eine Tendenz oder Voreingenommenheit beinhalten, dann wird auch der Lernalgorithmus voreingenommen sein. Zum Beispiel beinhalten Systeme, die Bewerber beurteilen, Gerichtsurteile vorhersagen oder medizinische Diagnosen unterstützen, maschinelles Lernen. Sie alle haben einen gewissen Grad von kulturellen, geschlechtsspezifischen, ethnischen, bildungsbezogenen oder anderen Verzerrungen in die Datensätze eingebaut, durch die sie trainiert werden.

      Solche Verzerrungen in den Daten können sich schlimmer auswirken als Vorurteile. Manchmal können Daten die Algorithmen auch ganz anders in die Irre führen. Nehmen wir den Fall eines militärischen maschinellen Lernmodells, das darauf trainiert wurde, getarnte Panzer in einem Wald zu erkennen. Die Datenwissenschaftler trainierten den Algorithmus mit einem Satz von Bildern, von denen die einen Panzer zwischen den Bäumen enthielten und die anderen nur Bäume zeigten. Nach erfolgtem Training konnte der Algorithmus nahezu perfekte Testergebnisse erzielen. Aber als dieses Modell dann in Betrieb genommen wurde, funktionierte das Entdecken von Panzern überhaupt nicht. Es stellte sich heraus, dass die für das Training verwendeten Bilder mit Panzern an einem sonnigen Tag aufgenommen worden waren und die, die nur Bäume zeigten, an einem bewölkten Tag. Der Algorithmus hatte dadurch nur gelernt, sonnige von bewölkten Tagen zu unterscheiden, aber nicht, Panzer zu entdecken!

      Конец ознакомительного фрагмента.

      Текст предоставлен ООО «ЛитРес».

      Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.

      Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

/9j/4AAQSkZJRgABAQEBLAEsAAD/4QFIRXhpZgAATU0AKgAAAAgACAEOAAIAAABGAAAAbgESAAMAAAABAAEAAAEaAAUAAAABAAAAtAEbAAUAAAABAAAAvAEoAAMAAAABAAIAAAExAAIAAAAcAAAAxAEyAAIAAAAUAAAA4IdpAAQAAAABAAAA9AAAAABSb2JvdCBjaGlsZCBseWluZyBvbiB0aGUgZmxvb3IgYW5kIHJlYWRpbmcgYSBib29rLiBCbHVpc2ggYmFja2dyb3VuZC4AAAABLAAAAAEAAAEsAAAAAUFkb2JlIFBob3Rvc2hvcCBDUzIgV2luZG93cwAyMDE1OjA1OjAxIDE4OjE3OjU2AAAEkAQAAgAAABQAAAEqoAEAAwAAAAEAAQAAoAIABAAAAAEAAAJYoAMABAAAAAEAAAHCAAAAADIwMTU6MDU6MDEgMTg6MTc6NTYAAAD/4RGbaHR0