Peter Bruce

Praktische Statistik für Data Scientists


Скачать книгу

Geordnete Faktorvariablen

       Interpretieren der Regressionsgleichung

       Korrelierte Prädiktorvariablen

       Multikollinearität

       Konfundierende Variablen

       Interaktions- und Haupteffekte

       Regressionsdiagnostik

       Ausreißer

       Einflussreiche Beobachtungen

       Heteroskedastische, nicht normalverteilte und korrelierte Fehler

       Partielle Residuendiagramme und Nichtlinearität

       Polynomiale und Spline-Regression

       Polynome

       Splines

       Verallgemeinerte additive Modelle

       Weiterführende Literatur

       Zusammenfassung

       5Klassifikation

       Naiver Bayes-Klassifikator

       Warum eine exakte bayessche Klassifikation nicht praktikabel ist

       Die naive Lösung

       Numerische Prädiktorvariablen

       Weiterführende Literatur

       Diskriminanzanalyse

       Kovarianzmatrix

       Lineare Diskriminanzanalyse nach Fisher

       Ein einfaches Beispiel

       Weiterführende Literatur

       Logistische Regression

       Logistische Antwortfunktion und Logit-Funktion

       Logistische Regression und verallgemeinerte lineare Modelle

       Verallgemeinerte lineare Modelle

       Vorhergesagte Werte aus der logistischen Regression

       Interpretation der Koeffizienten und Odds-Ratios

       Lineare und logistische Regression: Gemeinsamkeiten und Unterschiede

       Das Modell prüfen und bewerten

       Weiterführende Literatur

       Klassifikationsmodelle bewerten

       Konfusionsmatrix

       Die Problematik seltener Kategorien

       Relevanz, Sensitivität und Spezifität

       ROC-Kurve

       Fläche unter der ROC-Kurve (AUC)

       Lift

       Weiterführende Literatur

       Strategien bei unausgewogenen Daten

       Undersampling

       Oversampling und Up/Down Weighting

       Generierung von Daten

       Kostenbasierte Klassifikation

       Die Vorhersagen untersuchen

       Weiterführende Literatur

       Zusammenfassung

       6Statistisches maschinelles Lernen

       K-Nächste-Nachbarn

       Ein kleines Beispiel: Vorhersage von Kreditausfällen

       Distanzmaße