Data Science & Maschinelles Lernen in Python - am Beispiel

Das Ziel von Data Science besteht darin Wissen aus strukturierten und unstrukturierten Daten zu extrahieren.
Zu diesem Zweck kommen verschiedene Methoden und Algorithmen zum Einsatz, darunter auch solche aus dem Bereich des Maschinellen Lernens.
Hierbei geht es darum Muster in Trainingsdaten zu erkennen. Aus diesen Gesetzmäßigkeiten werden mithilfe von Algorithmen neue statistische Modelle gebildet,
womit sich schließlich auch unbekannte Daten zuverlässig beurteilen lassen.

In diesem Kurs wird die Theorie und Anwendung der beiden Disziplinen, Data Science und Maschinelles Lernen, aufgezeigt.
Dafür wird die Programmiersprache Python verwendet, wobei keine Vorkenntnisse vorausgesetzt sind. Weiter wird der Umgang mit
dem Framework Apache Spark vermittelt, das eine parallele Berechnung auf mehreren
Computern ermöglicht, um sehr große Datenmengen ("Big Data") verarbeiten zu können.

Mit diesen Tools und anhand von vielen praktischen Beispielen werden folgende Themen besprochen:

Lineare und Polynomiale Regressionsanalyse
K-Means-Algorithmus
Hauptkomponentenanalyse
Train/Test, Kreuzvalidierungsverfahren
Bayes’sche Methoden
Entscheidungsbäume, Random Forests
Multivariante Regression
Support Vector Machines
Bestärkendes Lernen
Empfehlungssystem: Kollaboratives Filtern
K-Nächster-Nachbar
Bias/Varianz-Dilemma
Ensemble Lernen
Volltextsuche mit Hilfe von TF-IDF
AB-Tests

Alle diese Themen werden verständlich kommuniziert und so aufbereitet, dass die Teilnehmer sie nach Abschluss des Kurses
für eigene Problemstellungen einsetzen können.

Zum Kurs!