Das Ziel von Data Science besteht darin Wissen aus strukturierten und unstrukturierten Daten zu extrahieren.
Zu diesem Zweck kommen verschiedene Methoden und Algorithmen zum Einsatz, darunter auch solche aus dem Bereich des Maschinellen Lernens.
Hierbei geht es darum Muster in Trainingsdaten zu erkennen. Aus diesen Gesetzmäßigkeiten werden mithilfe von Algorithmen neue statistische Modelle gebildet,
womit sich schließlich auch unbekannte Daten zuverlässig beurteilen lassen.
In diesem Kurs wird die Theorie und Anwendung der beiden Disziplinen, Data Science und Maschinelles Lernen, aufgezeigt.
Dafür wird die Programmiersprache Python verwendet, wobei keine Vorkenntnisse vorausgesetzt sind. Weiter wird der Umgang mit
dem Framework Apache Spark vermittelt, das eine parallele Berechnung auf mehreren
Computern ermöglicht, um sehr große Datenmengen ("Big Data") verarbeiten zu können.
Mit diesen Tools und anhand von vielen praktischen Beispielen werden folgende Themen besprochen:
Alle diese Themen werden verständlich kommuniziert und so aufbereitet, dass die Teilnehmer sie nach Abschluss des Kurses
für eigene Problemstellungen einsetzen können.