Data Science, Apache Spark & Python: Analysiere echte Daten!

Zum Kurs

Das Ziel von Data Science besteht darin aus strukturierten und unstrukturierten Daten Wissen zu generieren.
Mit Datenanalysen und Visualisierungen werden so zum Beispiel neue Entscheidungsgrundlagen geschaffen.

Allerdings sind für besonders große Datenmengen, Big Data genannt, herkömmliche Tabellenprogramme
wie Excel nicht mehr geeignet und wir brauchen stattdessen speziellere Tools: Apache Spark ist ein Framework für Cluster Computing, mit dem Berechnungen auf
mehrere Computer aufgeteilt werden. Dadurch wird es erst möglich mit besonders umfangreichen Datenmengen umgehen zu können.

Dieser Kurs für zukünftige Data Scientists und sonstige Daten-Interessenten vermittelt Apache Spark in der Programmiersprache Python.
Die Teilnehmer sollten schon ein wenig Programmiererfahrung besitzen.
Nach diesem Kurs können sie eigenständig Statistiken auswerten und visualisieren. Genauer beherschen sie unter anderem Themen wie

Dieser Kurs bietet neben Übungsaufgaben auch Projekte, in denen echte Datensätze analysiert werden.
Es werden Gletscherstatistiken analysiert, Taxi-Daten visualisiert,
die Häufigkeit von Wörtern in einem E-Book bestimmt und Geburtsstatistiken in den USA ausgewertet.

Zum Kurs