Big Data Essentials

Auf Anfrage

Mit einer Teilnahme an Big Data Essentials erhalten Sie einen idealen Rahmen für eine erste strukturierte Auseinandersetzung mit den Themen Big Data, Machine Learning, Advanced Analytics und den dementsprechenden Tools und Systemen. Aufbauend auf den theoretischen Grundlagen werden dabei in weiterer Folge sowohl technische als auch wirtschaftliche und rechtliche Rahmenbedingungen und Sachverhalte behandelt.

Gemeinsam werden zentrale Konzepte zu Big Data, Machine Learning und künstlicher Intelligenz erarbeitet und erste Ideen für eigene Projekte generiert. Der Kurs bietet eine systematische, kreative und spannende Bearbeitung des Themas und stützt sich auf praktische Erfahrungen in der Prototypisierung und Umsetzung von Big-Data-Projekten.

Der Kurs besteht aus 3 Modulen.

MODUL 1: BIG DATA EINFÜHRUNG

Big Data Grundlagen: Definitionen, Trends
Daten, Informationen, Wissen: Datentypen, Datenherkunft, Dark Data
Data-Driven Business Geschäftsmodelle, Use Cases, Success Stories
Rechtliche Aspekte: Data Ownership, Datenschutz, Urheberrecht, Vertragsgestaltung, Geschäftsgeheimnisse
Takeaway: Grundwissen zur Thematik und zu aktuell auftretenden Geschäftsmodellinnovationen. Teilnehmerinnen und Teilnehmer sind folgend in der Lage, im eigenen Unternehmen datengetriebene Innovationsprojekte zu initiieren.

MODUL 2: DATA SCIENCE

Grundlagen Statistik: Begriffe, Definitionen, Grundkonzepte
Datenerfassung: Batch vs. Stream, Micro-Batching, CAP
Datenvorverarbeitung und -integration: ETL, Messaging Queues, Outliers, Missing Values
Datenanalyse: Machine Learning: Supervised & Unsupervised, Regression, Classification, Clustering, Bias
Datenvisualisierung: Möglichkeiten und Varianten
Takeaway: Übersicht im Bereich Data Science und Kenntnis über relevante Methoden. Teilnehmerinnen und Teilnehmer sind in der Lage im Einzelfall zu entscheiden, welche Praktiken für Use Cases relevant und zur Lösung des Problems bzw. Erfüllung der Anforderung geeignet sind.

MODUL 3: BIG DATA TECHNOLOGIES

Grundlagen Technologien: Data Management Platform Lifecycle
Apache Hadoop Ökosystem: Hadoop & Ökosystem, HDFS, MapReduce, YARN
Apache Spark: Framework, Architecture, Libraries
NoSQL: Konzepte, Column, Key-Value, Document, Graph
Tools und Suites: Open Source vs. Commercial, Enterprise Ready Tools, Cloud vs. On Premise
Takeaway: Kenntnis des aktuellen Technologie-Ökosystems. Fähigkeit zur Selektion von geeigneten Technologien und Tools zur Lösung der Problemstellung bzw. bestmöglichen Erfüllung der Anforderungen.

 

Zielgruppen

Fachexpertinnen und -experten, z.B. IT-Mitarbeiterinnen und -mitarbeiter, Teamleiterinnen und -leiter, Projektleiterinnen und -leiter, Process Owner, Innovationsmanagerinnen und -manager, Management, z. B. Chief-Officers, Bereichs- und Abteilungsleiterinnen und -leiter