Big Data Management (ILV)
BackSpecialization Area | Digital Business Management |
Course number | B4.06361.50.1370 |
Course code | BDATM |
Curriculum | 2024 |
Semester of degree program | Semester 5 |
Mode of delivery | Presence- and Telecourse |
Units per week | 3,0 |
ECTS credits | 5,0 |
Language of instruction | German |
Die Studierenden sind in der Lage,
- die einzelnen Wertschöpfungsschritte von der Entstehung der Daten bis zu deren Nutzung zu verstehen und fallbezogen anzuwenden.
- die unterschiedlichen Stadien und Szenarien, in welchen die Daten das wertsteigernde Potenzial entfalten, zu beschreiben und somit die Prinzipien der Data Value Chain zu verstehen und anzuwenden.
- aus Daten einen Wert abzuleiten, wenn die Daten in ausreichender Qualität vorliegen und in der Folge zu nutzen und unterschiedliche, weiterführende Datenspeicherkonzepte (z.B. NoSQL Datenbanken, verteilte Datenbanken usw.) zu kennen und diese hinsichtlich ihrer Eignung für konkrete Problemstellungen zu vergleichen und zu bewerten.
- die speziellen Anforderungen an Datenspeicherung, die aus der Verwendung von sehr großen Datenmengen (Big Data und Data Lake) hervorgehen, zu erläutern.
- geschäftsrelevante Informationen entscheidungsorientiert zu sammeln, aufzubereiten und darzustellen.
- den Aufbau, die Architektur und die Datenverarbeitung von Data Lakes zu verstehen und einfachere Anwendungsfälle in diesen Umgebungen umzusetzen.
- die Wertschöpfungskette der Daten in den unterschiedlichen Datenspeicherungskonzepten zu erkennen und zu analysieren.
- die in diesem Zusammenhang geschäftsrelevanten Informationen zu identifizieren und daraus neues Wissen zu generieren.
- die Architektur und Prinzipien eines Data Warehouse bzw. der OLAP- Technologie zu beschreiben und in den Kontext mit Relationen Datenbanken und NoSQL/ NewSQL Datenbanken zu stellen.
- auf Basis von SQL-Datenbanken Abfragen zu definieren und Transaktionen durchführen sowie komplexere SQL-Scripts zu erstellen.
- auf Basis von NoSQL und NewSQL Datenbanken einfache Datenmodelle zu erstellen und Daten daraus abzufragen.
- auf Basis von MS Excel/MS Power BI dynamische Power Queries zu erstellen bzw. Pivot Analysen durchzuführen.
- die Scriptsprachen M und DAX zu verstehen und im MS Power BI anzuwenden.
- Informationen zu strukturieren, zu modellieren und innerhalb von Datenbanksystemen darzustellen.
- Die Struktur und Anwendung zwischen SQL-basierten und NoSQL Datenbanken zu differenzieren.
- mit Hilfe der Entwurfstheorie eine Datenbank zu entwerfen, zu modellieren bzw. physisch zu realisieren. Sie können
- Daten mit Hilfe von SQL zu importieren, zu transformieren und zu analysieren bzw. anhand einer bestehenden Datenbank ein Reverse Engineering durchzuführen.
- Informationen aus Datenbanken mittels der Abfragesprache SQL abzurufen/einzufügen/zu verändern und zur weiteren Verarbeitung bereitzustellen.
- strukturierte Daten (XML, JSON) und unstrukturierte Daten (z.B. CSV etc.) bereitzustellen und zu verarbeiten.
- eigenständig Datenbankmodelle zu entwickeln und diese anhand von automatisierten Validierungs- und Semantikchecks zu überprüfen.
- Prinzipien der Data Value Chain, Speicherung und Nutzung von geschäftsrelevanten bzw. -kritischen Daten im Rahmen von Geschäftsprozessen
- IoT im Rahmen von Big Data Management
- Persistente Haltung von Daten, Datenintegrität, Homogenität, Big Data
- Prinzip und Funktionsweise eines Data Warehouse und der OLAP- Technologie
- Prinzipien von relationalen Datenbanken auf Basis SQL versus NoSQL/NewSQL Datenbanken
- Aufbau, Möglichkeiten und Best-Practice Beispiele - Data Lakes
- Storage-Lösungen und Datenverarbeitung in Data Lakes auf Basis MS Azure/Snowflake
- Weiterführende Möglichkeiten mit Microsoft Power BI
- Skriptsprachen M und DAX im Rahmen von MS Power BI
Carpenter, J./Hewitt, E. (2016): Cassandra The Definitive Guide. Distributed Data At Web Scale. Beijing, Boston, Farnham, Sebastopol, Tokyo: O'Reilly.
Celko, J. (2014): Joe Celko's complete guide to NoSQL. What every SQL professional needs to know about nonrelational databases. Waltham, MA: Morgan Kaufmann.
Cordon, C./Garcia-Milà, P. et al. (2016): Strategy Is Digital. How Companies Can Use Big Data in the Value Chain. Heidelberg: Springer-Verlag GmbH.
Edlich, S./Friedland, A./Hampel, J./Brauer, B. (2010): NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken. München: Hanser.
Freiknecht, J./Papp, S. (2018): Big Data in der Praxis. Lösungen mit Hadoop, Spark, HBase und Hive. Daten speichern, aufbereiten, visualisieren, 2., erw. Aufl. München: Hanser.
Jung, H. H./Kraft, P. (Hrsg.) (2017): Digital vernetzt. Transformation der Wertschöpfung. Szenarien, Optionen und Erfolgsmodelle für smarte Geschäftsmodelle, Produkte und Services. München: Carl Hanser Verlag.
Kleppmann, M. (2017): Designing data-intensive applications. The big ideas behind reliable, scalable, and maintainable systems. Sebastopol, CA: O'Reilly Media.
Papp, S./Weidinger, W./Meir-Huber, M. (2019): Handbuch Data Science. Mit Datenanalyse und Machine Learning Wert aus Daten generieren. München: Carl Hanser Verlag.
Pochiraju, B./Sridhar, S. (2019): Essentials of Business Analytics. An Introduction to the Methodology and its Applications. Heidelberg: Springer-Verlag GmbH.
Runkler, T. A. (2012): Data Analytics. Models and Algorithms for Intelligent Data Analysis. Wiesbaden: Vieweg+Teubner Verlag.
Schuster, H./Arendt-Theilen, F./ Morgenthaler, R. (2018): Power BI Desktop - Einstieg und Lösungen. Daten gekonnt analysieren und visualisieren. München: Carl Hanser Verlag.
Werther, I. (2013): Business Intelligence. Komplexe SQL-Abfragen am Beispiel eines Online-Shops; inkl. Testdatenbank mit über zwei Millionen Datensätzen, 1. Aufl. München: Carl Hanser Verlag.
Vortrag, Diskussion, Einzel- und Gruppenarbeiten, Bearbeiten von Fallbeispielen aus der Praxis
Integrierte Modulprüfung
Immanenter Prüfungscharakter: Präsentation, Fallbearbeitung, Projektabgabe, mündliche Abschlussprüfung