190.021 Einführung in die Datenmodellierung (4ECTS VU, WS)

image_pdfimage_print

Note, this course is held in German, for English-speaking students there is an exercise group (Group E) in which the lecture part is repeated at the beginning of each unit.  

A course description in English can be found via MUOnline

Kursbeschreibung

Die Datenmodellierung spielt eine wesentliche Rolle in modernen Unternehmen. Unzählige Prozessdaten werden gespeichert und zur Prozessoptimierung, zur Qualitätssicherung oder zum Verbessern der Arbeitssicherheit verwendet.

Aber um welche Daten handelt es sich dabei, wie werden die Daten gespeichert und verarbeitet, und wie können damit die obigen Ziele, z.b. durch KI-Methoden erreicht werden? Diese Fragen werden in dieser Lehrveranstaltung behandelt. 

Ziele der Lehrveranstaltung (LV)

Das Ziel der LV ist die Vermittlung von Kompetenzen zur Datenmodellierung und nicht die Anwendung spezieller Tools.

Um das zu erreichen werden Konzepte (z.B. was sind Datenstörungen, wie erkennt man sie und wie können sie behoben werden) vermittelt und an Beispielen im HS interaktiv und eigenständig erprobt. Es ist keine Datenbankenvorlesung.  

Erworbene Kompetenzen

  • Grundlagen der Datenmodellierung kennen. Dazu gehören die unterschiedlichen Daten (quantitative und kategoriale Variablen) und Aufnahme/Modellierungsarten (z.B. Exceltabellen, Datenbanken, Arrays, etc.), Diskretisierungsgrundlagen (Nyquist-Shannon Theorem) und Imformationstheorie-Grundlagen (Entropie der Daten).
  • Die Notwendigkeit von Kenntnissen zur Datenmodellierung durch Expertenvorträge aus der deutschsprachigen Industrie oder von Experten der MUL erkennen. Eingeladene Experten stellen ihre Daten, Modellierungsverfahren und die nötigen Kenntnisse der Mitarbeiter vor.  
  • Korrelationen erkennen und für Vorhersagen nützen.
  • Daten visuell aufbereiten können, z.b. mit online Tools wie Jupyter Notebooks, https://www.chartle.com,https://plotdb.com, oder unserem zukünftigen Research Data Management Repository (https://inveniordm.web.cern.ch).
  • Probleme wie Ausreißer, Störungen, fehlende Messwerte in Daten erkennen können und Lösungsstrategien anwenden können.
  • Unterschiedliche Datensatzformate und Zugriffsmöglichkeiten kennen, z.B.: online Datenbanken kennen und verarbeiten können (https://www.statista.com, https://trends.google.com/trends/, https://ourworldindata.org).
  • Eigene Datenmanagementsysteme erstellen können (SQLLite, mariadb, CSV, Excel) und mit Visualisierungstools verknüpfen können (graphana, Jupyter NB, etc).
  • Grundlagen der Statistik auf Daten anwenden können (Mittelwert, Median, Standardabweichung, Quantiles, Tests auf Normalverteilung der Daten, Korrelationen visualisieren).
  • Das Funktionsprinzip von maschinellen Lernmethoden auf Daten beschreiben können: Begriffe wie Vorhersagen, abhängige Variablen, erklärende Variablen erklären können.
  • Onlinetools (lineare- und nichtlineare Regressionen) zur Vorhersage anwenden können.

Unterrichtsformat

Die LV baut auf vier Säulen auf:

  1. Grundlagenvermittlung per Frontalunterricht im Hörsaal mit interaktiven Elementen.
  2. Expertenvorträge zur Datenmodellierung aus Unternehmenssicht (was ist der Stand der Technik im Unternehmen, was müssen Studierende beherrschen, wenn sie bei diesen Unternehmen arbeiten wollen).
  3. Expertenvorträge zu weiterführenden Inhalten an der Montanuniversität (Wo und wie wende ich im Laufe des Studiums die Kenntnisse an, z.B. Machine Learning, IoT, etc.).
  4. Praktische Übungen in Gruppen. 

Links and Ressourcen

 

Ort und Zeit

  • Vorlesungen und Expertenvorträge: HS 1 Studienzentrum
    • jede Woche am Montag (11:00-13:00), ab dem 11.11.2024
    • jede Woche am Donnerstag (11:00-12:00), ab dem 14.11.2024
  • Übungen: Es gibt 10 Gruppen zur Auswahl mit unterschiedlichen Zeiten. Gruppe E wird in Englisch abgehalten. Aufgrund von Ausnahmen, bitte im MUOnline die genauen Termine beachten.   
    • Gruppe 1: Dienstag (14:00-16:00) CR Hilbert
    • Gruppe 2: Dienstag (16:00-18:00) CR Hilbert
    • Gruppe 3: Dienstag (18:00-20:00) CR Hilbert
    • Gruppe 4: Mittwoch (14:00-16:00) CR Hilbert
    • Gruppe 5: Mittwoch (16:00-18:00) CR Hilbert
    • Gruppe 6: Mittwoch (18:00-20:00) CR Hilbert
    • Gruppe 7: Montag (16:00-18:00) CR Hilbert
    • Gruppe 8: Dienstag (16:00-18:00) CR IZR
    • Gruppe 9: Mittwoch (14:00-16:00) CR IZR
    • Gruppe E: Mittwoch (16:00-18:30) CR IZR
 

Notwendiges Vorwissen

Keine. 

Folien und Unterlagen

Folgende Termine sind für die LV vorgesehen. Jedoch gilt die Liste als vorläufig und nicht alle Termine werden benötigt.  

  • 11.11.2024 (Montag)
    • TBA
  • 14.11.2024 (Donnerstag)
    • TBA
  • 18.11.2024 (Montag)
    • TBA
  • 21.11.2024 (Donnerstag)
    • TBA
  • 25.11.2024 (Montag)
    • TBA
  • 28.11.2024 (Donnerstag)
    • TBA
  • 02.12.2024 (Montag)
    • TBA
  • 05.12.2024 (Donnerstag)
    • TBA
  • 09.12.2024 (Montag)
    • TBA
  • 12.12.2024 (Donnerstag)
    • TBA
  • 16.12.2024 (Montag)
    • [Expertenvortrag] DI Daniel Valtiner, B.Sc. MBA, Infineon Technologies Austria AG, Titel: Chancen und Herausforderungen beim Einsatz von Large Language Models in der Fertigung von Halbleitertechnologie.
  • 20.12.2024 (Donnerstag)
    • TBA
  • 13.01.2025 (Montag)
    • TBA
  • 16.01.2025 (Donnerstag)
    • TBA
  • 20.01.2025 (Montag)
    • TBA
  • 23.01.2025 (Donnerstag)
    • TBA
  • 27.01.2025 (Montag)
    • TBA
  • 30.01.2025 (Donnerstag)
    • TBA

Benotung

Die Benotung erfolgt immanent. Insgesamt können 100 Punkte durch aktives Mitarbeiten, Übungsblätter und durch Prüfungen erworben werden. 

Details zur Benotung werden in der ersten Vorlesungseinheit vorgestellt, d.h. am 11.11.2024. 

Benotungsschema: 0-49,9 Punkte (5), 50-65,9 Punkte (4), 66-79 Punkte (3), 80-91 Punkte (2), 92-100 Punkte (1).

Bei einer Gesamtpunktzahl von bis zu 79 % KANN (!) auch eine zusätzliche mündliche Leistungsüberprüfung erforderlich sein, wenn der positive Leistungsnachweis nicht eindeutig ist. In diesem Fall werden Sie informiert, sobald die Noten bekannt gegeben werden. Wenn Sie bereits eine Note über MU online erhalten haben, werden Sie nicht zu einer weiteren mündlichen Leistungskontrolle eingeladen.

Literatur

Grundlagen zur Datenmodellierung

– Karsten Berns, Bernd Schürmann, Mario Trapp 2010. Eingebettete Systeme: Systemgrundlagen und Entwicklung eingebetteter Software. Vieweg+Teubner Verlag.

Maschine Learning and Data-modelling:

– Rueckert Elmar 2022. An Introduction to Probabilistic Machine Learning, https://cloud.cps.unileoben.ac.at/index.php/s/iDztK2ByLCLxWZA

– James-A. Goulet 2020. Probabilistic Machine Learning for Civil Engineers. MIT Press.

– Bishop 2006. Pattern Recognition and Machine Learning, Springer.

Learning method Programming in Python:

– Sebastian Raschka, YuxiH. Liu and Vahid Mirjalili 2022. Machine Learning with PyTorch and Scikit- Learn. Packt Publishing Ltd, UK.

– Matthieu Deru and Alassane Ndiaye 2020. Deep Learning mit TensorFlow, Keras und TensorFlow.js., Rheinwerk-verlag, DE. 

Problemspecific Litheratur:

– B. Siciliano, L.Sciavicco 2009. Robotics: Modelling, Planning and Control, Springer.

– Kevin M. Lynch and FrankC. Park 2017. MODERN ROBOTICS, MECHANICS, PLANNING, AND CONTROL, Cambridge University Press.

– E.T. Turkogan 1996. Fundamentals of Steelmaking. Maney Publishing,UK.