UnivIS
Information system of Friedrich-Alexander-University Erlangen-Nuremberg © Config eG 
FAU Logo
  Collection/class schedule    module collection Home  |  Legal Matters  |  Contact  |  Help    
search:      semester:   
 Lectures   Staff/
Facilities
   Room
directory
   Research-
report
   Publications   Internat.
contacts
   Thesis
offers
   Phone
book
 
 
 Layout
 
printable version

 
 
Module Description Sheet (PDF)

 
 
 Also in UnivIS
 
course list

lecture directory

 
 
events calendar

job offers

furniture and equipment offers

 
 
Departments >> Faculty of Engineering >> Department of Computer Science >> Chair of Computer Science 6 (Data Management) >>

Knowledge Discovery in Databases mit Übung (KDDmUe)5 ECTS
(englische Bezeichnung: Knowledge Discovery in Databases with exercise)

Modulverantwortliche/r: Richard Lenz
Lehrende: Dominik Probst, Melanie Bianca Sigl


Start semester: SS 2022Duration: 1 semesterCycle: jährlich (SS)
Präsenzzeit: 60 Std.Eigenstudium: 90 Std.Language:

Lectures:


Inhalt:

Theoretical knowledge on:

  • Why data mining?

  • What is data mining?

  • A multi-dimensional view of data mining

  • What kinds of data can be mined?

  • What kinds of patterns can be mined?

  • What technologies are used?

  • What kinds of applications are targeted?

  • Major issues in data mining

  • A brief history of data mining

Practical exercises on:

  • Introduction to Pandas & scikit-learn

  • Data analysis & data preprocessing

  • Frequent Pattern

  • Classification

  • Clustering

  • Outlier

Lernziele und Kompetenzen:

Die Studierenden

  • kennen den typischen KDD-Prozess;

  • kennen Verfahren zur Vorbereitung von Daten für das Data Mining;

  • definieren Distanz- oder Ähnlichkeits-Funktionen auf einem speziellen Datenbestand;

  • überprüfen Attribute eines Datensatzes auf ihre Bedeutung für die Analyse hin und transformieren ggf. Attributwerte geeignet;

  • wissen, wie ein typisches Data Warehouse aufgebaut ist;

  • kennen die Definition von Distanz- bzw. Ähnlichkeitsfunktionen für die verschiedenen Typen von Attributen;

  • sind vertraut mit dem Prinzip des Apriori-Algorithmus zur Bestimmung von Mengen häufiger Elemente (frequent itemsets);

  • kennen den FP-Growth-Algorithmus zum schnellen Auffinden von Mengen häufiger Elemente;

  • geben die Definitionen von Support und Confidence für Assoziationsregeln wieder;

  • beschreiben die Ermittlung von Assoziationsregeln auf der Basis von Mengen häufiger Elemente;

  • sind in der Lage, die Vorgehensweise bei Klassifikationsaufgaben darzustellen;

  • legen dar, wie ein Entscheidungsbaum auf einem Trainingsdatensatz erzeugt wird;

  • stellen das Prinzip der Bayes'schen Klassifikation dar;

  • zählen verschiedene Clustering-Verfahren auf;

  • beschreiben den Ablauf von k-Means-Clustering;

  • kennen die verschiedenen Arten von Ausreißern.

  • können die verschiedenen Schritte eines KDD Prozesses auch praktisch anwenden.

The students:

  • know the typical KDD process;

  • know procedures for the preparation of data for data mining;

  • know the definition of distance or similarity functions for the different kinds of attributes;

  • define distance and similarity functions for a particular dataset;

  • check attributes of a dataset for their meaning with reference to an analysis and transform attribute values accordingly, if required.

  • know how a typical data warehouse is structured;

  • are familar with the principle of the Apriori algorithm for the identification of frequent itemsets;

  • know the FP-growth algorithm for a faster identification of frequent itemsets:

  • present the definitions of support and confidence for association rules;

  • describe the construction of association rules based on frequent itemsets;

  • are capable of describing the course of action in classification tasks;

  • present the construction of a decision tree based on a training dataset;

  • present the principle of Bayes' classification;

  • enumerate different clustering procedures;

  • describe the steps of k-means clustering;

  • know the different kinds of outliers.

  • are able to practically apply the various steps of a KDD process.

Literatur:

The lecture is based on the following book:

  • J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques, 3rd. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 2011, ISBN: 0123814790

Also interesting and related textbooks are:

  • A. Géron, Hands-on machine learning with Scikit-Learn and TensorFlow : concepts, tools, and techniques to build intelligent systems, 2nd ed. O’Reilly Media, 2017, ISBN: 978-1491962299

  • H. Du, Data Mining Techniques and Applications: An Introduction. Cengage Learning EMEA, May 2010, p. 336, ISBN: 978-1844808915

  • I. H. Witten, E. Frank, M. A. Hall, et al., Data Mining, Fourth Edition: Practical Machine Learning Tools and Techniques, 4th. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 2016, ISBN: 0128042915


Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan:
Das Modul ist im Kontext der folgenden Studienfächer/Vertiefungsrichtungen verwendbar:

  1. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Aufbaumodule | Aufbaumodule Informatik | Knowledge Discovery in Databases mit Übung)
  2. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Wahlpflichtbereich | Wahlpflichtbereich Informatik | Knowledge Discovery in Databases mit Übung)
  3. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Vertiefungsrichtungen | Datenbanken und Wissensrepräsentation (DW) | Knowledge Discovery in Databases mit Übung)
  4. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Vertiefungsrichtungen | Nicht gewählte Vertiefungsrichtungen | Knowledge Discovery in Databases mit Übung)
  5. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Aufbaumodule | Aufbaumodule Informatik | Knowledge Discovery in Databases mit Übung)
  6. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Wahlpflichtbereich | Wahlpflichtbereich Informatik | Knowledge Discovery in Databases mit Übung)
  7. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Vertiefungsrichtungen | Datenbanken und Wissensrepräsentation (DW) | Knowledge Discovery in Databases mit Übung)
  8. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Vertiefungsrichtungen | Nicht gewählte Vertiefungsrichtungen | Knowledge Discovery in Databases mit Übung)
  9. Data Science (Master of Science)
    (Po-Vers. 2021w | Gesamtkonto | Studienrichtung Data bases and knowledge representation | Knowledge Discovery in Databases mit Übung)
  10. Informatik (Bachelor of Science)
    (Po-Vers. 2009s | TechFak | Informatik (Bachelor of Science) | Wahlpflichtbereich (5. und 6. Semester) | Wahlpflichtmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  11. Informatik (Bachelor of Science)
    (Po-Vers. 2009w | TechFak | Informatik (Bachelor of Science) | Gesamtkonto | Wahlpflichtbereich (5. und 6. Semester) | Wahlpflichtmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  12. Informatik (Bachelor of Science)
    (Po-Vers. 2022w | TechFak | Informatik (Bachelor of Science) | Gesamtkonto | Wahlpflichtbereich (Wahlpflichtmodule aus mind. 2 Vertiefungsrichtungen) | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  13. Informatik (Master of Science)
    (Po-Vers. 2010 | TechFak | Informatik (Master of Science) | Gesamtkonto | Wahlpflichtbereich | Säule der softwareorientierten Vertiefungsrichtungen | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  14. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2014w | ReWiFak | International Information Systems (IIS) (Master of Science) | Informatics | Informatics Electives | Data Management II | Knowledge Discovery in Databases mit Übung)
  15. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2017w | ReWiFak | International Information Systems (IIS) (Master of Science) | Gesamtkonto | Informatics | Informatics Electives | Data Management II | Knowledge Discovery in Databases mit Übung)
  16. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2018w | ReWiFak | International Information Systems (IIS) (Master of Science) | Informatics | Core courses (Informatics) | Data and knowledge (Informatics - Core) | Knowledge Discovery in Databases mit Übung)
  17. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2018w | ReWiFak | International Information Systems (IIS) (Master of Science) | Informatics | Electives (Informatics) | Data and knowledge (Informatics - Elective) | Knowledge Discovery in Databases mit Übung)
  18. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2021w | ReWiFak | International Information Systems (IIS) (Master of Science) | Gesamtkonto | Informatics | Data and knowledge - Informatics | Knowledge Discovery in Databases mit Übung)
  19. Mathematik (Bachelor of Science)
    (Po-Vers. | NatFak | Mathematik (Bachelor of Science) | Module des Nebenfachs | Nebenfach Informatik | Vertiefungsmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  20. Mathematik (Bachelor of Science)
    (Po-Vers. 2019w | NatFak | Mathematik (Bachelor of Science) | weitere Module der Bachelorprüfung | Module des Nebenfachs | Nebenfach Informatik | Vertiefungsmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)

Studien-/Prüfungsleistungen:

Knowledge Discovery in Databases mit Übung (Prüfungsnummer: 39611)
Prüfungsleistung, Klausur, Dauer (in Minuten): 90, benotet, 5 ECTS
Anteil an der Berechnung der Modulnote: 100.0 %
Prüfungssprache: Englisch

Erstablegung: SS 2022, 1. Wdh.: WS 2022/2023
1. Prüfer: Richard Lenz

UnivIS is a product of Config eG, Buckenhof