UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 Lehr-
veranstaltungen
   Personen/
Einrichtungen
   Räume   Forschungs-
bericht
   Publi-
kationen
   Internat.
Kontakte
   Examens-
arbeiten
   Telefon &
E-Mail
 
 
 Darstellung
 
Druckansicht

 
 
Modulbeschreibung (PDF)

 
 
 Außerdem im UnivIS
 
Vorlesungs- und Modulverzeichnis nach Studiengängen

Vorlesungsverzeichnis

 
 
Veranstaltungskalender

Stellenangebote

Möbel-/Rechnerbörse

 
 
Einrichtungen >> Technische Fakultät (TF) >> Department Informatik (INF) >> Lehrstuhl für Informatik 6 (Datenmanagement) >>

Knowledge Discovery in Databases mit Übung (KDDmUe)5 ECTS
(englische Bezeichnung: Knowledge Discovery in Databases with exercise)

Modulverantwortliche/r: Richard Lenz
Lehrende: Dominik Probst, Melanie Bianca Sigl


Startsemester: SS 2022Dauer: 1 SemesterTurnus: jährlich (SS)
Präsenzzeit: 60 Std.Eigenstudium: 90 Std.Sprache:

Lehrveranstaltungen:


Inhalt:

Theoretical knowledge on:

  • Why data mining?

  • What is data mining?

  • A multi-dimensional view of data mining

  • What kinds of data can be mined?

  • What kinds of patterns can be mined?

  • What technologies are used?

  • What kinds of applications are targeted?

  • Major issues in data mining

  • A brief history of data mining

Practical exercises on:

  • Introduction to Pandas & scikit-learn

  • Data analysis & data preprocessing

  • Frequent Pattern

  • Classification

  • Clustering

  • Outlier

Lernziele und Kompetenzen:

Die Studierenden

  • kennen den typischen KDD-Prozess;

  • kennen Verfahren zur Vorbereitung von Daten für das Data Mining;

  • definieren Distanz- oder Ähnlichkeits-Funktionen auf einem speziellen Datenbestand;

  • überprüfen Attribute eines Datensatzes auf ihre Bedeutung für die Analyse hin und transformieren ggf. Attributwerte geeignet;

  • wissen, wie ein typisches Data Warehouse aufgebaut ist;

  • kennen die Definition von Distanz- bzw. Ähnlichkeitsfunktionen für die verschiedenen Typen von Attributen;

  • sind vertraut mit dem Prinzip des Apriori-Algorithmus zur Bestimmung von Mengen häufiger Elemente (frequent itemsets);

  • kennen den FP-Growth-Algorithmus zum schnellen Auffinden von Mengen häufiger Elemente;

  • geben die Definitionen von Support und Confidence für Assoziationsregeln wieder;

  • beschreiben die Ermittlung von Assoziationsregeln auf der Basis von Mengen häufiger Elemente;

  • sind in der Lage, die Vorgehensweise bei Klassifikationsaufgaben darzustellen;

  • legen dar, wie ein Entscheidungsbaum auf einem Trainingsdatensatz erzeugt wird;

  • stellen das Prinzip der Bayes'schen Klassifikation dar;

  • zählen verschiedene Clustering-Verfahren auf;

  • beschreiben den Ablauf von k-Means-Clustering;

  • kennen die verschiedenen Arten von Ausreißern.

  • können die verschiedenen Schritte eines KDD Prozesses auch praktisch anwenden.

The students:

  • know the typical KDD process;

  • know procedures for the preparation of data for data mining;

  • know the definition of distance or similarity functions for the different kinds of attributes;

  • define distance and similarity functions for a particular dataset;

  • check attributes of a dataset for their meaning with reference to an analysis and transform attribute values accordingly, if required.

  • know how a typical data warehouse is structured;

  • are familar with the principle of the Apriori algorithm for the identification of frequent itemsets;

  • know the FP-growth algorithm for a faster identification of frequent itemsets:

  • present the definitions of support and confidence for association rules;

  • describe the construction of association rules based on frequent itemsets;

  • are capable of describing the course of action in classification tasks;

  • present the construction of a decision tree based on a training dataset;

  • present the principle of Bayes' classification;

  • enumerate different clustering procedures;

  • describe the steps of k-means clustering;

  • know the different kinds of outliers.

  • are able to practically apply the various steps of a KDD process.

Literatur:

The lecture is based on the following book:

  • J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques, 3rd. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 2011, ISBN: 0123814790

Also interesting and related textbooks are:

  • A. Géron, Hands-on machine learning with Scikit-Learn and TensorFlow : concepts, tools, and techniques to build intelligent systems, 2nd ed. O’Reilly Media, 2017, ISBN: 978-1491962299

  • H. Du, Data Mining Techniques and Applications: An Introduction. Cengage Learning EMEA, May 2010, p. 336, ISBN: 978-1844808915

  • I. H. Witten, E. Frank, M. A. Hall, et al., Data Mining, Fourth Edition: Practical Machine Learning Tools and Techniques, 4th. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc., 2016, ISBN: 0128042915


Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan:
Das Modul ist im Kontext der folgenden Studienfächer/Vertiefungsrichtungen verwendbar:

  1. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Aufbaumodule | Aufbaumodule Informatik | Knowledge Discovery in Databases mit Übung)
  2. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Wahlpflichtbereich | Wahlpflichtbereich Informatik | Knowledge Discovery in Databases mit Übung)
  3. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Vertiefungsrichtungen | Datenbanken und Wissensrepräsentation (DW) | Knowledge Discovery in Databases mit Übung)
  4. Data Science (Bachelor of Science)
    (Po-Vers. 2020w | Vertiefungsrichtungen | Nicht gewählte Vertiefungsrichtungen | Knowledge Discovery in Databases mit Übung)
  5. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Aufbaumodule | Aufbaumodule Informatik | Knowledge Discovery in Databases mit Übung)
  6. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Wahlpflichtbereich | Wahlpflichtbereich Informatik | Knowledge Discovery in Databases mit Übung)
  7. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Vertiefungsrichtungen | Datenbanken und Wissensrepräsentation (DW) | Knowledge Discovery in Databases mit Übung)
  8. Data Science (Bachelor of Science)
    (Po-Vers. 2022s | Gesamtkonto | Vertiefungsrichtungen | Nicht gewählte Vertiefungsrichtungen | Knowledge Discovery in Databases mit Übung)
  9. Data Science (Master of Science)
    (Po-Vers. 2021w | Gesamtkonto | Studienrichtung Data bases and knowledge representation | Knowledge Discovery in Databases mit Übung)
  10. Informatik (Bachelor of Science)
    (Po-Vers. 2009s | TechFak | Informatik (Bachelor of Science) | Wahlpflichtbereich (5. und 6. Semester) | Wahlpflichtmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  11. Informatik (Bachelor of Science)
    (Po-Vers. 2009w | TechFak | Informatik (Bachelor of Science) | Gesamtkonto | Wahlpflichtbereich (5. und 6. Semester) | Wahlpflichtmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  12. Informatik (Bachelor of Science)
    (Po-Vers. 2022w | TechFak | Informatik (Bachelor of Science) | Gesamtkonto | Wahlpflichtbereich (Wahlpflichtmodule aus mind. 2 Vertiefungsrichtungen) | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  13. Informatik (Master of Science)
    (Po-Vers. 2010 | TechFak | Informatik (Master of Science) | Gesamtkonto | Wahlpflichtbereich | Säule der softwareorientierten Vertiefungsrichtungen | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  14. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2014w | ReWiFak | International Information Systems (IIS) (Master of Science) | Informatics | Informatics Electives | Data Management II | Knowledge Discovery in Databases mit Übung)
  15. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2017w | ReWiFak | International Information Systems (IIS) (Master of Science) | Gesamtkonto | Informatics | Informatics Electives | Data Management II | Knowledge Discovery in Databases mit Übung)
  16. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2018w | ReWiFak | International Information Systems (IIS) (Master of Science) | Informatics | Core courses (Informatics) | Data and knowledge (Informatics - Core) | Knowledge Discovery in Databases mit Übung)
  17. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2018w | ReWiFak | International Information Systems (IIS) (Master of Science) | Informatics | Electives (Informatics) | Data and knowledge (Informatics - Elective) | Knowledge Discovery in Databases mit Übung)
  18. International Information Systems (IIS) (Master of Science)
    (Po-Vers. 2021w | ReWiFak | International Information Systems (IIS) (Master of Science) | Gesamtkonto | Informatics | Data and knowledge - Informatics | Knowledge Discovery in Databases mit Übung)
  19. Mathematik (Bachelor of Science)
    (Po-Vers. | NatFak | Mathematik (Bachelor of Science) | Module des Nebenfachs | Nebenfach Informatik | Vertiefungsmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)
  20. Mathematik (Bachelor of Science)
    (Po-Vers. 2019w | NatFak | Mathematik (Bachelor of Science) | weitere Module der Bachelorprüfung | Module des Nebenfachs | Nebenfach Informatik | Vertiefungsmodule | Vertiefungsrichtung Datenbanksysteme | Knowledge Discovery in Databases mit Übung)

Studien-/Prüfungsleistungen:

Knowledge Discovery in Databases mit Übung (Prüfungsnummer: 39611)
Prüfungsleistung, Klausur, Dauer (in Minuten): 90, benotet, 5 ECTS
Anteil an der Berechnung der Modulnote: 100.0 %
Prüfungssprache: Englisch

Erstablegung: SS 2022, 1. Wdh.: WS 2022/2023
1. Prüfer: Richard Lenz

UnivIS ist ein Produkt der Config eG, Buckenhof