UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 Lehr-
veranstaltungen
   Personen/
Einrichtungen
   Räume   Forschungs-
bericht
   Publi-
kationen
   Internat.
Kontakte
   Examens-
arbeiten
   Telefon &
E-Mail
 
 
 Darstellung
 
Druckansicht

 
 
Modulbeschreibung (PDF)

 
 
 Außerdem im UnivIS
 
Vorlesungs- und Modulverzeichnis nach Studiengängen

Vorlesungsverzeichnis

 
 
Veranstaltungskalender

Stellenangebote

Möbel-/Rechnerbörse

 
 
Einrichtungen >> Technische Fakultät (TF) >> Department Informatik (INF) >> Lehrstuhl für Informatik 6 (Datenmanagement) >>

Datenbanken in Rechnernetzen und Knowledge Discovery in Databases (DBRNKDD)5 ECTS
(englische Bezeichnung: Distributed Databases and Knowledge Discovery in Databases)

Modulverantwortliche/r: Richard Lenz
Lehrende: Richard Lenz


Startsemester: SS 2021Dauer: 1 SemesterTurnus: jährlich (SS)
Präsenzzeit: 60 Std.Eigenstudium: 90 Std.Sprache: Deutsch und Englisch

Lehrveranstaltungen:

    • Datenbanken in Rechnernetzen
      (Vorlesung, Richard Lenz, Do, 16:15 - 17:45; *Aktueller Hinweis*: Diese Veranstaltung findet dieses Semester *online* statt. Weitere Informationen finden Sie im zugehörigen *StudOn-Kurs*. Information regarding online courses are provided via StudOn.)
    • Knowledge Discovery in Databases
      (Vorlesung, 2 SWS, Richard Lenz et al., Di, 8:15 - 9:45, 00.152-113; *Aktueller Hinweis*: Diese Veranstaltung findet dieses Semester *online* statt. Weitere Informationen finden Sie im zugehörigen *StudOn-Kurs*. Information regarding online courses are provided via StudOn.)

Empfohlene Voraussetzungen:

Es wird empfohlen, folgende Module zu absolvieren, bevor dieses Modul belegt wird:

Konzeptionelle Modellierung (WS 2020/2021)
Implementierung von Datenbanksystemen (WS 2020/2021)


Inhalt:

DBRN:
Rechnernetze entsprechen dem momentanen Stand der Technik; isolierte Rechnersysteme nehmen an Zahl und Bedeutung ab. Das Betreiben von Datenbanksystemen in Rechnernetzen erfordert neuartige Konzepte, die über die einer zentralisierten Datenbankverwaltung hinausgehen. In der Vorlesung werden Ansätze zur Datenbankverwaltung in verteilten Systemen vorgestellt. Verteilte Datenbanken, Parallele Datenbanken, DB-Sharing und heterogene Datenbanksysteme werden untersucht. Darüber hinaus widmet sich ein weiteres Hauptkapitel der Vorlesung der Verwendung und dem Betrieb von Datenbanksystemen im Internet.

KDD:
1. Introduction
2. Know Your Data
3. Data Preprocessing
4. Mining Frequent Patterns, Associations and Correlations: Basic Concepts and Methods
5. Advanced Frequent Pattern Mining
6. Classification: Basic Concepts
7. Classification: Advanced Methods
8. Cluster Analysis: Basic Concepts and Methods
9. Cluster Analysis: Advanced Methods
10. Outlier Detection
11. Trends and Research Frontiers in Data Mining

Lernziele und Kompetenzen:

DBRN:
Die Studierenden

  • benennen Ziele verteilter Datenhaltungssysteme;

  • erklären verschiedene Zielkonflikte, insbesondere das CAP-Theorem;

  • unterscheiden verschiedene Varianten verteilter Datenhaltungssysteme;

  • erläutern die Optionen zur Metadatenverwaltung in verteilten Datenbanken;

  • definieren horizontale und vertikale Fragmentierungen für relationale Datenbanken;

  • erklären die Transformationsschritte und Optimierungen der verteilten Anfrageverarbeitung anhand konkreter Beispiele;

  • erklären Algorithmen zur verteilten Ausführung von Verbund-Operationen;

  • erläutern die Problematik der Deadlock-Erkennung bei verteilten Sperrverfahren;

  • unterscheiden die Funktionsweise von Sperrverfahren, Zeitstempelverfahren und Optimistischen Verfahren zur Synchronisation verteilter Transaktionen;

  • benennen und erklären verschiedene Verfahren zur Replikationskontrolle;

  • erläutern Techniken und Verfahren zur Abschwächung der Konsistenzanforderungen an replizierte Datenbestände;

  • erklären die Funktionsweise hochskalierbarer No-SQL Datenbanken am Beispiel der Replikationsmechanismen im Datenbanksystem Cassandra;

  • unterscheiden und erläutern Realisierungsalternativen zur Kopplung und Integration heterogener autonomer Datenbanken;

  • erläutern die erweiterte Schema-Architektur für föderative Datenbanksysteme;

  • erklären die Abbildungsvarianten GaV und LaV für die Implementierung Föderativer Datenbanken.

KDD:
Wissen
Die Studierenden

  • kennen den typischen KDD-Prozess;

  • kennen Verfahren zur Vorbereitung von Daten für das Data Mining;

  • kennen die Definition von Distanz- bzw. Ähnlichkeitsfunktionen für die verschiedenen Typen von Attributen;

  • sind vertraut mit dem Prinzip des Apriori-Algorithmus zur Bestimmung von Mengen häufiger Elemente (frequent itemsets);

  • kennen den FP-Growth-Algorithmus zum schnellen Auffinden von Mengen häufiger Elemente;

  • können die Definitionen von Support und Confidence für Assoziationsregeln wiedergeben;

  • können die Ermittlung von Assoziationsregeln auf der Basis von Mengen häufiger Ele-mente beschreiben;

  • sind in der Lage, die Vorgehensweise bei Klassifikationsaufgaben wiederzugeben;

  • können darlegen, wie ein Entscheidungsbaum auf einem Trainingsdatensatz erzeugt wird;

  • können das Prinzip der Bayes'schen Klassifikation darstellen;

  • können verschiedene Clustering-Verfahren aufzählen;

  • können den Ablauf von k-Means-Clustering beschreiben;

  • kennen die verschiedenen Arten von Ausreißern.

Verstehen
Die Teilnehmer können

  • Distanz- oder Ähnlichkeits-Funktionen auf einem speziellen Datenbestand defi-nieren;

  • Attribute eines Datensatzes auf ihre Bedeutung für die Analyse hin überprüfen und ggf. Attributwerte geeignet transformieren.

Lern- bzw. Methodenkompetenz
Die Studierenden

  • müssen ein hohes Maß an Eigeninitiative zur Aneignung des Stoffes mitbringen und werden darin bestärkt;

  • müssen die englische Sprache so weit beherrschen, dass sie der Vorlesung folgen können;

  • verwenden gezielt ein Lehrbuch zur Vorlesung;

  • bekommen zahlreiche Hinweise auf zugrundeliegende Literatur, die sie bei Bedarf heraussuchen und durcharbeiten müssen.

Selbstkompetenz
Die Teilnehmer

  • müssen ggf. fehlendes Vorwissen selbständig nacharbeiten (falls sie diese Lehrveranstaltung trotzdem wählen);

  • müssen sich selbst die Zeit für die Vor- und Nachbereitung des Stoffs einteilen.

Sozialkompetenz
Die Teilnehmer

  • eignen sich den Stoff in einer Gruppe mit extrem verschiedenen Hintergründen an;

  • brauchen das Gespräch mit anderen Teilnehmern zur Aneignung des Stoffs;

  • müssen sich in der Diskussion auch selbst der englischen Sprache bedienen.

Literatur:

siehe Lehrveranstaltungen


Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan:
Das Modul ist im Kontext der folgenden Studienfächer/Vertiefungsrichtungen verwendbar:

  1. Informatik (Master of Science)
    (Po-Vers. 2010 | TechFak | Informatik (Master of Science) | Gesamtkonto | Wahlpflichtbereich | Säule der softwareorientierten Vertiefungsrichtungen | Vertiefungsrichtung Datenbanksysteme | Datenbanken in Rechnernetzen und Knowledge Discovery in Databases)

Studien-/Prüfungsleistungen:

Datenbanken in Rechnernetzen und Knowledge Discovery in Databases (Prüfungsnummer: 839276)

(englischer Titel: Distributed Databases and Knowledge Discovery in Databases)

Prüfungsleistung, mehrteilige Prüfung, Dauer (in Minuten): 30, benotet, 5 ECTS
Anteil an der Berechnung der Modulnote: 100.0 %
weitere Erläuterungen:
Anteil an der Berechnung der Modulnote: 100.0 %
Prüfungssprache: Deutsch oder Englisch

Erstablegung: SS 2021, 1. Wdh.: WS 2021/2022
1. Prüfer: Richard Lenz
Ort: 08.130 (Martensstraße 3)

UnivIS ist ein Produkt der Config eG, Buckenhof