|
Sprach- und Audiosignalverarbeitung (SAV)5 ECTS (englische Bezeichnung: Speech and Audio Signal Processing)
Modulverantwortliche/r: Walter Kellermann Lehrende:
Walter Kellermann, Christian Hümmer
Start semester: |
SS 2014 | Duration: |
1 semester | Cycle: |
jährlich (SS) |
Präsenzzeit: |
60 Std. | Eigenstudium: |
90 Std. | Language: |
Englisch |
Lectures:
-
-
Sprach- und Audiosignalverarbeitung
(Vorlesung, 3 SWS, Walter Kellermann, Mon, 12:15 - 13:45, H15; Tue, 16:15 - 17:45, H15)
-
Übung zur Sprach- und Audiosignalverarbeitung
(Übung, 1 SWS, Christian Hümmer, Thu, 8:15 - 9:45, N 6.13; Thu, 10:15 - 11:45, N 6.13, R4.15; Donnerstagstermin abwechselnd mit der Übung, weitere Informationen sind auf StudOn zu finden)
Inhalt:
Spracherzeugung und Hören beim Menschen
Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte; Darstellung von Sprach- und Audiosignalen
Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen; Quellencodierung für Sprache und Audiosignale
Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG) Spracherkennung
Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models Grundprinzipien der Sprachsynthese
Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese Signalverbesserung bei Signalaufnahme und –wiedergabe
Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren;
Lernziele und Kompetenzen:
Die Studierenden
verstehen die grundlegenden physiologischen Mechanismen der Spracherzeugung und des Hörens beim Menschen und können diese zur Analyse von Sprach- und Audiosignalen anwenden
wenden die grundlegenden Methoden zur Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik von Sprach- und Audiosignalen an und können diese damit analysieren
verstehen die aktuellen Methoden zur Quellencodierung von Sprache-und Audiosignalen und können aktuelle Codierstandards analysieren
verstehen die Grundbausteine von Spracherkennungssystemen und können deren Funktion mittels Rechnersimulation analysieren
verstehen die Grundprinzipien von Text-to-Speech Systemen und können elementare Algorithmen zur Sprachsynthese anwenden
können elementare Algorithmen zur Signalverbesserung anwenden und für reale Daten analysieren
Literatur:
Literaturempfehlung erfolgt in der Vorlesung.
Organisatorisches:
Signale und Systeme I +II
Verwendbarkeit des Moduls / Einpassung in den Musterstudienplan: Das Modul ist im Kontext der folgenden Studienfächer/Vertiefungsrichtungen verwendbar:
- Berufspädagogik Technik (Master of Education)
(Po-Vers. 2010 | Masterprüfung | Wahlpflichtmodule Fachwissenschaft | Speech and Audio Signal Processing)
- Communications and Multimedia Engineering (Master of Science): 2. Semester
(Po-Vers. 2011 | Masterprüfung | Pflichtmodule | Speech and Audio Signal Processing)
- Computational Engineering (Rechnergestütztes Ingenieurwesen) (Master of Science)
(Po-Vers. 2008 | Masterprüfung | Wahlpflichtbereich Technisches Anwendungsfach | Speech and Audio Signal Processing)
- Elektrotechnik, Elektronik und Informationstechnik (Bachelor of Science): 5-6. Semester
(Po-Vers. 2007 | Studienrichtungen (Wahlpflichtmodule) | Studienrichtung Informationstechnik | Vertiefungsmodule Informationstechnik | Speech and Audio Signal Processing)
- Elektrotechnik, Elektronik und Informationstechnik (Bachelor of Science): 5-6. Semester
(Po-Vers. 2009 | Studienrichtungen | Studienrichtung Informationstechnik | Vertiefungsmodule (Wahlpflichtmodule) Informationstechnik | Speech and Audio Signal Processing)
- Elektrotechnik, Elektronik und Informationstechnik (Master of Science): 1-4. Semester
(Po-Vers. 2010 | Studienrichtung Informationstechnik | Vertiefungsmodule Informationstechnik | Speech and Audio Signal Processing)
- Wirtschaftsingenieurwesen (Master of Science): 1-2. Semester
(Po-Vers. 2009 | Ingenieurwissenschaftliche Studienrichtungen | Studienrichtung Informations- und Kommunikationssysteme | Wahlpflicht- und Vertiefungsmodul Modulgruppe 2 | Vertiefungsmodul Modulgruppe 2 | Speech and Audio Signal Processing)
Studien-/Prüfungsleistungen:
Speech and Audio Signal Processing (Prüfungsnummer: 64601)
- Prüfungsleistung, Klausur, Dauer (in Minuten): 90, benotet
- Anteil an der Berechnung der Modulnote: 100.0 %
- Erstablegung: SS 2014, 1. Wdh.: WS 2014/2015
1. Prüfer: | Walter Kellermann |
- Termin: 22.09.2014, 08:00 Uhr, Ort: H 11
Termin: 29.09.2015, 16:00 Uhr, Ort: Mensa-Süd
|
|
|