UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 
 Darstellung
 
Druckansicht

 
 
 Außerdem im UnivIS
 
Vorlesungs- und Modulverzeichnis nach Studiengängen

Vorlesungsverzeichnis

 
 
Veranstaltungskalender

Stellenangebote

Möbel-/Rechnerbörse

 
 
Communications and Multimedia Engineering (Master of Science) >>

  Sprach- und Audiosignalverarbeitung (SASP)

Dozent/in
Prof. Dr.-Ing. Walter Kellermann

Angaben
Vorlesung
3 SWS, benoteter Schein, ECTS-Studium, ECTS-Credits: 5
nur Fachstudium, Sprache Englisch
Zeit und Ort: Mo 12:15 - 13:45, H15; Fr 10:15 - 11:45, H15

Studienfächer / Studienrichtungen
WPF EEI-BA-INT 5-6
WPF EEI-MA-INT 1-4
WPF CE-MA-TA-IT 1-4
WPF IuK-MA-ES-EEI 1-4
WPF IuK-MA-KN-EEI 1-4
WPF IuK-MA-MMS-EEI 1-4
WPF IuK-MA-REA-EEI 1-4
WPF IuK-BA 5-6
WPF IuK-MA-ES 1-4
WPF IuK-MA-MMS 1-4
WPF SIM-DH 5-7
WPF SIM-MA 1-4
WPF WING-MA 1-3
PF CME-MA 2
WPF ASC-MA 1-4

Voraussetzungen / Organisatorisches
Signale und Systeme I +II

Inhalt
Die Vorlesung behandelt Grundlagen und Algorithmen der Verarbeitung von Sprach- und Audiosignalen mit Anwendungen in Telekommunikation und Multimedia, insbesondere:
  • Physiologie und Modelle der Spracherzeugung und des Hörens: Quelle-Filter-Modell, Filterbank-Modell der Cochlea; Maskierungseffekte;

  • Darstellung von Sprach- und Audiosignalen: Schätzung und Darstellung der Kurzzeit- und Langzeitstatistik in Zeit-, Frequenz- und Cepstralbereich; typische Beispiele, Visualisierungen;

  • Quellencodierung für Sprache und Audiosignale: Kriterien; skalare und vektorielle Codierung; lineare Prädiktion; Pitchprädiktion; Wellenform-/Parameter-/Hybrid-Codierung; Standards (ITU, GSM, ISO-MPEG)

  • Spracherkennung: Merkmalextraktion, Dynamic Time Warping, Hidden Markov Models

  • Grundprinzipien der Sprachsynthese: Text-to-Speech Systeme, modellbasierte und datenbasierte Synthese, PSOLA-Synthese

  • Signalverbesserung bei Signalaufnahme und –wiedergabe: Geräuschbefreiung, Echokompensation, Enthallung mittels ein- und mehrkanaliger Verfahren;

Empfohlene Literatur
Gemäß themenbezogenen Angaben in der Lehrveranstaltung

ECTS-Informationen:
Title:
Speech and Audio Signal Processing

Credits: 5

Prerequisites
Signals and Systems I + II

Contents
The course concentrates on algorithms for speech and audio signal processing with applications in telecommunications and multimedia, especially
  • Human Speech Production and Hearing: Source-Filter-Model, Filterbank Model of Cochlea; Masking effects;

  • Signal Representation for Speech and Audio: Estimation and representation of short-term and long-term statistics in time domain, frequency domain, and cepstral domain; typical examples and visualisations;

  • Source Coding for Speech and Audio: criteria; scalar and vectorial quantization and coding; linear prediction; pitch prediction; waveform/ parameter/ hybrid coding; standards (ITU, GSM, ISO-MPEG)

  • Fundamental Concepts of Automatic Speech Recognition: Feature extraction, Dynamic Time Warping, Hidden Markov Models

  • Fundamental Concepts of Speech Synthesis: Text-to-Speech systems, modell-based and data-driven synthesis, PSOLA synthesis

  • Signal enhancement for acquisition and reproduction: Noise reduction, echo cancellation, dereverberation using single-channel and multichannel algorithms;

Literature
Recommendations for each topic are given during the lectures

Zusätzliche Informationen
Erwartete Teilnehmerzahl: 38

Zugeordnete Lehrveranstaltungen
UE: Übung zur Sprach- und Audiosignalverarbeitung
Dozent/in: Christian Hümmer, M. Sc.
www: http://www.studon.uni-erlangen.de

Verwendung in folgenden UnivIS-Modulen
Startsemester SS 2017:
Sprach- und Audiosignalverarbeitung (SAV)

Institution: Lehrstuhl für Multimediakommunikation und Signalverarbeitung
UnivIS ist ein Produkt der Config eG, Buckenhof