UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 Lehr-
veranstaltungen
   Personen/
Einrichtungen
   Räume   Forschungs-
bericht
   Publi-
kationen
   Internat.
Kontakte
   Examens-
arbeiten
   Telefon &
E-Mail
 
 
 Darstellung
 
Druckansicht

 
 
Einrichtungen >> Technische Fakultät (TF) >> Department Informatik (INF) >> Lehrstuhl für Informatik 2 (Programmiersysteme) >>
Automatische Analyse natürlicher Sprache

Zwei Problemfelder beim Parsen natürlicher Sprachen sind freie Wortstellung und diskontinuierliche Konstituenten. Freie Wortstellung ist im Deutschen auf Satzebene möglich. "Dieser Mann gab seiner Frau gestern das Buch." erlaubt die freie Wortstellung aller Konstituenten bis auf das Verb "gab", das immer an der zweiten Stelle eines Aussagesatzes steht. Auch diskontinuierliche Konstituenten sind häufig im Deutschen. In "Dieser Mann hat einen Hund gekauft, der beißt." gehört der Relativsatz zum Nomen "Hund", beide werden aber durch das Partizip 2 getrennt.
Die Beschreibung dieser Phänomene mit Hilfe von Grammatiken und Parsern stand bis zum Projektende 02/2006 im Vordergrund der Forschungsarbeiten. Dabei wird an zwei sehr unterschiedlichen Parsertypen gearbeitet, die trotzdem beide die Beschreibung der freien Wortstellung und der diskontinuierlichen Konstituenten zum Ziel haben:
  • Der bereits existierende Parser für Zeichenketten erzeugende Hypergraphgrammatiken wurde für freie Wortstellung erweitert. Die Modellierung diskontinuierliche Konstituenten war mit diesem Parser bereits möglich. Für die freie Wortstellung wurden in Anlehnung an ID/LP Constraints eingeführt. Diese Constraints arbeiten jedoch nicht auf den Symbolen der Grammatik, die in der Hypergraphgrammatik durch Hyperkanten modelliert werden, sondern auf den Knoten zwischen den Hyperkanten. Die Constraints erlauben es, eine (oder keine) Reihenfolge festzulegen, in denen die einzelnen Knoten besucht werden. Der existierende Earley-basierte Parser wurde so erweitert, dass er auch die Contraints verarbeiten kann.

  • Für den Dependenzparser war die Situation umgekehrt. Hier war die Verarbeitung der freien Wortstellung kein Problem. Die Behandlung der diskontinuierlichen Konstituenten wurde 2006 basierend auf der Dissertation von Ricarda Dormeyer implementiert. Als Beispielsprache diente neben dem Deutschen auch Ungarisch, in dem beide Phänomene häufig vorkommen.

Projektleitung:
Prof. em. Dr. Hans Jürgen Schneider

Beteiligte:
Dr. Ingrid Fischer

Laufzeit: 1.1.1999 - 28.2.2006

Kontakt:
Schneider, Hans Jürgen
Telefon +49-9131-85-27620, Fax +49-9131-85-28809, E-Mail: hans.juergen.schneider@fau.de
UnivIS ist ein Produkt der Config eG, Buckenhof