Projekt

Im Projekt GEPARD wurde die Linguistikkomponente für ein sprachverstehendes Dialogsystem weiterentwickelt, sowie die Anpassung an mehrere Domänen vorgenommen. Dazu wurde ein Grammatik-Datenbank-Tool entwickelt, mit dem Lexikoneinträge und Grammatikregeln übersichtlich verwaltet werden können und das zur effizienten Erstellung neuer linguistischer Wissensbasen verwendet wird.
Erweiterungen der linguistischen Abdeckung eines Dialogsystems und damit der syntaktisch-semantischen Grammatik stellen normalerweise langwierige Verfahren für den Endanwender dar. Hauptziel des Projektes Gepard war daher die Entwicklung eines Werkzeuges zum maschinellen Grammatiklernen. Dieses Werkzeug erlaubt dem Benutzer, Grammatiken oder Grammatikerweiterungen zu erstellen, ohne über spezielles computerlinguistisches Fachwissen zu verfügen. Basierend auf der Eingabe einfach syntaktisch und semantisch annotierter Beispielsätze wird automatisch eine Grammatik gelernt, die mit der bereits von einem Experten manuell erstellten gemeinsam verwendet werden kann. Ein weiteres Verfahren ist, dass der Endanwender bei der Eingabe eines neuen, bislang nicht vollständig analysierbaren Satzes eine Auswahl von bereits parsebaren Sätzen angeboten bekommt. Das System stellt geeignete Sätze zur Präsentation aufgrund der i.a. vorhandenen partiellen Analyse des neuen Satzes zusammen. Von diesen wählt er einen Satz aus, der seiner Meinung nach die gleiche oder eine analoge Bedeutung wie der neue Satz hat. Dessen semantische Annotation wird dann ggf. mit vom Endanwender zu bestätigenden Modifikationen für den neuen Satz verwendet. Als besondere Anforderungen an das Lernverfahren gelten dabei das Lernen mit sehr wenigen Eingabedaten und die strikte Beschränkung von Übergenerierung.