ZZ: Grammatikentwicklung und Parsing für Dialogsysteme (GEPARD) Im Projekt GEPARD wurde die Linguistikkomponente für ein
sprachverstehendes Dialogsystem weiterentwickelt, sowie die Anpassung an mehrere Domänen vorgenommen. Dazu wurde ein
Grammatik-Datenbank-Tool entwickelt, mit dem Lexikoneinträge und Grammatikregeln übersichtlich verwaltet werden können und das zur effizienten Erstellung neuer linguistischer Wissensbasen verwendet wird.
Erweiterungen der linguistischen Abdeckung eines Dialogsystems und damit der syntaktisch-semantischen Grammatik stellen normalerweise langwierige Verfahren für den Endanwender dar. Hauptziel des Projektes Gepard war daher die Entwicklung eines Werkzeuges zum maschinellen Grammatiklernen. Dieses Werkzeug erlaubt dem Benutzer, Grammatiken oder Grammatikerweiterungen zu erstellen, ohne über spezielles computerlinguistisches Fachwissen zu verfügen. Basierend auf der Eingabe einfach syntaktisch und semantisch annotierter Beispielsätze wird automatisch eine Grammatik gelernt, die mit der bereits von einem Experten manuell erstellten gemeinsam verwendet werden kann. Ein
weiteres Verfahren ist, dass der Endanwender bei der Eingabe eines neuen, bislang nicht vollständig analysierbaren Satzes eine Auswahl von bereits parsebaren Sätzen angeboten bekommt. Das System stellt geeignete Sätze zur Präsentation aufgrund der i.a. vorhandenen partiellen Analyse des neuen Satzes zusammen. Von diesen wählt er einen Satz aus, der seiner Meinung nach die gleiche oder eine analoge Bedeutung wie der neue Satz hat. Dessen semantische Annotation wird
dann ggf. mit vom Endanwender zu bestätigenden Modifikationen für den neuen Satz verwendet. Als besondere Anforderungen an das Lernverfahren gelten dabei das Lernen mit sehr wenigen Eingabedaten und die strikte Beschränkung von Übergenerierung. | Projektleitung: Prof. Dr.-Ing. Günther Görz, Prof. em. Dr.-Ing. Dr.-Ing. h.c. Heinrich Niemann
Beteiligte: Dipl.-Inf. Bernd Geistert, Dr.-Ing. Ute Ehrlich, Barbara Müller, M.A., Dr.-Ing. Manuela Boros
Stichwörter: Sprachverstehende Dialogsysteme; Linguistische Wissensbasen; Maschinelles Grammatiklernen
Laufzeit: 1.8.1996 - 29.2.2000
Förderer: Daimler-Chrysler AG, Abteilung Forschung und Technik, Sprachverstehende Systeme (F3S), Ulm
| Publikationen |
---|
Boros, Manuela ; Ehrlich, Ute ; Geistert, Bernd: "LREC98: Administration of large grammar resources - design and implementation of a 'Grammar Pool'". In: - (Veranst.) : - (First International Conference on Language Resources and Evaluation Granada 28-30 May 1998). 1998, S. 1-2. | Ehrlich, Ute ; Geistert, Bernd: Learning Feature-Based Phrase-Structure-Rules with the Grammar Inference Tool. In: Basili, Robert ; Pazienza, Maria Teresa (Hrsg.) : Technische Universität Chemnitz, Fakultät für Informatik (Veranst.) : TANLPS Towards adaptive NLP-driven systems: linguistic information, learning methods and applications (Proceedings of the ECML'98 Workshop Chemnitz). 1998, S. 53-61. |
|