UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
XWeb

Das Internet bietet eine riesige Menge an Information. In erster Linie ist diese Information in einem für Menschen lesbaren Format dargestellt. Allerdings spricht vieles dafür, diese riesige Datenquelle auch in Anwendungsprogramme zu integrieren, z.B. um die Daten mit denen aus anderen Quellen oder Erfahrungswerten zu vergleichen. Die Extraktion der Information aus den einzelnen Webseiten ist allerdings nicht trivial, weil Strukturen und Darstellungen, die das menschliche Auge leicht erfasst, teils auf sehr kompliziertem HTML-Code basieren. Die Extraktion von Daten aus einer Webseite wird in der Regel von sogenannten Wrappern übernommen, die mit der Seite kommunizieren, die relevante Information identifizieren und in ein für die weiterverarbeitende Applikation geeignetes Datenformat transformieren. XWeb (eXtract WEBsites) ist ein Wrapper-Rahmenwerk, das exklusiv auf offenen Standards wie XML und XSLT beruht. Dieses Vorgehen bietet zwei Vorteile: Zum einen kann die vollständige Ausdrucksmächtigkeit von XSLT für den Extraktionsprozess ausgenutzt werden, und zweitens ist keine zusätzliche Abfragesprache erforderlich.
Projektleitung:
Dr.-Ing. Wolfgang Hümmer

Beteiligte:
Lukaszyk, Jürgen

Stichwörter:
Wrapper-Rahmenwerk, XML

Laufzeit: 1.1.2000 - 31.12.2001

Publikationen
Hümmer, Wolfgang ; Lukasczyk, J.: Server Side Website Wrapping - the XWeg Approach. In: Zohra Bellahsène (Hrsg.) : Data Integration over the Web (DIWeb) (Data Integration over the Web (DIWeb), 1st International Workshop at CAiSE*01 Interlaken, Schweiz 04.06.2001). 2001, S. 100-113.
UnivIS ist ein Produkt der Config eG, Buckenhof