Vergleiche und Transformationen für XML-Dokumente - Teil 2: Ein Ansatz zur hierarchischen, adaptiven Kollationierung
- XML-Dokumente Teil 2
- Ein leistungsfähiges Kollationierungsprogramm muss nicht nur mit Gleichheit und Verschiedenheit umgehen können, sondern auch mit Ähnlichkeit. Verbreitete Ähnlichkeitsmaße (edit distances) sind zeichenbasiert. Anknüpfend an die im ersten Teil vorgestellten Verfahren wird ein wortbasiertes Vorgehen vorgeschlagen, das Charakteristika der Texte besser ausnützen kann, weniger Speicher benötigt und besser adaptierbar ist.
Author: | Klaus Praetor |
---|---|
URN: | urn:nbn:de:kobv:b4360-10020 |
URL: | http://edoc.bbaw.de/oa/talks/reVDlvXdCOfC/PDF/29kstnGPLz2IM.pdf |
Document Type: | Other |
Language: | German |
Date of Publication (online): | 2006/07/21 |
Publishing Institution: | Berlin-Brandenburgische Akademie der Wissenschaften |
Release Date: | 2006/07/21 |
Tag: | Editionen; Kollationierung; Logikprogrammierung; XML |
Institutes: | BBAW / Berlin-Brandenburgische Akademie der Wissenschaften |
Dewey Decimal Classification: | 000 Wissenschaft, Allgemeines / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik |