Vergleiche und Transformationen für XML-Dokumente - Teil 2: Ein Ansatz zur hierarchischen, adaptiven Kollationierung
- XML-Dokumente Teil 2
- Ein leistungsfähiges Kollationierungsprogramm muss nicht nur mit Gleichheit und Verschiedenheit umgehen können, sondern auch mit Ähnlichkeit. Verbreitete Ähnlichkeitsmaße (edit distances) sind zeichenbasiert. Anknüpfend an die im ersten Teil vorgestellten Verfahren wird ein wortbasiertes Vorgehen vorgeschlagen, das Charakteristika der Texte besser ausnützen kann, weniger Speicher benötigt und besser adaptierbar ist.
Verfasserangaben: | Klaus Praetor |
---|---|
URN: | urn:nbn:de:kobv:b4360-10020 |
URL: | http://edoc.bbaw.de/oa/talks/reVDlvXdCOfC/PDF/29kstnGPLz2IM.pdf |
Dokumentart: | Sonstiges |
Sprache: | Deutsch |
Datum der Veröffentlichung (online): | 21.07.2006 |
Veröffentlichende Institution: | Berlin-Brandenburgische Akademie der Wissenschaften |
Datum der Freischaltung: | 21.07.2006 |
Freies Schlagwort / Tag: | Editionen; Kollationierung; Logikprogrammierung; XML |
Institute: | BBAW / Berlin-Brandenburgische Akademie der Wissenschaften |
DDC-Klassifikation: | 000 Wissenschaft, Allgemeines / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik |