Retrodigitalisierung von Wörterbüchern mit diskursiver Mikrostruktur : lexikografische und technische Aspekte am Beispiel eines Lehnwörterbuchs [Beitrag zum Workshop Künftige Standards wissenschaftlicher Lexikographie, 25.-27. März 2012, Berlin]
- Vor allem in älteren Wörterbüchern mit philologischer Ausrichtung ist die Mikrostruktur der Artikel häufig diskursiv und unsystematisch. Eine automatisierte Digitalisierung solcher Wörterbücher mit dem Ziel, ihre logische Struktur zu kodieren, ist nicht möglich; in vielen Fällen ist schon ein Parser für ein manuell nachzubearbeitendes Rohdigitalisat kein realistisches Ziel, weil die Angabetypen des Wörterbuchs nicht klar voneinander abgrenzbar und in den Einzelartikeln nicht eindeutig identifizierbar sind. In solchen Fällen wirft auch eine nachträgliche manuelle Formalisierung der Mikrostruktur große lexikografische Probleme auf. Für komplexere Anwendungsszenarien wie etwa Abfragen in Webanwendungen kann es dennoch unumgänglich sein, wenigstens sämtliche relevanten in den Artikeln diskutierten Wortformen mit grundsätzlichen diasystematischen und morphologischen Informationen sowie ihren Relationen zueinander in einem maschinell lesbaren Format strukturiert zu repräsentieren, etwa durch datenzentrierte XML-Dokumente. Der Vortrag versucht, die lexikografischen und technischen Möglichkeiten und Grenzen einer solchen teilweisen und manuellen Retrodigitalisierung am Beispiel von Erfahrungen mit einem älteren Wörterbuch deutscher Lehnwörter im Slovenischen (Striedter-Temps 1963) auszuloten. Das Wörterbuch soll in ein Portal von Lehnwörterbüchern mit Deutsch als gemeinsamer Gebersprache eingebunden werden. Die Einzelartikel werden dem Benutzer als Bilddigitalisate zur Verfügung gestellt; die zusätzliche textuelle Retrodigitalisierung ist jedoch für komplexere, insbesondere auch für wörterbuchübergreifende und portalweite, Suchabfragen erforderlich.
Author: | Peter Meyer |
---|---|
URN: | urn:nbn:de:kobv:b4-opus-23769 |
Document Type: | Lecture |
Language: | German |
Date of Publication (online): | 2013/03/18 |
Publishing Institution: | Berlin-Brandenburgische Akademie der Wissenschaften |
Release Date: | 2013/03/18 |
Tag: | Lehnwörterbuch; Retrodigitalisierung; deutsche Lehnwörter German loans; Slavic languages; retro-digitisation |
GND Keyword: | Digitalisierung; Lehnwort; Computerunterstützte Lexikographie; Slawische Sprachen |
Source: | Beitrag zum Workshop "Künftige Standards wissenschaftlicher Lexikographie": 25.-27. März 2012 - Berlin / Deutschland |
Institutes: | BBAW / Akademienvorhaben Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm |
Dewey Decimal Classification: | 4 Sprache / 40 Sprache / 400 Sprache |
Schriftenreihen in Einzelbeiträgen: | BBAW / Konferenzen, Tagungen, Workshops / Künftige Standards wissenschaftlicher Lexikographie, 25.-27. März 2012, Berlin (Workshop) |