Refine
Year of publication
- 2013 (19)
Document Type
- Conference Proceeding (19) (remove)
Language
- German (13)
- English (5)
- Multiple languages (1)
Keywords
- Korpus <Linguistik> (11)
- Lexikographie (8)
- Demotisch (2)
- Deutsch (2)
- Edition (2)
- Griechisch (2)
- Neuägyptisch (2)
- Software (2)
- Ägyptisch (2)
- Altfranzösisch (1)
Has Fulltext
- yes (19) (remove)
Institute
- Akademienvorhaben Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache. Text- und Wissenskultur im alten Ägypten (19) (remove)
Die internationale Tagung „Perspektiven einer corpusbasierten historischen Linguistik und Philologie“ vom 12. – 13. Dezember 2011 am Akademienvorhaben „Altägyptisches Wörterbuch“ der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) war dem Thema des Aufbaus und der Nutzungsperspektiven elektronischer Textcorpora und Wörterbücher in den historischen Sprachen gewidmet. Die Teilnehmer, Vertreter der Ägyptologie, der Hethitologie, Indogermanistik sowie Referenten aus der historischen Lexikographie des Mittel- und Frühneuhochdeutschen und des Altfranzösischen diskutierten vor allem über die Veränderungen, die mit dem Einsatz elektronischer Erfassungs- und Verarbeitungsprozeduren einhergehen.
Das Corpus der Sargtexte wird in seinem Bezug auf die altägyptische Nutzung als auch auf die ägyptologische Abgrenzung betrachtet. Ihr Wortlaut ist über Jahrtausende hinweg überliefert, greift auf die älteren Pyramidentexte zurück und ist in vielfältigen auch neuen Überlieferungskontexten und auf verschiedensten Textträgern überliefert. Die Bedeutung eines Sargtextes oder auch eines Spruches der Sargtexte wird in einer Art Fadenkreuz gesehen. Jeder Spruch besitzt überlieferungsgeschichtlich Wurzeln, die unterschiedlich weit, mitunter sehr weit zurückreichen können, ein Text ist immer aber auch als Produkt der Zeit zu verstehen und somit als ein Einzelmanuskript zu behandeln, das in jeweils neuem Umfeld auftreten kann. Das muss bei der Erschließung und Bereitstellung des Textcorpus mit seinen Mehrfachbezeugungen berücksichtigt werden.
Es werden die Begriffe Textsorte / Textgattung und Diskurstradition erläutert und ihr Nutzen für die Lexikographie diskutiert. Anhand zweier ausgewählter Beispiel werden die lexikalischen Probleme erläutert, die die eindeutige Zuweisung dieser Texte zu Textsorten erschweren. Ebenso ist die Differenzierung nach Diskurstraditionen auf Grund der in der Textlinguistik üblichen Beschreibungssysteme für verschieden Diskursvarietäten am konkreten Text nicht immer eindeutig. Beispiele für Intertextualität und Textsorteninseln werden diskutiert, und es wird für eine verfeinerte Beschreibung der Texte in elektronischer Form plädiert.
Der zentrale Gegenstand dieses Beitrags ist die Frage, wie Themen als grundlegende Aspekte der sprachlichen Verständigung mit dem Wortgebrauch zusammenhängen und wie diese Zusammenhänge - die thematische Prägung des Wortgebrauchs - auch für die lexikographisch-lexikologische Dokumentation des Wortgebrauchs fruchtbar gemacht werden kann. Es wird auf Ergebnisse der Gesprächsforschung, der Textlinguistik und der Diskursforschung zurückgegriffen. Anhand von Beispielen (u.a. aus den Themenbereichen Rassenhygiene, Naturschutz, Sport/Fußball, Hygiene, Technik und Haushalt) werden Vorschläge gemacht, wie man den Themenbezug historischer Kommunikation und die thematische Prägung lexikalischer Mittel auch in lexikographischen Darstellungen stärker verankern kann. Anhand von zwei Textbeispielen wird auch erläutert, wie thematische Schlüsseltexte lexikographisch-lexikologisch genutzt werden können, um historische Systemstellen von Themen und Teilthemen mit den entsprechenden Bereichen im Wortschatz zu füllen.
Der griechisch-ägyptische Sprachkontakt, wie er sich in der Anreicherung des ägyptischen Lexikons im 1. Jahrtausend n. Chr. mit mehr als 4500 griechischen Wörtern der meisten Wortarten und semantischen Felder darstellt, ist einer der am breitesten und dichtesten bezeugten Fälle von intensiver lexikalischer Entlehnung in der Antike. Doch die Erfassung und elementare Aufbereitung der relevanten Sprachdaten, d.h. die Lexikographie griechischer Lehnwörter im Koptischen, scheiterte mehrmals während des 20. Jahrhunderts und ist zu einem kardinalen Desiderat der ägyptischen Wortforschung geworden. Vom 1. April 2010 bis zum 31. März 2012 arbeitete am Ägyptologischen Institut der Universität Leipzig das in der Ausschreibung „Geistes- und Sozialwissenschaftliche Forschung“ des Sächsischen Staatsministeriums für Wissenschaft und Kunst und der Sächsischen Akademie der Wissenschaften zu Leipzig bewilligte Projekt Database and Dictionary of Greek Loanwords in Coptic (DDGLC). In dieser zweijährigen Pilotphase wurde die Möglichkeit getestet, das umfangreiche und in sich reich untergliederte Gesamtcorpus koptischer Texte lehnwortlexikographisch aufzuarbeiten. Dazu wurden in einer Arbeitsdatenbank konzeptuelle und technische Voraussetzungen geschaffen und eine lexikographische Praxis entwickelt und erprobt, die hier in gebotener Kürze vorgestellt werden sollen.
Anhand einer Auswahl von lexikalischen, grammatischen und teils onomastischen Besonderheiten werden die besonderen Schwierigkeiten kursivhieratischer Texte demonstriert. Diese schwer lesbaren und oft vernachlässigten Texte sind besonders bedeutsam für die Erforschung der ägyptischen Sprachgeschichte, da aus der Zeit der kursivhieratischen Texte - also grob zwischen 750 und 550 v.Chr. - nur wenig Material in derselben Sprachstufe, aber anderen Schriftformen (hieroglyphisch, „normalhieratisch“ und demotisch), erhalten ist.
Die demotische Wortliste steht als Liste aller demotischen Wortschreibungen für die Entzifferungsarbeit demotischer Texte zur Verfügung. In einer Präsentation werden die Abfragemöglichkeiten vorgestellt, wobei ein besonderer Schwerpunkt auf der Suche anhand der Graphien der Determinative liegt. Ferner wird die Wortliste um mögliche Wortschreibungen erweitert, die als Resultat von bekannten Lautveränderungen automatisch generiert werden. Damit können bei der philologischen Arbeit verschiedenste Wortformen auf einen Basiseintrag zurückgeführt werden.
Die Vielschichtigkeit der über 4500-jährigen schriftlichen ägyptischen Texttradition mit ineinander greifenden Sprachstufen, niedergelegt in verschiedene Schriftformen, hat einen adäquaten einheitlichen Zugang zum ägyptischen Wortschatz erschwert. Das Ägyptisch-Koptische wurde bisher lexikographisch separat innerhalb von Teildisziplinen erschlossen - für das Hieroglyphisch-Hieratische, für das Demotische und für das Koptische in jeweils eigenen Wörterbüchern. Um einen einheitlichen Zugang zum ägyptisch-koptischen Wortschatz zu schaffen und auch den Sprachwandel dieser Sprache besser abbilden zu können, wird eine integrierte elektronische Wortliste geschaffen, in der Lexeme aus allen Sprachstufen in allen überlieferten Schriftformen verzeichnet und miteinander vernetzt dargestellt werden. Die Schwierigkeiten bei der Abbildung des synchronen und diachronen Wortgebrauchs mit einem damit verbundenen Wechsel in Orthographie und Lautung sowie in Syntax und Semantik werden an ausgewählten Beispielen dargestellt.
Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or constructed for synchronic input text adhering strictly to contemporary orthographic conventions. Unconventional input such as historical text which violates these conventions therefore presents difficulties for any such system due to lexical variants present in the input but missing from the application lexicon. To facilitate the extension of synchronically-oriented natural language processing techniques to historical text while minimizing the need for specialized lexical resources, one may first attempt an automatic canonicalization of the input text. This paper provides an informal overview of the various canonicalization techniques currently employed by the Deutsches Textarchiv project at the Berlin-Brandenburg Academy of Sciences and Humanities to prepare a corpus of historical German text for part-of-speech tagging, lemmatization, and integration into a robust online information retrieval system.
Das Korpus des Deutschen Textarchivs soll als Basis für ein dynamisch erweiterbares historisches Referenzkorpus dienen. Sieben Anforderungen für eine Korpus-Infrastruktur werden benannt, die dazu dienen sollen, Texte in systematischer Weise für die historische Korpusforschung nutzbar zu machen. Dazu gehören ein Textsorteninventar, die Einheitlichkeit der Formate, eine Qualitätssicherung, Übergreifende Abfragbarkeit bei nichtstandardisierten Wortformschreibungen, Nachnutzbarkeit der Texte, offenen Infrastrukturen für die Erweiterung der Textbasis und dynamische Strukturen für Updates und verschiedene Versionen der Datenbasis. Dabei werden auch rechtliche (OpenAccess) und technische (Standardisierung der Formate) Eckpfeiler benannt.