Refine
Document Type
- Conference Proceeding (19)
- Research data (1)
- Working Paper (1)
Language
- German (13)
- English (6)
- Multiple languages (2)
Keywords
- Korpus <Linguistik> (12)
- Lexikographie (8)
- Ägyptisch (3)
- Demotisch (2)
- Deutsch (2)
- Edition (2)
- Griechisch (2)
- Neuägyptisch (2)
- Software (2)
- Altfranzösisch (1)
Has Fulltext
- yes (21)
Institute
- Akademienvorhaben Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache. Text- und Wissenskultur im alten Ägypten (21) (remove)
Die Vielschichtigkeit der über 4500-jährigen schriftlichen ägyptischen Texttradition mit ineinander greifenden Sprachstufen, niedergelegt in verschiedene Schriftformen, hat einen adäquaten einheitlichen Zugang zum ägyptischen Wortschatz erschwert. Das Ägyptisch-Koptische wurde bisher lexikographisch separat innerhalb von Teildisziplinen erschlossen - für das Hieroglyphisch-Hieratische, für das Demotische und für das Koptische in jeweils eigenen Wörterbüchern. Um einen einheitlichen Zugang zum ägyptisch-koptischen Wortschatz zu schaffen und auch den Sprachwandel dieser Sprache besser abbilden zu können, wird eine integrierte elektronische Wortliste geschaffen, in der Lexeme aus allen Sprachstufen in allen überlieferten Schriftformen verzeichnet und miteinander vernetzt dargestellt werden. Die Schwierigkeiten bei der Abbildung des synchronen und diachronen Wortgebrauchs mit einem damit verbundenen Wechsel in Orthographie und Lautung sowie in Syntax und Semantik werden an ausgewählten Beispielen dargestellt.
Berlin Text System 3.1 User Manual : Editorial Software of the Thesaurus Linguae Aegyptiae Project
(2018)
The Berlin Text System (BTS) Version 3.1 manual introduces a Java-based software designed for editing and annotating Ancient Egyptian texts. BTS integrates a CouchDB database and an Elastic search engine to support its main components: Text Editor, Lemma List, Thesaurus, and Abstract Text.
The Text Editor facilitates transliteration, translation, lemmatization, and annotations, allowing for detailed lexical and grammatical analysis. Hieroglyphic transcriptions can be entered via a specialized Hieroglyph Type Writer based on JSesh.
The Lemma List ist ready to contain pre-Coptic lemmata, divided into Hieroglyphic/Hieratic and Demotic scripts, providing comprehensive entries with passport data, transliterations, and translations.
The Thesaurus allows for metadata enrichment of texts with controlled vocabulary for consistent data management, supporting contextual analysis through structured metadata.
The manual covers BTS's user interface, including menu bar, toolbar, status bar, and workspace, divided into views for each main component. Features like Revision History for tracking and restoring versions, indexing, and search capabilities enhance user efficiency. BTS is a powerful tool for the study and preservation of Ancient Egyptian texts, integrating advanced database and search technologies with specialized textual analysis tools.
Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or constructed for synchronic input text adhering strictly to contemporary orthographic conventions. Unconventional input such as historical text which violates these conventions therefore presents difficulties for any such system due to lexical variants present in the input but missing from the application lexicon. To facilitate the extension of synchronically-oriented natural language processing techniques to historical text while minimizing the need for specialized lexical resources, one may first attempt an automatic canonicalization of the input text. This paper provides an informal overview of the various canonicalization techniques currently employed by the Deutsches Textarchiv project at the Berlin-Brandenburg Academy of Sciences and Humanities to prepare a corpus of historical German text for part-of-speech tagging, lemmatization, and integration into a robust online information retrieval system.
Die Schaffung des Bonner Frühneuhhochdeutsch-Referenzcorpus "Frühneuhochdeutsch", das seit 2011 an der Ruhr Universität Bochum in Zusammenarbeit mit der Universitäten Halle und Potsdam geschaffen wird, kann auf zwei zwischen 1972-1985 geschaffenen Bonner Corpora aufbauen: das große Gesamtcorpus, bestehend aus 1500 Texten vom 14.-17. Jahrhundert (aufgebaut 1972-74) und einem elektronischen Teilcorpus, bestehend aus 40 annotierten Texten (aufgebaut 1972-1985). Das elektronische Teilcorpus diente bisher mit seiner Annotation von Flexionsformen in Forschung und Lehre. Datenbestand und Struktur dieses Teilcorpus werden für die Schaffung des neuen Referenzcorpus genutzt, korrigiert, um bisher nicht digitalisierte Texte aus dem Gesamtcorpus erweitert und nach neuen Standards annotiert. Dieses Referenzcorpus des Frühneuhochdeutschen wird als Teil in ein umfassendes Historisches Referenzcorpus des Deutschen einfließen (von den Anfängen der deutschen Überlieferung bis 1800). Es soll für die Forschung zum Frühneuhochdeutschen zur Verfügung stehen. Abgelöst davon soll das alte Bonner Teilcorpus weiterhin zur Nutzung bereit stehen.
Der Thesaurus Linguae Aegyptiae ist eine lexikalische Datenbank ägyptischer Texte. Durch die Verknüpfung einer Textdatenbank mit einem lexikalischen Wort-Thesaurus innerhalb eines modernen Navigationsprogramms sind vielfältige Abfragemöglichkeiten geschaffen worden, die weit über gedruckte Formate von Texteditionen und Wörterbüchern hinausgehen, diese aber nicht ersetzen sollen und können. Der TLA ist ein völlig neuartiges Instrument der Recherche und Forschung, das in diesem Aufsatz beschrieben wird.
Das Corpus der Sargtexte wird in seinem Bezug auf die altägyptische Nutzung als auch auf die ägyptologische Abgrenzung betrachtet. Ihr Wortlaut ist über Jahrtausende hinweg überliefert, greift auf die älteren Pyramidentexte zurück und ist in vielfältigen auch neuen Überlieferungskontexten und auf verschiedensten Textträgern überliefert. Die Bedeutung eines Sargtextes oder auch eines Spruches der Sargtexte wird in einer Art Fadenkreuz gesehen. Jeder Spruch besitzt überlieferungsgeschichtlich Wurzeln, die unterschiedlich weit, mitunter sehr weit zurückreichen können, ein Text ist immer aber auch als Produkt der Zeit zu verstehen und somit als ein Einzelmanuskript zu behandeln, das in jeweils neuem Umfeld auftreten kann. Das muss bei der Erschließung und Bereitstellung des Textcorpus mit seinen Mehrfachbezeugungen berücksichtigt werden.
Die demotische Wortliste steht als Liste aller demotischen Wortschreibungen für die Entzifferungsarbeit demotischer Texte zur Verfügung. In einer Präsentation werden die Abfragemöglichkeiten vorgestellt, wobei ein besonderer Schwerpunkt auf der Suche anhand der Graphien der Determinative liegt. Ferner wird die Wortliste um mögliche Wortschreibungen erweitert, die als Resultat von bekannten Lautveränderungen automatisch generiert werden. Damit können bei der philologischen Arbeit verschiedenste Wortformen auf einen Basiseintrag zurückgeführt werden.