OPUS 4 | Search

Das Hethitologie Portal Mainz (2013)

In diesem Aufsatz wird das Hethitologie Portal Mainz mit seinen Dienstleistungsschwerpunkten (1) "Konkordanz hethitischer Texte", (2) "Digitales Photoarchiv" und (3) "Digitale Edition von Keilschrifttexten der Hethiter" vorgestellt.

Zur Arbeit an der Demotischen Textdatenbank : Textauswahl (2013)

Vittmann, Günter

Die "Datenbank demotischer Texte" veröffentlicht ein demotisches Textcorpus im Thesaurus Linguae Aegyptiae. Der vorliegende Aufsatz beschreibt die Prinzipien der Textauswahl für die Datenbank und die damit verbundenen Probleme.

Kursivhieratische Texte aus sprachlicher und onomastischer Sicht (2013)

Vittmann, Günter

Anhand einer Auswahl von lexikalischen, grammatischen und teils onomastischen Besonderheiten werden die besonderen Schwierigkeiten kursivhieratischer Texte demonstriert. Diese schwer lesbaren und oft vernachlässigten Texte sind besonders bedeutsam für die Erforschung der ägyptischen Sprachgeschichte, da aus der Zeit der kursivhieratischen Texte - also grob zwischen 750 und 550 v.Chr. - nur wenig Material in derselben Sprachstufe, aber anderen Schriftformen (hieroglyphisch, „normalhieratisch“ und demotisch), erhalten ist.

Überlegungen zu Textsorte und Diskurstradition bei der Beschreibung von Textcorpora und ihr Bezug zur lexikographischen Forschung (2013)

Städtler, Thomas

Es werden die Begriffe Textsorte / Textgattung und Diskurstradition erläutert und ihr Nutzen für die Lexikographie diskutiert. Anhand zweier ausgewählter Beispiel werden die lexikalischen Probleme erläutert, die die eindeutige Zuweisung dieser Texte zu Textsorten erschweren. Ebenso ist die Differenzierung nach Diskurstraditionen auf Grund der in der Textlinguistik üblichen Beschreibungssysteme für verschieden Diskursvarietäten am konkreten Text nicht immer eindeutig. Beispiele für Intertextualität und Textsorteninseln werden diskutiert, und es wird für eine verfeinerte Beschreibung der Texte in elektronischer Form plädiert.

Das Bonner Frühneuhochdeutsch-Korpus und das Referenzkorpus ‚Frühneuhochdeutsch‘ (2013)

Schmitz, Hans-Christian ; Schröder, Bernhard ; Wegera, Klaus-Peter

Die Schaffung des Bonner Frühneuhhochdeutsch-Referenzcorpus "Frühneuhochdeutsch", das seit 2011 an der Ruhr Universität Bochum in Zusammenarbeit mit der Universitäten Halle und Potsdam geschaffen wird, kann auf zwei zwischen 1972-1985 geschaffenen Bonner Corpora aufbauen: das große Gesamtcorpus, bestehend aus 1500 Texten vom 14.-17. Jahrhundert (aufgebaut 1972-74) und einem elektronischen Teilcorpus, bestehend aus 40 annotierten Texten (aufgebaut 1972-1985). Das elektronische Teilcorpus diente bisher mit seiner Annotation von Flexionsformen in Forschung und Lehre. Datenbestand und Struktur dieses Teilcorpus werden für die Schaffung des neuen Referenzcorpus genutzt, korrigiert, um bisher nicht digitalisierte Texte aus dem Gesamtcorpus erweitert und nach neuen Standards annotiert. Dieses Referenzcorpus des Frühneuhochdeutschen wird als Teil in ein umfassendes Historisches Referenzcorpus des Deutschen einfließen (von den Anfängen der deutschen Überlieferung bis 1800). Es soll für die Forschung zum Frühneuhochdeutschen zur Verfügung stehen. Abgelöst davon soll das alte Bonner Teilcorpus weiterhin zur Nutzung bereit stehen.

The Ramses project in perspective : Managing evolving linguistic data (2013)

Rosmorduc, Serge

As the initial phase of development of Ramsès is almost done, with a working prototype of a syntactic editor, we have started to think about ways of improving the encoding process, and securing our data consistency. This paper explains the current state of our ideas on the subject.

The Ramses project : Methodology and practices in the annotation of Late Egyptian Texts (2013)

Polis, Stéphane ; Winand, Jean

This paper is an updated presentation of the Ramses project being currently developed at the University of Liège. The first section stresses the main objectives and gives a technical description of the general architecture of Ramses software. The second part describes the encoding procedures and reviews the current state of the annotation. In the third section, some changes brought about by the use of large-scale corpora are discussed from an epistemological viewpoint. The paper ends with the presentation of some new avenues for research that will ensue from the use of a complex multilevel corpus.

Das Edfu-Projekt : Ziel, Methode und Verarbeitung der lexikographischen Ergebnisse (2013)

Kurth, Dieter

Geschichte, Ziele und Methoden des Edfu-Projektes werden vorgestellt, und seine Bedeutung für die lexikographische Arbeit in der Ägyptologie wird herausgestellt.

Berlin Text System 3.1 User Manual : Editorial Software of the Thesaurus Linguae Aegyptiae Project (2018)

Kupreyev, Maxim ; Sperveslage, Gunnar

The Berlin Text System (BTS) Version 3.1 manual introduces a Java-based software designed for editing and annotating Ancient Egyptian texts. BTS integrates a CouchDB database and an Elastic search engine to support its main components: Text Editor, Lemma List, Thesaurus, and Abstract Text. The Text Editor facilitates transliteration, translation, lemmatization, and annotations, allowing for detailed lexical and grammatical analysis. Hieroglyphic transcriptions can be entered via a specialized Hieroglyph Type Writer based on JSesh. The Lemma List ist ready to contain pre-Coptic lemmata, divided into Hieroglyphic/Hieratic and Demotic scripts, providing comprehensive entries with passport data, transliterations, and translations. The Thesaurus allows for metadata enrichment of texts with controlled vocabulary for consistent data management, supporting contextual analysis through structured metadata. The manual covers BTS's user interface, including menu bar, toolbar, status bar, and workspace, divided into views for each main component. Features like Revision History for tracking and restoring versions, indexing, and search capabilities enhance user efficiency. BTS is a powerful tool for the study and preservation of Ancient Egyptian texts, integrating advanced database and search technologies with specialized textual analysis tools.

Canonicalizing the Deutsches Textarchiv (2013)

Jurish, Bryan

Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or constructed for synchronic input text adhering strictly to contemporary orthographic conventions. Unconventional input such as historical text which violates these conventions therefore presents difficulties for any such system due to lexical variants present in the input but missing from the application lexicon. To facilitate the extension of synchronically-oriented natural language processing techniques to historical text while minimizing the need for specialized lexical resources, one may first attempt an automatic canonicalization of the input text. This paper provides an informal overview of the various canonicalization techniques currently employed by the Deutsches Textarchiv project at the Berlin-Brandenburg Academy of Sciences and Humanities to prepare a corpus of historical German text for part-of-speech tagging, lemmatization, and integration into a robust online information retrieval system.

Open Access

Refine

Author

Year of publication

Document Type

Language

Keywords

Has Fulltext

Institute

21 search hits