OPUS 4 | Search

Kursivhieratische Texte aus sprachlicher und onomastischer Sicht (2013)

Anhand einer Auswahl von lexikalischen, grammatischen und teils onomastischen Besonderheiten werden die besonderen Schwierigkeiten kursivhieratischer Texte demonstriert. Diese schwer lesbaren und oft vernachlässigten Texte sind besonders bedeutsam für die Erforschung der ägyptischen Sprachgeschichte, da aus der Zeit der kursivhieratischen Texte - also grob zwischen 750 und 550 v.Chr. - nur wenig Material in derselben Sprachstufe, aber anderen Schriftformen (hieroglyphisch, „normalhieratisch“ und demotisch), erhalten ist.

Die Demotische Wortliste – virtuell erweitert (2013)

Hoffmann, Friedhelm

Die demotische Wortliste steht als Liste aller demotischen Wortschreibungen für die Entzifferungsarbeit demotischer Texte zur Verfügung. In einer Präsentation werden die Abfragemöglichkeiten vorgestellt, wobei ein besonderer Schwerpunkt auf der Suche anhand der Graphien der Determinative liegt. Ferner wird die Wortliste um mögliche Wortschreibungen erweitert, die als Resultat von bekannten Lautveränderungen automatisch generiert werden. Damit können bei der philologischen Arbeit verschiedenste Wortformen auf einen Basiseintrag zurückgeführt werden.

Auf dem Weg zu einem integrierten Lexikon des Ägyptisch-Koptischen (2013)

Feder, Frank ; Schweitzer, Simon D.

Die Vielschichtigkeit der über 4500-jährigen schriftlichen ägyptischen Texttradition mit ineinander greifenden Sprachstufen, niedergelegt in verschiedene Schriftformen, hat einen adäquaten einheitlichen Zugang zum ägyptischen Wortschatz erschwert. Das Ägyptisch-Koptische wurde bisher lexikographisch separat innerhalb von Teildisziplinen erschlossen - für das Hieroglyphisch-Hieratische, für das Demotische und für das Koptische in jeweils eigenen Wörterbüchern. Um einen einheitlichen Zugang zum ägyptisch-koptischen Wortschatz zu schaffen und auch den Sprachwandel dieser Sprache besser abbilden zu können, wird eine integrierte elektronische Wortliste geschaffen, in der Lexeme aus allen Sprachstufen in allen überlieferten Schriftformen verzeichnet und miteinander vernetzt dargestellt werden. Die Schwierigkeiten bei der Abbildung des synchronen und diachronen Wortgebrauchs mit einem damit verbundenen Wechsel in Orthographie und Lautung sowie in Syntax und Semantik werden an ausgewählten Beispielen dargestellt.

Canonicalizing the Deutsches Textarchiv (2013)

Jurish, Bryan

Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or constructed for synchronic input text adhering strictly to contemporary orthographic conventions. Unconventional input such as historical text which violates these conventions therefore presents difficulties for any such system due to lexical variants present in the input but missing from the application lexicon. To facilitate the extension of synchronically-oriented natural language processing techniques to historical text while minimizing the need for specialized lexical resources, one may first attempt an automatic canonicalization of the input text. This paper provides an informal overview of the various canonicalization techniques currently employed by the Deutsches Textarchiv project at the Berlin-Brandenburg Academy of Sciences and Humanities to prepare a corpus of historical German text for part-of-speech tagging, lemmatization, and integration into a robust online information retrieval system.

Wege zu einem historischen Referenzkorpus des Deutschen : das Projekt Deutsches Textarchiv (2013)

Geyken, Alexander

Das Korpus des Deutschen Textarchivs soll als Basis für ein dynamisch erweiterbares historisches Referenzkorpus dienen. Sieben Anforderungen für eine Korpus-Infrastruktur werden benannt, die dazu dienen sollen, Texte in systematischer Weise für die historische Korpusforschung nutzbar zu machen. Dazu gehören ein Textsorteninventar, die Einheitlichkeit der Formate, eine Qualitätssicherung, Übergreifende Abfragbarkeit bei nichtstandardisierten Wortformschreibungen, Nachnutzbarkeit der Texte, offenen Infrastrukturen für die Erweiterung der Textbasis und dynamische Strukturen für Updates und verschiedene Versionen der Datenbasis. Dabei werden auch rechtliche (OpenAccess) und technische (Standardisierung der Formate) Eckpfeiler benannt.

Das Bonner Frühneuhochdeutsch-Korpus und das Referenzkorpus ‚Frühneuhochdeutsch‘ (2013)

Schmitz, Hans-Christian ; Schröder, Bernhard ; Wegera, Klaus-Peter

Die Schaffung des Bonner Frühneuhhochdeutsch-Referenzcorpus "Frühneuhochdeutsch", das seit 2011 an der Ruhr Universität Bochum in Zusammenarbeit mit der Universitäten Halle und Potsdam geschaffen wird, kann auf zwei zwischen 1972-1985 geschaffenen Bonner Corpora aufbauen: das große Gesamtcorpus, bestehend aus 1500 Texten vom 14.-17. Jahrhundert (aufgebaut 1972-74) und einem elektronischen Teilcorpus, bestehend aus 40 annotierten Texten (aufgebaut 1972-1985). Das elektronische Teilcorpus diente bisher mit seiner Annotation von Flexionsformen in Forschung und Lehre. Datenbestand und Struktur dieses Teilcorpus werden für die Schaffung des neuen Referenzcorpus genutzt, korrigiert, um bisher nicht digitalisierte Texte aus dem Gesamtcorpus erweitert und nach neuen Standards annotiert. Dieses Referenzcorpus des Frühneuhochdeutschen wird als Teil in ein umfassendes Historisches Referenzcorpus des Deutschen einfließen (von den Anfängen der deutschen Überlieferung bis 1800). Es soll für die Forschung zum Frühneuhochdeutschen zur Verfügung stehen. Abgelöst davon soll das alte Bonner Teilcorpus weiterhin zur Nutzung bereit stehen.

Die Doppelfunktion des digitalen Textarchivs als Wörterbuchbasis und als Komponente der Online-Publikation : Am Beispiel des Mittelhochdeutschen Wörterbuchs (2013)

Gärtner, Kurt ; Plate, Ralf

Auf dem Hintergrund des umfassenden EDV-Einsatzes, der die vorbereitende Materialbereitstellung seit 1986 (Findebuch zum mittelhochdeutschen Wortschatz) bzw. 1994 (für das neue Mittelhochdeutsche Wörterbuch selbst) ebenso wie die Ausarbeitung und Publikation des neuen Mittelhochdeutschen Wörterbuchs seit 2006 kennzeichnet, beleuchtet der Beitrag den Gewinn von digitalen Textcorpora für Macher und Nutzer von historischen Belegwörterbüchern: Den Lexikographen verschafft ein umfangreiches digitales Textarchiv und daraus durch halbautomatische Lemmatisierung gewonnenes Belegarchiv, das in einem Redaktionssystem für die Artikelarbeit bereitgestellt wird, größere und leichtere Übersicht über den historischen Sprachgebrauch und entlastet sie von zeitraubenden Exzerptions- und Korrekturarbeiten; den Wörterbuchbenutzern wird es durch die Verknüpfung der Belegzitate bzw. Belegstellenangaben mit den digitalisierten und im Online-Angebot zur Verfügung gestellten Volltexten der Wörterbuchquellen ermöglicht, den Quellenbezug der lexikographischen Befunde zu rekontextualisieren. Aus der Erfahrung eines Vierteljahrhunderts der Vorbereitung und Ausarbeitung eines großen digitalen Belegwörterbuchs werben die Autoren für die Bereitstellung von umfassenden digitalisierten Textcorpora (einschließlich der Retrodigitaliserung der älteren lexikographischen Hilfsmittel) für die historische Sprachforschung selbst wie für die Nutzer ihrer Forschungsergebnisse. Eine umfassende Textdigitalisierung von historischen Sprachquellen des Deutschen steckt aber leider (im Gegensatz zur Bilddigitalisierung von Handschriften und gedruckten Büchern) trotz großer Anstrengungen und überzeugender Ergebnisse in einzelnen Vorhaben immer noch in den Anfängen oder wird zum Teil unter zu engen Gesichtspunkten betrieben.

The TITUS Project : 25 years of corpus building in ancient languages (2013)

Gippert, Jost

The article summarizes the contents and the structurtal premises of the “Thesaurus Indogermanischer Text- und Sprachmaterialien” (TITUS), focussing on search functions and facilities and questions of the encoding of ancient languages written in various scripts. Examples are taken from Tocharian, Greek, Vedic Sanskrit, and other ancient Indo-European languages covered by TITUS.

Das Hethitologie Portal Mainz (2013)

Wilhelm, Gernot

In diesem Aufsatz wird das Hethitologie Portal Mainz mit seinen Dienstleistungsschwerpunkten (1) "Konkordanz hethitischer Texte", (2) "Digitales Photoarchiv" und (3) "Digitale Edition von Keilschrifttexten der Hethiter" vorgestellt.

Zur Arbeit an der Demotischen Textdatenbank : Textauswahl (2013)

Vittmann, Günter

Die "Datenbank demotischer Texte" veröffentlicht ein demotisches Textcorpus im Thesaurus Linguae Aegyptiae. Der vorliegende Aufsatz beschreibt die Prinzipien der Textauswahl für die Datenbank und die damit verbundenen Probleme.

Der Thesaurus Linguae Aegyptiae – Konzepte und Perspektiven (2013)

Hafemann, Ingelore ; Dils, Peter

Der Thesaurus Linguae Aegyptiae ist eine lexikalische Datenbank ägyptischer Texte. Durch die Verknüpfung einer Textdatenbank mit einem lexikalischen Wort-Thesaurus innerhalb eines modernen Navigationsprogramms sind vielfältige Abfragemöglichkeiten geschaffen worden, die weit über gedruckte Formate von Texteditionen und Wörterbüchern hinausgehen, diese aber nicht ersetzen sollen und können. Der TLA ist ein völlig neuartiges Instrument der Recherche und Forschung, das in diesem Aufsatz beschrieben wird.

Das Edfu-Projekt : Ziel, Methode und Verarbeitung der lexikographischen Ergebnisse (2013)

Kurth, Dieter

Geschichte, Ziele und Methoden des Edfu-Projektes werden vorgestellt, und seine Bedeutung für die lexikographische Arbeit in der Ägyptologie wird herausgestellt.

The Ramses project in perspective : Managing evolving linguistic data (2013)

Rosmorduc, Serge

As the initial phase of development of Ramsès is almost done, with a working prototype of a syntactic editor, we have started to think about ways of improving the encoding process, and securing our data consistency. This paper explains the current state of our ideas on the subject.

The Ramses project : Methodology and practices in the annotation of Late Egyptian Texts (2013)

Polis, Stéphane ; Winand, Jean

This paper is an updated presentation of the Ramses project being currently developed at the University of Liège. The first section stresses the main objectives and gives a technical description of the general architecture of Ramses software. The second part describes the encoding procedures and reviews the current state of the annotation. In the third section, some changes brought about by the use of large-scale corpora are discussed from an epistemological viewpoint. The paper ends with the presentation of some new avenues for research that will ensue from the use of a complex multilevel corpus.

Global Editions and the Dialogue among Civilizations (2013)

Crane, Gregory ; Babeu, Alison

This paper is about the reinvention of editing source texts from the human record. Editing may be largely a technical, frequently a tedious, and almost always an underappreciated task, but editing can have profound effects upon the world.

Normdaten, Schnittstellen und RDF als Grundlage für die Vernetzung bibliographischer Fachinformationen [Beitrag zum Workshop "Die geschichtswissenschaftliche Fachbibliographie der Zukunft – moderne Informationsdienstleistungen für Historiker", Historisches Kolleg, München, 08.-09.04.2013] (2013)

Burckhardt, Daniel ; Meyer, Thomas

[Autorenverzeichnis] / Gegenworte 29 (2013)

Skandalöse Orte (in München und Wien) (2013)

Niemann, Fritz

Nun auch: Skandalisierung der Wissenschaft (2013)

Weingart, Peter

Plagiate in der Wissenschaft (2013)

Markschies, Christoph