Refine
Year of publication
- 2013 (138) (remove)
Document Type
- Article (67)
- Conference Proceeding (20)
- Part of a Book (14)
- Lecture (9)
- Other (9)
- Working Paper (6)
- Book (4)
- Part of Periodical (3)
- Preprint (3)
- Report (2)
Language
- German (124)
- English (11)
- Multiple languages (3)
Keywords
- Europäische Union (26)
- Wissenschaft (21)
- Vertrauen (15)
- Korpus <Linguistik> (13)
- Wissenschaftsorganisation (11)
- Information und Dokumentation (8)
- Lexikographie (8)
- Deutschland (7)
- Bibliographie (6)
- Geschichtswissenschaft (5)
Has Fulltext
- yes (138)
Institute
- Interdisziplinäre Arbeitsgruppe Gegenworte - Hefte für den Disput über Wissen (51)
- Berlin-Brandenburgische Akademie der Wissenschaften (30)
- Akademienvorhaben Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache. Text- und Wissenskultur im alten Ägypten (19)
- Akademienvorhaben Census of Antique Works of Art and Architecture Known in the Renaissance (8)
- Akademienvorhaben Jahresberichte für deutsche Geschichte (8)
- Akademienvorhaben Schleiermacher in Berlin 1808-1834, Briefwechsel, Tageskalender, Vorlesungen (4)
- Drittmittelprojekt Ökosystemleistungen (4)
- Interdisziplinäre Arbeitsgruppe Exzellenzinitiative (3)
- Veröffentlichungen von Akademiemitarbeitern (3)
- Interdisziplinäre Arbeitsgruppe Gentechnologiebericht (2)
Among mass digitization methods, double-keying is considered to be the one with the lowest error rate. This method requires two independent transcriptions of a text by two different operators. It is particularly well suited to historical texts, which often exhibit deficiencies like poor master copies or other difficulties such as spelling variation or complex text structures. Providers of data entry services using the double-keying method generally advertise very high accuracy rates (around 99.95% to 99.98%). These advertised percentages are generally estimated on the basis of small samples, and little if anything is said about either the actual amount of text or the text genres which have been proofread, about error types, proofreaders, etc. In order to obtain significant data on this problem it is necessary to analyze a large amount of text representing a balanced sample of different text types, to distinguish the structural XML/TEI level from the typographical level, and to differentiate between various types of errors which may originate from different sources and may not be equally severe. This paper presents an extensive and complex approach to the analysis and correction of double-keying errors which has been applied by the DFG-funded project “Deutsches Textarchiv” (German Text Archive, hereafter DTA) in order to evaluate and preferably to increase the transcription and annotation accuracy of double-keyed DTA texts. Statistical analyses of the results gained from proofreading a large quantity of text are presented, which verify the common accuracy rates for the double-keying method.
Die internationale Tagung „Perspektiven einer corpusbasierten historischen Linguistik und Philologie“ vom 12. – 13. Dezember 2011 am Akademienvorhaben „Altägyptisches Wörterbuch“ der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) war dem Thema des Aufbaus und der Nutzungsperspektiven elektronischer Textcorpora und Wörterbücher in den historischen Sprachen gewidmet. Die Teilnehmer, Vertreter der Ägyptologie, der Hethitologie, Indogermanistik sowie Referenten aus der historischen Lexikographie des Mittel- und Frühneuhochdeutschen und des Altfranzösischen diskutierten vor allem über die Veränderungen, die mit dem Einsatz elektronischer Erfassungs- und Verarbeitungsprozeduren einhergehen.