Refine
Year of publication
Document Type
- Article (16)
- Book (8)
- Lecture (8)
- Working Paper (3)
- Other (2)
- Part of a Book (1)
Language
- German (28)
- Spanish (6)
- English (3)
- Multiple languages (1)
Keywords
- Digitalisierung (38) (remove)
Has Fulltext
- yes (38) (remove)
Institute
- Interdisziplinäre Arbeitsgruppe Gegenworte - Hefte für den Disput über Wissen (15)
- Drittmittelprojekt Proyecto Humboldt Digital (6)
- Akademienvorhaben Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm (5)
- Interdisziplinäre Arbeitsgruppe Implikationen der Digitalisierung für die Qualität der Wissenschaftskommunikation (4)
- Interdisziplinäre Arbeitsgruppe Zukunft der Medizin: "Gesundheit für alle" (3)
- Akademienvorhaben Altägyptisches Wörterbuch (1)
- Interdisziplinäre Arbeitsgruppe Wandel der Universitäten und ihres gesellschaftlichen Umfelds: Folgen für die Wissenschaftsfreiheit (1)
- Interdisziplinäre Arbeitsgruppe Zukunft der Arbeit (1)
- Interdisziplinäre Arbeitsgruppe Zukunft des wissenschaftlichen Kommunikationssystems (1)
The FEW is a huge dictionary when we consider the sheer mass of data (25 volumes, 16000 pages) and its exhaustive aims. It has indeed the purpose of registering and etymologizing the whole lexicon, not only of French, but also of earlier stages of the language and of Occitan; of every Gallo-romance dialect; of every technical or professional genre; of every language register, including slang. Summing up, the FEW aims to include and describe every single lexical unit which exists or has existed in the territory of ancient Gaul. The sheer size of this undertaking means two things, which directly influence the digitalisation of the dictionary: Firstly, there is a a huge amount of data; secondly, the presentation and organization of the data is exceedingly complex. The reasons for digitalising the FEW are the easy searches for units, and the carrying out of searches using criteria that are not possible to use with the printed version. However, the fulfillment of these purposes includes some risks, and potentially the cutting of some corners, especially the temptation of renouncing reading.
Der Beitrag geht von einer kritischen Bestandaufnahme digitalisierter Lexikografie der Gegenwart aus. Daran anknüpfend sollen pointierte Thesen bzw. Ideen formuliert werden, die auf Erkenntnisse über das Netzwerk europäischer Nachschlagewerke vergangener Jahrhunderte zurückgreifen. Die Thesen werden in zwei Richtungen entfaltet: In eine europäisch-globale Perspektive und in die Perspektive des Wunsches, Nutzerfreundlichkeit und wissenschaftliche Qualität mit einander zu verbinden.
Among mass digitization methods, double-keying is considered to be the one with the lowest error rate. This method requires two independent transcriptions of a text by two different operators. It is particularly well suited to historical texts, which often exhibit deficiencies like poor master copies or other difficulties such as spelling variation or complex text structures. Providers of data entry services using the double-keying method generally advertise very high accuracy rates (around 99.95% to 99.98%). These advertised percentages are generally estimated on the basis of small samples, and little if anything is said about either the actual amount of text or the text genres which have been proofread, about error types, proofreaders, etc. In order to obtain significant data on this problem it is necessary to analyze a large amount of text representing a balanced sample of different text types, to distinguish the structural XML/TEI level from the typographical level, and to differentiate between various types of errors which may originate from different sources and may not be equally severe. This paper presents an extensive and complex approach to the analysis and correction of double-keying errors which has been applied by the DFG-funded project “Deutsches Textarchiv” (German Text Archive, hereafter DTA) in order to evaluate and preferably to increase the transcription and annotation accuracy of double-keyed DTA texts. Statistical analyses of the results gained from proofreading a large quantity of text are presented, which verify the common accuracy rates for the double-keying method.
Der Klick zum Wissen
(2004)
Die digitale Elite
(2001)
"Papiergeschichte reicht nicht mehr aus" : Gespräch mit Wolfert von Rahden und Christoph Kehl
(2001)
Mein digitaler Traum
(2001)
Der Autor beschäftigt sich mit dem durch Datentechnologien ausgelösten Wandel in den Geisteswissenschaften: In besonderer Weise betrifft dieser Vorgang die philologischen Unternehmen, die mit der Aufnahme, Sicherung, Systematisierung, Erschließung, Analyse und Interpretation vor allem sprachlicher Tatbestände und Überlieferungen befaßt sind. Auf diese Weise kann der Charakter betreffender Fächer erheblich verändert oder ganz aufgelöst werden.