Refine
Year of publication
Document Type
- Article (16)
- Book (8)
- Lecture (8)
- Working Paper (3)
- Other (2)
- Part of a Book (1)
Language
- German (28)
- Spanish (6)
- English (3)
- Multiple languages (1)
Keywords
- Digitalisierung (38) (remove)
Has Fulltext
- yes (38) (remove)
Institute
- Interdisziplinäre Arbeitsgruppe Gegenworte - Hefte für den Disput über Wissen (15)
- Drittmittelprojekt Proyecto Humboldt Digital (6)
- Akademienvorhaben Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm (5)
- Interdisziplinäre Arbeitsgruppe Implikationen der Digitalisierung für die Qualität der Wissenschaftskommunikation (4)
- Interdisziplinäre Arbeitsgruppe Zukunft der Medizin: "Gesundheit für alle" (3)
- Akademienvorhaben Altägyptisches Wörterbuch (1)
- Interdisziplinäre Arbeitsgruppe Wandel der Universitäten und ihres gesellschaftlichen Umfelds: Folgen für die Wissenschaftsfreiheit (1)
- Interdisziplinäre Arbeitsgruppe Zukunft der Arbeit (1)
- Interdisziplinäre Arbeitsgruppe Zukunft des wissenschaftlichen Kommunikationssystems (1)
Among mass digitization methods, double-keying is considered to be the one with the lowest error rate. This method requires two independent transcriptions of a text by two different operators. It is particularly well suited to historical texts, which often exhibit deficiencies like poor master copies or other difficulties such as spelling variation or complex text structures. Providers of data entry services using the double-keying method generally advertise very high accuracy rates (around 99.95% to 99.98%). These advertised percentages are generally estimated on the basis of small samples, and little if anything is said about either the actual amount of text or the text genres which have been proofread, about error types, proofreaders, etc. In order to obtain significant data on this problem it is necessary to analyze a large amount of text representing a balanced sample of different text types, to distinguish the structural XML/TEI level from the typographical level, and to differentiate between various types of errors which may originate from different sources and may not be equally severe. This paper presents an extensive and complex approach to the analysis and correction of double-keying errors which has been applied by the DFG-funded project “Deutsches Textarchiv” (German Text Archive, hereafter DTA) in order to evaluate and preferably to increase the transcription and annotation accuracy of double-keyed DTA texts. Statistical analyses of the results gained from proofreading a large quantity of text are presented, which verify the common accuracy rates for the double-keying method.
Der Beitrag geht von einer kritischen Bestandaufnahme digitalisierter Lexikografie der Gegenwart aus. Daran anknüpfend sollen pointierte Thesen bzw. Ideen formuliert werden, die auf Erkenntnisse über das Netzwerk europäischer Nachschlagewerke vergangener Jahrhunderte zurückgreifen. Die Thesen werden in zwei Richtungen entfaltet: In eine europäisch-globale Perspektive und in die Perspektive des Wunsches, Nutzerfreundlichkeit und wissenschaftliche Qualität mit einander zu verbinden.
Health Data as a Public Good. Routine health data, which are collected by health insurers and other agencies in the health care system, offer enormous potential for health monitoring and research. Germany has been slow to make such data available for socially beneficial purposes, partly due to concerns about privacy and data protection. Against this background, we discuss some of the most important potential uses of routine health data and call for a broader societal debate about the benefits, risks, and appropriate regulation of routine health data usage.We then review theWestern Australian Data Linkage System as an example of a data infrastructure that is characterized by high levels of stakeholder and patient involvement and a sophisticated method of privacy protection. While Germany does not need to copy this approach, we hope that the experiences of Western Australia and other countries will stimulate and inform the overdue debate about a modern, responsible, and sustainable approach to socially beneficial health data usage in Germany.
"Papiergeschichte reicht nicht mehr aus" : Gespräch mit Wolfert von Rahden und Christoph Kehl
(2001)
In dem vorliegenden Heft zu den „Qualitätsrisiken der Plattformökonomie für die Wissenschaftskommunikation“ wird zunächst die Frage aufgeworfen, wie sich die Mediennutzung im Zuge von Digitalisierung und Plattformisierung verändert. Über einen Systemvergleich anhand von drei medien- bzw. politökonomischen Konzepten wird dann herausgearbeitet, dass und wie sich in diesem Zusammenhang die Risiken maximiert haben. Auf der Grundlage der Analysen werden abschließend Vorschläge für eine verbesserte Gestaltung der Wissenschaftskommunikation, ihrer Erforschung und u. a. für die „Etablierung und Förderung einer kooperativen Medienplattform für qualitätsjournalistische Inhalte“ unterbreitet.
Vor allem in älteren Wörterbüchern mit philologischer Ausrichtung ist die Mikrostruktur der Artikel häufig diskursiv und unsystematisch. Eine automatisierte Digitalisierung solcher Wörterbücher mit dem Ziel, ihre logische Struktur zu kodieren, ist nicht möglich; in vielen Fällen ist schon ein Parser für ein manuell nachzubearbeitendes Rohdigitalisat kein realistisches Ziel, weil die Angabetypen des Wörterbuchs nicht klar voneinander abgrenzbar und in den Einzelartikeln nicht eindeutig identifizierbar sind. In solchen Fällen wirft auch eine nachträgliche manuelle Formalisierung der Mikrostruktur große lexikografische Probleme auf. Für komplexere Anwendungsszenarien wie etwa Abfragen in Webanwendungen kann es dennoch unumgänglich sein, wenigstens sämtliche relevanten in den Artikeln diskutierten Wortformen mit grundsätzlichen diasystematischen und morphologischen Informationen sowie ihren Relationen zueinander in einem maschinell lesbaren Format strukturiert zu repräsentieren, etwa durch datenzentrierte XML-Dokumente. Der Vortrag versucht, die lexikografischen und technischen Möglichkeiten und Grenzen einer solchen teilweisen und manuellen Retrodigitalisierung am Beispiel von Erfahrungen mit einem älteren Wörterbuch deutscher Lehnwörter im Slovenischen (Striedter-Temps 1963) auszuloten. Das Wörterbuch soll in ein Portal von Lehnwörterbüchern mit Deutsch als gemeinsamer Gebersprache eingebunden werden. Die Einzelartikel werden dem Benutzer als Bilddigitalisate zur Verfügung gestellt; die zusätzliche textuelle Retrodigitalisierung ist jedoch für komplexere, insbesondere auch für wörterbuchübergreifende und portalweite, Suchabfragen erforderlich.
Mit der Digitalisierung der Wissenschaftskommunikation verbindet sich eine Vielzahl neuer Kommunikationsformen und Partizipationsmöglichkeiten, die das Verhältnis von Wissenschaft und Gesellschaft grundlegend verändern. In diesem Band wird ein Theorierahmen entwickelt, der hilft, diese Veränderungen anhand konkreter Beispiele wie Open Science, Plagiats-Wikis oder Wissens-Communities einzuordnen, Forschungsbefunde zu systematisieren und auf offene Fragen hinzuweisen. Die Autorinnen und Autoren waren Mitglieder der Interdisziplinären Arbeitsgruppe „Implikationen der Digitalisierung für die Qualität der Wissenschaftskommunikation“ (2018-2021).