Refine
Year of publication
- 2013 (138) (remove)
Document Type
- Article (67)
- Conference Proceeding (20)
- Part of a Book (14)
- Lecture (9)
- Other (9)
- Working Paper (6)
- Book (4)
- Part of Periodical (3)
- Preprint (3)
- Report (2)
Language
- German (124)
- English (11)
- Multiple languages (3)
Keywords
- Europäische Union (26)
- Wissenschaft (21)
- Vertrauen (15)
- Korpus <Linguistik> (13)
- Wissenschaftsorganisation (11)
- Information und Dokumentation (8)
- Lexikographie (8)
- Deutschland (7)
- Bibliographie (6)
- Geschichtswissenschaft (5)
- Rezeption (4)
- Schleiermacher, Friedrich (4)
- Wissenschaftstheorie (4)
- Ökosystem (4)
- Antike (3)
- Edition (3)
- Kulturlandschaft (3)
- Preußen (3)
- Renaissance (3)
- Wissenschaftspolitik (3)
- Wissenschaftssystem (3)
- Ökosystemleistungen (3)
- Agrogentechnik (2)
- Biodiversität (2)
- Biotechnologie (2)
- Demotisch (2)
- Deutsch (2)
- Gentechnisch veränderter Organismus (2)
- Gentechnologie (2)
- Gentechnologiebericht (2)
- Griechisch (2)
- Grüne Gentechnik (2)
- Landwirtschaft (2)
- Molekularbiologie (2)
- Neuägyptisch (2)
- Open Access (2)
- Pflanzenzüchtung (2)
- Software (2)
- angewandte Ethik (2)
- gentechnisch veränderte Pflanzen (2)
- gv-Pflanzen (2)
- interdisziplinär (2)
- Ägyptisch (2)
- Accounting (1)
- Acta Borussica (1)
- Agricultural Biotechnology (1)
- Altertumswissenschaft (1)
- Altfranzösisch (1)
- Alttürkisch (1)
- Annotation (1)
- Antikenrezeption (1)
- Antikensammlung (1)
- Aphrodite, Göttin (1)
- Archäologie (1)
- Augustinus, Aurelius (1)
- Bevölkerungsentwicklung (1)
- Bioethik (1)
- Biosphere reserve (1)
- Biosphärenreservat (1)
- Boehme, Christian Friedrich (1)
- Buddhism (1)
- Buddhismus (1)
- Calvi, Marco Fabio (1)
- Copyright (1)
- Cultural ecosystem services (1)
- Demographie (1)
- Denkmalpflege (1)
- Diachronie (1)
- Diana, Göttin (1)
- Digitalisierung (1)
- Diskurs (1)
- Ecosystem services bundles (1)
- Editionswissenschaft (1)
- Effekte (1)
- Elternschaft (1)
- Emblemliteratur (1)
- Entlehnung (1)
- Eurolatein (1)
- Europa (1)
- Familienpolitik (1)
- Fertilität (1)
- Fichte, Johann Gottlieb (1)
- Fortleben (1)
- Friedrich Wilhelm III., Preußen, König (1)
- Friedrich Wilhelm IV., Preußen, König (1)
- Frühneuhochdeutsch (1)
- Geburtenziffer (1)
- Geist und Buchstabe (1)
- Geistesgeschichte (1)
- Genauigkeit (1)
- Gene Technology Report (1)
- Germany (1)
- Geschichtsbild (1)
- Grammatik (1)
- Grodzicki-Haus (Warschau) (1)
- Grüne Gentechnologie (1)
- Harz (1)
- Hermeneutik (1)
- Hethitologie (1)
- Historische Lexikographie (1)
- Historische Sprachwissenschaft (1)
- Humanismus (1)
- Idfu (1)
- Indikator (1)
- Indogermanistik (1)
- Informationsgesellschaft (1)
- Informationskompetenz (1)
- Intergovernmental Platform on Biodiversity and Ecosystem Services (IPBES) (1)
- Juden (1)
- Kind (1)
- Kinderwunsch (1)
- Koalitionskriege (1)
- Konferenz (1)
- Konkordanz (1)
- Koptisch (1)
- Korrekturlesen (1)
- Kultur (1)
- Kulturelle Ökosystemleistungen (1)
- Kulturgeschichte (1)
- Kunstgeschichte <Fach> (1)
- Kursivhieratisch (1)
- Königliche Museen zu Berlin. Ägyptische Abteilung (1)
- Landesbibliographie (1)
- Landnutzung (1)
- Landscape values (1)
- Latein (1)
- Latin loanwords (1)
- Lehnwort (1)
- Linguistik (1)
- Luther, Martin (1)
- Medien (1)
- Medizinische Ethik (1)
- Melanchthon, Philipp (1)
- Metadaten (1)
- Millennium Ecosystem Assessment (1)
- Mittelalter (1)
- Mittelhochdeutsches Wörterbuch (1)
- Monarchenbesuch (1)
- Namenkunde (1)
- Napoleonische Kriege (1)
- Nationalbewusstsein (1)
- Nationalismus (1)
- Neue Medien (1)
- Neuvorpommern (1)
- Nordrhein-Westfalen (1)
- Normdatei (1)
- Old Turkish (1)
- Origenes (1)
- Participatory mapping (1)
- Partizipative Kartierung (1)
- Paulus, Apostel, Heiliger (1)
- Philologie (1)
- Photoarchiv (1)
- Plastik (1)
- Ptolemäisch (1)
- Publikationssystem (1)
- Putbus (1)
- Putbus, Wilhelm Malte von (1)
- Qualitätssicherung (1)
- Quellen (1)
- Regionalbibliographie (1)
- Reise (1)
- Repräsentation (1)
- Rom (1)
- Sargtexte (1)
- Schleiermacher, Briefe (1)
- Schnittstelle (1)
- Soziologie (1)
- Sprachwandel (1)
- Steffens, Henrik (1)
- Stockholm (1)
- Syntax (1)
- Textlinguistik (1)
- Textsorte (1)
- Thema (1)
- Tocharisch (1)
- Tourismus (1)
- Tradition (1)
- Transkription (1)
- Urheberrecht (1)
- Vedisch (1)
- Wirkung (1)
- Wissenschaft ; Medien (1)
- Wissenschaft ; Skandal (1)
- Wissenschaftliche Bibliothek (1)
- Wissenschaftsurheberrecht (1)
- Zeitdeutung (1)
- Zoologischer Garten Berlin (1)
- birth rate (1)
- children (1)
- communication system (1)
- copyright (1)
- demographic development (1)
- demography (1)
- digitization (1)
- double-keying (1)
- effects (1)
- error classification (1)
- family policy (1)
- fertility (1)
- historical lexicography (1)
- neo-latin (1)
- open access (1)
- parents (1)
- proofreading (1)
- publication system (1)
- quality control (1)
- tools (1)
- transcription accuracy (1)
- west-european languages (1)
- westeuropäische Sprachen (1)
- wissenschaftliche Lexikographie (1)
- wissenschaftliches Kommunikationssystem (1)
- Ägypten <Altertum, Motiv> (1)
Has Fulltext
- yes (138)
Institute
- Interdisziplinäre Arbeitsgruppe Gegenworte - Hefte für den Disput über Wissen (51)
- Berlin-Brandenburgische Akademie der Wissenschaften (30)
- Akademienvorhaben Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache. Text- und Wissenskultur im alten Ägypten (19)
- Akademienvorhaben Census of Antique Works of Art and Architecture Known in the Renaissance (8)
- Akademienvorhaben Jahresberichte für deutsche Geschichte (8)
- Akademienvorhaben Schleiermacher in Berlin 1808-1834, Briefwechsel, Tageskalender, Vorlesungen (4)
- Drittmittelprojekt Ökosystemleistungen (4)
- Interdisziplinäre Arbeitsgruppe Exzellenzinitiative (3)
- Veröffentlichungen von Akademiemitarbeitern (3)
- Interdisziplinäre Arbeitsgruppe Gentechnologiebericht (2)
- Interdisziplinäre Arbeitsgruppe Zukunft des wissenschaftlichen Kommunikationssystems (2)
- Akademienvorhaben Altägyptisches Wörterbuch (1)
- Akademienvorhaben Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm (1)
- Akademienvorhaben Preußen als Kulturstaat (1)
- Akademienvorhaben Turfanforschung (1)
- Drittmittelprojekt Lebenswelten, Erfahrungsräume und politische Horizonte der ostpreußischen Adelsfamilie Lehndorff vom 18. bis in das 20. Jahrhundert (1)
- Zentrum Mittelalter (1)
- Zentrum Preußen-Berlin (1)
Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or constructed for synchronic input text adhering strictly to contemporary orthographic conventions. Unconventional input such as historical text which violates these conventions therefore presents difficulties for any such system due to lexical variants present in the input but missing from the application lexicon. To facilitate the extension of synchronically-oriented natural language processing techniques to historical text while minimizing the need for specialized lexical resources, one may first attempt an automatic canonicalization of the input text. This paper provides an informal overview of the various canonicalization techniques currently employed by the Deutsches Textarchiv project at the Berlin-Brandenburg Academy of Sciences and Humanities to prepare a corpus of historical German text for part-of-speech tagging, lemmatization, and integration into a robust online information retrieval system.