Conference Proceeding
Refine
Year of publication
Document Type
- Conference Proceeding (74) (remove)
Language
- German (61)
- English (12)
- Multiple languages (1)
Keywords
- Korpus <Linguistik> (13)
- Technikphilosophie (12)
- Lexikographie (8)
- Mediävistik (3)
- Demotisch (2)
- Deutsch (2)
- Edition (2)
- Griechisch (2)
- Ingenieur (2)
- Konferenz (2)
- Linguistik (2)
- Neuägyptisch (2)
- Software (2)
- Strömungsmechanik (2)
- Ägyptisch (2)
- AEMASE (1)
- Altfranzösisch (1)
- Annotation (1)
- August Ferdinand (1)
- August Wilhelm (1)
- Bernhardi (1)
- Bewusstsein (1)
- Big Data (1)
- Biographie (1)
- CVMA (1)
- Computer-mediated communication (1)
- Computerlinguistik (1)
- Corpus linguistics (1)
- Creative Commons (1)
- Cultural Heritage (1)
- Dekodierung (1)
- Diachronie (1)
- Digital Research Tools (1)
- Digitale Editionen (1)
- Diskurs (1)
- Eckhard (1)
- Erkenntnistheorie (1)
- Friedrich von (1)
- Frühneuhochdeutsch (1)
- Gehirn (1)
- Grammatik (1)
- Gregorius <VII. (1)
- Gregorius VII., Papst (1)
- Heiliges Römisches Reich (1)
- Heinrich <III. (1)
- Heinrich <III., Heiliges Römisches Reich, Kaiser (1)
- Hermeneutik (1)
- Hethitologie (1)
- Humanities (1)
- Hydra (1)
- Idfu (1)
- Iffland (1)
- Indogermanistik (1)
- Kaiser> (1)
- Konkordanz (1)
- Koptisch (1)
- Kursivhieratisch (1)
- Lateral inhibition (1)
- Lehnwort (1)
- Ludwig (1)
- Mensch (1)
- Mittelhochdeutsches Wörterbuch (1)
- Modelltechnik (1)
- Müller-Mertens (1)
- Müller-Mertens, Eckhard (1)
- Namenkunde (1)
- Nationaltheater (1)
- Neue Medien (1)
- Neurobiologie (1)
- Papa> (1)
- Pattern formation (1)
- Philologie (1)
- Photoarchiv (1)
- Ptolemäisch (1)
- Regeneration (1)
- Research Infrastructures (1)
- Romantik (1)
- Russland (1)
- SASSH (1)
- SSH (1)
- Salier (1)
- Sargtexte (1)
- Schlegel (1)
- Social Sciences (1)
- Sprachstatistik (1)
- Sprachwandel (1)
- Syntax (1)
- TEI (1)
- Text quality assessment (1)
- Textlinguistik (1)
- Textsorte (1)
- Theatergeschichte 1800 (1)
- Theaterkritik (1)
- Thema (1)
- Theory (1)
- Tieck (1)
- Tocharisch (1)
- Tradition (1)
- Trembley (1)
- Vedisch (1)
- Web crawling (1)
- Web log (1)
- Wiedervereinigung (1)
- Willensfreiheit (1)
- Wissenschaftsgeschichte (1)
- Wissenschaftspolitik (1)
- Wolff (1)
- XMP (1)
- autocatalysis (1)
- brain (1)
- conference (1)
- consciousness (1)
- decodability (1)
- developmental-biology (1)
- digital editions (1)
- digital images (1)
- embryology (1)
- free-will (1)
- human (1)
- lateral-inhibition (1)
- metadata (1)
- neurobiology (1)
- pattern-formation (1)
- reaction-diffusion (1)
- science education (1)
- Ähnlichkeitsmechanik (1)
Has Fulltext
- yes (74) (remove)
Institute
- Berlin-Brandenburgische Akademie der Wissenschaften (40)
- Akademienvorhaben Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache. Text- und Wissenskultur im alten Ägypten (19)
- Interdisziplinäre Arbeitsgruppe Gentechnologiebericht (14)
- Akademienvorhaben Monumenta Germaniae Historica (5)
- Zentrum Mittelalter (5)
- Veröffentlichungen von Akademiemitgliedern (3)
- ALLEA (2)
- TELOTA - IT/Digital Humanities (2)
- Akademienunion (1)
- Akademienvorhaben Altägyptisches Wörterbuch (1)
- Akademienvorhaben Berliner Klassik (1)
- Akademienvorhaben Digitales Wörterbuch der Deutschen Sprache (1)
Antike und moderne Freiheit
(2003)
Einleitung
(2007)
Virtually all conventional text-based natural language processing techniques - from traditional information retrieval systems to full-fledged parsers - require reference to a fixed lexicon accessed by surface form, typically trained from or constructed for synchronic input text adhering strictly to contemporary orthographic conventions. Unconventional input such as historical text which violates these conventions therefore presents difficulties for any such system due to lexical variants present in the input but missing from the application lexicon. To facilitate the extension of synchronically-oriented natural language processing techniques to historical text while minimizing the need for specialized lexical resources, one may first attempt an automatic canonicalization of the input text. This paper provides an informal overview of the various canonicalization techniques currently employed by the Deutsches Textarchiv project at the Berlin-Brandenburg Academy of Sciences and Humanities to prepare a corpus of historical German text for part-of-speech tagging, lemmatization, and integration into a robust online information retrieval system.
Professor Dr. Eckhard Müller-Mertens als Hochschullehrer an der Humboldt-Universität zu Berlin
(2014)
Die demotische Wortliste steht als Liste aller demotischen Wortschreibungen für die Entzifferungsarbeit demotischer Texte zur Verfügung. In einer Präsentation werden die Abfragemöglichkeiten vorgestellt, wobei ein besonderer Schwerpunkt auf der Suche anhand der Graphien der Determinative liegt. Ferner wird die Wortliste um mögliche Wortschreibungen erweitert, die als Resultat von bekannten Lautveränderungen automatisch generiert werden. Damit können bei der philologischen Arbeit verschiedenste Wortformen auf einen Basiseintrag zurückgeführt werden.
Begrüßung
(2005)