Conference Proceeding
Refine
Year of publication
Document Type
- Conference Proceeding (74) (remove)
Language
- German (61)
- English (12)
- Multiple languages (1)
Keywords
- Korpus <Linguistik> (13)
- Technikphilosophie (12)
- Lexikographie (8)
- Mediävistik (3)
- Demotisch (2)
- Deutsch (2)
- Edition (2)
- Griechisch (2)
- Ingenieur (2)
- Konferenz (2)
Has Fulltext
- yes (74)
Institute
- Berlin-Brandenburgische Akademie der Wissenschaften (40)
- Akademienvorhaben Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache. Text- und Wissenskultur im alten Ägypten (19)
- Interdisziplinäre Arbeitsgruppe Gentechnologiebericht (14)
- Akademienvorhaben Monumenta Germaniae Historica (5)
- Zentrum Mittelalter (5)
- Veröffentlichungen von Akademiemitgliedern (3)
- ALLEA (2)
- TELOTA - IT/Digital Humanities (2)
- Akademienunion (1)
- Akademienvorhaben Altägyptisches Wörterbuch (1)
- Akademienvorhaben Berliner Klassik (1)
- Akademienvorhaben Digitales Wörterbuch der Deutschen Sprache (1)
Der griechisch-ägyptische Sprachkontakt, wie er sich in der Anreicherung des ägyptischen Lexikons im 1. Jahrtausend n. Chr. mit mehr als 4500 griechischen Wörtern der meisten Wortarten und semantischen Felder darstellt, ist einer der am breitesten und dichtesten bezeugten Fälle von intensiver lexikalischer Entlehnung in der Antike. Doch die Erfassung und elementare Aufbereitung der relevanten Sprachdaten, d.h. die Lexikographie griechischer Lehnwörter im Koptischen, scheiterte mehrmals während des 20. Jahrhunderts und ist zu einem kardinalen Desiderat der ägyptischen Wortforschung geworden. Vom 1. April 2010 bis zum 31. März 2012 arbeitete am Ägyptologischen Institut der Universität Leipzig das in der Ausschreibung „Geistes- und Sozialwissenschaftliche Forschung“ des Sächsischen Staatsministeriums für Wissenschaft und Kunst und der Sächsischen Akademie der Wissenschaften zu Leipzig bewilligte Projekt Database and Dictionary of Greek Loanwords in Coptic (DDGLC). In dieser zweijährigen Pilotphase wurde die Möglichkeit getestet, das umfangreiche und in sich reich untergliederte Gesamtcorpus koptischer Texte lehnwortlexikographisch aufzuarbeiten. Dazu wurden in einer Arbeitsdatenbank konzeptuelle und technische Voraussetzungen geschaffen und eine lexikographische Praxis entwickelt und erprobt, die hier in gebotener Kürze vorgestellt werden sollen.
Im 20. Jahr nach dem Mauerfall fand in der Berlin-Brandenburgischen Akademie der Wissenschaften vom 24. bis 25. November 2009 das Symposium „Wissenschaft und Wiedervereinigung. Bilanz und offene Fragen“ statt. Im Rahmen des Wissenschaftsjahres 2009 diskutierten Wissenschaftler und Wissenschaftspolitiker, ob bei der Vereinigung der beiden deutschen Wissenschaftssysteme Chancen genutzt oder verpasst wurden. Wie unterschiedlich oder ähnlich entwickelten sich die beiden getrennten Systeme bis zum Mauerfall? Wie kamen nach 1989 – welche – Entscheidungen zustande und mit welchen Folgen wurden sie umgesetzt? Kann der Um- und Neuaufbau von Hochschulen und außeruniversitären Instituten im Osten als Erfolg bewertet werden und wie steht es um die Zukunftsfähigkeit des gesamtdeutschen Wissenschaftssystems im globalen Wettbewerb? Die Ergebnisse des Symposiums sind in dieser Dokumentation nachzulesen. Sie enthält die Eröffnungsreden von Bundesministerin Annette Schavan und BBAW-Präsident Günter Stock, die Einführung und die Schlussbemerkungen von Jürgen Kocka sowie die Impulsreferate von Richard Schröder, Winfried Schulze, Mitchell G. Ash, Peer Pasternack und Wilhelm Krull. Die Redaktion der Referate und die Zusammenfassungen der Diskussionsbeiträge sämtlicher Podiumsteilnehmer verantworten die beiden Wissenschaftsjournalisten Corina Weber (Auftakt, Forum I und II) und Jörg von Bilavsky (Auftakt, Forum III und IV), die das Symposium vorbereitet und organisiert haben.
For a fistful of blogs: Discovery and comparative benchmarking of republishable German content
(2014)
We introduce two corpora gathered on the web and related to computer-mediated communication: blog posts and blog comments. In order to build such corpora, we addressed following issues: website discovery and crawling, content extraction constraints, and text quality assessment. The blogs were manually classified as to their license and content type. Our results show that it is possible to find blogs in German under Creative Commons license, and that it is possible to perform text extraction and linguistic annotation efficiently enough to allow for a comparison with more traditional text types such as newspaper corpora and subtitles. The comparison gives insights on distributional properties of the processed web texts on token and type level. For example, quantitative analysis reveals that blog posts are close to written language, while comments are slightly closer to spoken language.