Refine
Document Type
- Article (34)
- Part of a Book (4)
- Book (2)
- Conference Proceeding (2)
Language
- German (38)
- English (2)
- French (1)
- Multiple languages (1)
Keywords
- Linguistik (42) (remove)
Has Fulltext
- yes (42)
Institute
- Interdisziplinäre Arbeitsgruppe Sprache des Rechts, Vermitteln, Verstehen, Verwechseln (37)
- Akademienvorhaben Digitales Wörterbuch der Deutschen Sprache (1)
- Akademienvorhaben Strukturen und Transformationen des Wortschatzes der ägyptischen Sprache. Text- und Wissenskultur im alten Ägypten (1)
- Berlin-Brandenburgische Akademie der Wissenschaften (1)
- Initiative Jahresthema (1)
- Interdisziplinäre Arbeitsgruppe Gegenworte - Hefte für den Disput über Wissen (1)
For a fistful of blogs: Discovery and comparative benchmarking of republishable German content
(2014)
We introduce two corpora gathered on the web and related to computer-mediated communication: blog posts and blog comments. In order to build such corpora, we addressed following issues: website discovery and crawling, content extraction constraints, and text quality assessment. The blogs were manually classified as to their license and content type. Our results show that it is possible to find blogs in German under Creative Commons license, and that it is possible to perform text extraction and linguistic annotation efficiently enough to allow for a comparison with more traditional text types such as newspaper corpora and subtitles. The comparison gives insights on distributional properties of the processed web texts on token and type level. For example, quantitative analysis reveals that blog posts are close to written language, while comments are slightly closer to spoken language.
Abecedarium der Sprache
(2018)
Unter dem Titel Abecedarium der Sprache versammelt sich ein eigensinniges Alphabet: Es nimmt seinen Anfang beim „Akkudativ“ in Berlin und endet bei der „Zyselmaus“ in Japan. Es untersucht die „Lesesucht“ einerseits und erklärt andererseits, wie eine „digitale Diagnose“ in der Medizin funktionieren kann. Es ist „Inter-nett“, widmet sich aber auch dem „Flunkern“. Thematisch streift das Abecedarium dabei durch die Welten des Technischen, des Tierischen und natürlich des Menschlichen – denn in all diesen Welten spielt Sprache eine wichtige Rolle.
Die Beiträge dieses Bandes, die aus den Veranstaltungen des Jahresthemas 2017|18 „Sprache“ der Berlin-Brandenburgischen Akademie der Wissenschaften erwachsen sind, vermitteln einen Eindruck von der Vielschichtigkeit der Sprache und werfen Schlaglichter auf die vielen Themen, denen die aktuelle Forschung nachgeht.