UnivIS
Information system of Friedrich-Alexander-University Erlangen-Nuremberg © Config eG 
FAU Logo
  Collection/class schedule    module collection Home  |  Legal Matters  |  Contact  |  Help    
search:      semester:   
 
 Layout
 
printable version

 
 
 Also in UnivIS
 
course list

lecture directory

 
 
events calendar

job offers

furniture and equipment offers

 
 

  Wörter, Texte & Frequenzen: statistische Analyse von Sprachdaten (WTF)

Lecturers
Andreas Blombach, M.A., Philipp Heinrich, M.Sc.

Details
Seminar
Präsenz
2 cred.h, ECTS studies, ECTS credits: 5
geeignet als Schlüsselqualifikation, Sprache Deutsch
Time and place: Mon 16:15 - 17:45, 02.313

Prerequisites / Organisational information
Grundlegende Statistik- und Programmierkenntnisse werden vorausgesetzt, Erfahrung mit R ist nicht nötig
Technische Voraussetzungen: eigener Rechner; für Online-Veranstaltungen Mikrofon, Lautsprecher oder Headset, idealerweise Webcam

Contents
Seien es nun stilometrische Analysen, die Auswertung von Korpusrecherchen oder die Analyse von Social-Media-Beiträgen unter sozialwissenschaftlichen Gesichtspunkten: Auch wenn man eigentlich mit Text arbeitet, kommt man um Statistik oft nicht herum.
Sprachdaten bringen besondere statistische Herausforderungen mit sich, die in Einführungskursen in der Regel nur angeschnitten werden. Wir wollen uns im Seminar aber nicht nur damit beschäftigen, sondern auch ganz grundlegend mit statistischer Modellierung: Wie wählt man das passende statistische Verfahren aus? Wie wählt man die Prädiktorvariablen aus, die ins Modell eingehen sollen? Wie misst man die Güte eines Modells, und wie interpretiert man das Modell richtig? Wie lassen sich Modelle robust konstruieren, sodass sie verlässlichere Vorhersagen liefern? Wie geht man mit Interaktionen, Nichtlinearität und abhängigen Daten um? Wie wählt man unter mehreren möglichen Modellen das beste aus? Dabei spielt natürlich stets auch die Visualisierung der Daten eine wichtige Rolle. Eigene Daten und Fragestellungen können gerne eingebracht werden!
Grober und unvollständiger Themenüberblick:
  • Einführung in R / Auffrischung

  • Häufigkeitsverteilungen von Sprachdaten

  • Visual data exploration: ggplot, Plotly & Shiny

  • Statistische Modelle: Genauigkeit und Interpretierbarkeit, Test- und Trainingsdaten, Kreuzvalidierung

  • Klassifikationsprobleme (logistische Regression, SVMs, Entscheidungsbäume und Random Forests)

  • Modellieren für Fortgeschrittene (u.a. Umgang mit Nichtlinearität und mit abhängigen Daten)

  • Unüberwachtes Lernen: Clustering, Dimensionsreduzierung und Co.

Recommended literature
Wickham, Hadley / Grolemund, Garrett (2017): R for Data Science. [Online: https://r4ds.had.co.nz/index.html]
Ismay, Chester / Kim, Albert Y. (2020): Statistical Inference via Data Science. A ModernDive into R and the Tidyverse. [Online: https://moderndive.com/index.html]
James, Gareth / Witten, Daniela / Hastie, Trevor / Tibshirani, Robert (2013): An Introduction to Statistical Learning. [Online: http://faculty.marshall.usc.edu/gareth-james/ISL/]

ECTS information:
Credits: 5

Additional information
Keywords: Statistik, Korpuslinguistik, Visualisierung, Datenanalyse, Regression, Modellierung
Maximale Teilnehmerzahl: 15
Registration is required for this lecture.
Registration starts on Monday, 20.9.2021, 10:00 and lasts till Sunday, 24.10.2021, 23:00 über: StudOn.

Verwendung in folgenden UnivIS-Modulen
Startsemester WS 2021/2022:
Wahlpflichtbereich BA (Wahl2018)

Department: Department of Digital Humanities and Social Studies (DHSS)
UnivIS is a product of Config eG, Buckenhof