Campus-Nr.: 273081
LV-Nr.: 242201170
Link zum Kurs auf ILIAS

R Logo

Stand 02.11.2020

Seminarbeschreibung

Die fachkundige Analyse empirischer Daten ist in der sozialwissenschaftlichen Forschung und in vielen Berufsfeldern von Sozialwissenschaftler*Innen wichtig. Meist erfordern die Analysen um belastbare Schlussfolgerungen ziehen zu können multivariate Methoden. Deshalb sind Kenntnisse multivariater Analyseverfahren - deren praktische Anwendung und die Interpretation der Ergebnisse - wichtige Voraussetzungen, um einerseits empirische Texte besser verstehen (und kritisieren) sowie andererseits im Studium und ggf. später im Beruf eigene empirische Analysen durchführen zu können.

Im Seminar sollen die Studierenden mit Hilfe zahlreicher Übungsaufgaben die dafür notwendigen Kompetenzen entwickeln, indem sie die Verfahren zunächst vorgestellt bekommen und sich unter Anleitung und später eigenständig die entsprechenden Lösungswege erarbeiten. Bevor multivariate Verfahren durchgeführt werden können, sind in der Regel einige Vorarbeiten an den Daten zu leisten wie z.B. Rekodierungen, die Bildung von Indizes etc. In der ersten Sitzung werden deshalb kurz die Verfahren zur Datentransformation wiederholt. Im weiteren Verlauf werden dann zentrale Analyseverfahren wie Faktorenanalyse, t-Test, Varianzanalyse und die lineare Regression angewendet und die Interpretation der Ergebnisse an Beispielen eingeübt.

Das Statistikpaket R

Freie Software und “State of the Art”

“As is evident in the content of this journal from its inception, and in books on statistical computing published recently by and for statisticians, R has come to dominate the development of statistical software by statisticians. The use of R among political scientists and others in the social sciences is apparently also on an upwards trajectory” — Altman 20111

Fast zehn Jahre nach dieser Aussage ist R mittlerweile das Statistikpaket der Wahl für Alle, die quantitative Analysen auf höchstem Niveau und in größter Flexibilität durchführen wollen und (neben Python) der Standard in Data Science, Digital Humanities und Computational Social Science.

R ist eine Programmiersprache zur statistischen Datenanalyse und als Statistikprogramm R unter der GNU General Public License frei verfügbar. In der aktuellen Version 4.0.2 läuft es auf Windows, MacOS und Linux. Das Grundgerüst von R lässt sich durch eine Vielzahl von Paketen erweitern, mit denen sich unterschiedliche statistische Problemstellungen bearbeiten lassen.

Ebenso ist es einfach möglich, eigene Erweiterungen zu programmieren. R ist kommandozeilenbasiert (vergleichbar mit der SPSS-Syntax). Dies hat den Vorteil, dass die Anwender*In genau wissen muss, was sie überhaupt vorhat und zu welchem Zweck sie welche statistischen Tests vom Programm anfordert. Eine besondere Stärke von R liegt in den umfangreichen Möglichkeiten der Datenvisualisierung.

Zwar ist der Einstieg in R etwas schwieriger, jedoch steigt die Lernkurve nach einigen Stunden intensiver Beschäftigung (wenn man die grundsätzliche Logik verstanden hat) stark an. Mit R gibt es dann keinerlei Beschränkungen mehr, was an Auswertung möglich ist (bis auf das, was statistisch möglich ist). Zu keinem anderen Statistikprogramm gibt es eine solche Bandbreite an Unterstützung im Internet (Video-Tutorials, Mailinglisten, Blogs und Diskussionsseiten). Darüber hinaus stehen zu R und allen Paketen Handbücher als pdf’s frei zur Verfügung.

Vor allem durch die freie Zugänglichkeit und Unabhängigkeit von Lizenzen, ist R im universitären Kontext besonders attraktiv. Darüber hinaus erlernen die Studierenden ein Programm, auf das sie auch nach der Zeit an der Universität (wo es in der Regel die Lizenzen für die teuren Statistikprogramme gibt), nutzen können. Die wenigsten Studierende treffen auf einen Arbeitgeber, bei dem SPSS oder Stata vorhanden ist. Mit R sind sie dennoch in der Lage statistische Analysen auf höchstem Niveau durchzuführen, ohne skeptische Verantwortliche („das geht bestimmt auch mit Excel“) vom Nutzen eines teuren Statistikprogramms überzeugen zu müssen.

Ein Hinweis zum Schluss: In der R Community gibt es zwei Strömungen: “base R” (die reine Lehre) und “tidyverse” (der Sündenfall, der R massentauglich macht). Sicherlich werden einige von Ihnen über kurz oder lang gefallen an tidyverse finden. Aus didaktischen Gründen lernen Sie im Seminar aber base R (trozdem nutzen wir natürlich eine VIelzahl an Paketen und Befehlen aus dem tidyverse).

Ressourcen

R ist Open-Source – also kostenlose, freie Software. Bitte installieren Sie auf Ihrem Computer/Laptop schon Mal R. Dazu benötigen Sie zwei Dinge (bitte auch in dieser Reihenfolge installieren):

  1. R: https://cran.r-project.org/bin/windows/base/
  2. R-Studio: https://rstudio.com/products/rstudio/download/#download

Online Ressourcen

Literaturempfehlungen

Hinter jedem Titel finden Sie unter UB den Titel im Katalog der Universitätsbibliothek.

R

Wer etwas zu SPSS sucht…

Forschungsdesign, Methoden und Statistik

Formalia

Das Seminar “Multivariate Datenanalyse mit R (und etwas SPSS)” ist Teil 2 des Moduls 282502 “Statistik-Software für Sozialwissenschaftler” im Studiengang BA Sozialwissenschaften (PO 2012 und PO 2018). Für das Modul erhalten Sie 6 ECTS.

Die Prüfungsleistung für das Modul besteht in einer lehrveranstaltungsbegleitenden Prüfung (Nr. 28252), die Sie als kurze Hausarbeit im Umfang von sechs bis acht Seiten in diesem Seminar erbringen. Abgabefrist für die Hausarbeit ist (Stand 2.11.2020) der 31.03.2021. Die Abgabe erfolgt ausschließlich digital als pdf und R Code über einen Dateibriefkasten in ILIAS.

Das Seminar hat mit 3 ECTS einen Workload von 90 Stunden, davon 21 Stunden in Präsenz. Präsenz heißt in diesem Semester: ILIAS-Lernmodule, Lernvideos, Webex-Sitzungen. Darüber hinaus sollten Sie ca. ein bis zwei Stunden fürs Lesen und eigenständiges Bearbeiten von Übungsaufgaben einplanen.

Falls Sie einen Termin in der Sprechstunde möchten, vereinbaren wir einen Termin per Mail. Die Sprechstunde findet dann über Webex statt: https://unistuttgart.webex.com/meet/uwe.remer

Sitzungen

S Datum Titel
1 02.11.2020 Konstituierende Sitzung
2 09.11.2020 Erste Schritte mit R
3 16.11.2020 R Workflow
4 23.11.2020 Wiederholung: recodieren, transformieren, Indices
5 30.11.2020 Wiederholung: uni- und bivariate Statistik
6 07.12.2020 Mittelwertvergleich (t-Test)
7 14.12.2020 Explorative Faktorenanalyse und Reliabilität
8 21.12.2020 Regressionsanalyse I, Einführung
9 11.01.2021 Regressionsanalyse II, multivariate Regression
10 18.01.2021 Regressionsanalyse III, Kausalität und Drittvariablenkontrolle
11 25.01.2021 Regressionsanalyse IV, Regressionsannahmen und -diagnostik
12 01.02.2021 Regressionsanalyse V, Moderator- und Mediator-Effekte
13 08.02.2021 Abschlusssitzung und Besprechung Hausarbeit

  1. Altman, Micah et al. (2011): An Introduction to the Special Volume on Political Methodology. In: Journal of Statistical Software, Vol. 41, Nr.1. DOI: http://dx.doi.org/10.18637/jss.v042.i01↩︎