Willkommen zum Kurs & Werkzeugkiste

rstatsZH - Data Science mit R

Lars Schöbitz

Sep 24, 2024

Willkommen! 👋

Triff die Kursleitung

Lars Schöbitz

Headshot of Lars Schöbitz

Lernziele des Kurses

Die folgenden Übergeordneten Lernziele sind für diesen Kurs definiert:

  1. Teilnehmer:innen werden in der Lage sein, eine Reihe gängiger datenwissenschaftlicher Werkzeuge (R, RStudio IDE, Git, GitHub, R tidyverse packages, Quarto) zu verwenden, um die Ergebnisse von Datenanalyseprojekten zu veranschaulichen und öffentlich zu kommunizieren.
  1. Teilnehmer:innen können das Quarto-Dateiformat und den visuellen Bearbeitungsmodus der RStudio IDE zu verwenden, um technisch-wissenschaftliche Dokumente mit Zitaten, Fußnoten, Querverweisen, Abbildungen und Tabellen zu erstellen.
  1. Teilnehmer:innen können Git Versionskontrolle verwerden um: (1) Änderungen an Dateien zu GitHub zu übertragen und von GitHub zu übernehmen, (2) Branches zu nutzen und Pull Requests auf GitHub zu öffnen, (3) mittels des GitHub Issue Tracker innerhalb eines Projekts zu kommunizieren und an Aufgaben zusammenzuarbeiten.

Du bist dran: Über Dich

  • Wähle einen Gegenstand aus und mache dir eine Minute lang Notizen.
  • Was hat der Gegenstand, den du ausgewählt hast, mit dem Grund zu tun, warum du hier bist?
01:00

In Paaren

Nehmt euch jeweils 2 Minuten Zeit, um euch auszutauschen:

  • Was hat der Gegenstand, den ihr ausgewählt habt, mit dem Grund eurer Anwesenheit zu tun?
05:00

Kurskalendar

modul datum titel
Modul 01 24 September 2024 Willkommen zum Kurs & Werkzeugkiste & Kollaboratives Arbeiten mit GitHub I
Modul 02 01 Oktober 2024 Explorative Datenanalyse durch Visualisierung & Digitaler Arbeitsplatz (DAP) & R-Community
Modul 03 08 Oktober 2024 Daten Transformation mit dplyr
Modul 04 15 Oktober 2024 Daten Import & Daten Management & Kollaboratives Arbeiten mit GitHub II
Modul 05 22 Oktober 2024 Bedingte Anweisungen & Datumswerte
Modul 06 29 Oktober 2024 Daten Typen & Vektoren & Iteration I (for loops)
Modul 07 05 November 2024 Datenformen lang und breit & Daten zusammenfügen
Modul 08 12 November 2024 Mit Text Daten arbeiten & Kollaboratives Arbeiten mit GitHub III
Modul 09 19 November 2024 Erstellung und Veröffentlichung analytischer Artikel mit Quarto & Tabellen & und Publizieren mit GitHub Pages
Modul 10 26 November 2024 Funktionen schreiben & Iteration II (across()) & Parameterisierung von Berichten
Abschlussprojekt 03 Dezember 2024 Arbeitszeit für Abschlussprojekt
Abschlussprojekt 10 Dezember 2024 Abgabe Abschlussprojekt
Abschlussveranstaltung 17 Dezember 2024 Abschlussveranstaltung

Kursstruktur

  • Ich bin dran: Vortragssegmente + Live-Coding
  • Wir sind dran: Live-Coding + Mitmachen
  • Ihr seid dran: Übungen in Paaren

Ich bin dran: Vortragssegmente + Live-Coding

  • Der Kursleiter schreibt und spricht den Code laut vor
  • Der Kursleiter erklärt Konzepte und Prinzipien, die relevant sind
  • Code wird auf dem Bildschirm angezeigt

Wir sind dran: Live-Coding + Mitmachen

  • Der Kursleiter schreibt und spricht den Code laut vor
  • Der Kursleiter erklärt relevante Konzepte und Prinzipien
  • Der Code wird auf dem Bildschirm angezeigt
  • Die Lernenden machen mit, indem sie denselben Code schreiben und ausführen

Ihr seid dran: Übungen in Paaren

  • Zwei Lernende arbeiten in Paaren in Break-out Räumen zusammen
  • Eine Person tippt und teilt die Bildschirmanzeige
  • Eine Person bietet Kommentare und Vorschläge an, und tippt selbst auch mit

Unterstützung bekommen / Fragen stellen

  • Während Live-Coding: hebt die Hand mittels Zoom und unterbrecht mich. Ich werde versuchen, mich um dein Anliegen zu kümmern, wenn es die Zeit erlaubt. Offene Fragen werden dokumentiert.

  • Während Übungen in Break-out Räumen: Ihr könnt mich zu euch rufen. Bei einem Grossteil der Übungen werde ich versuchen in jedem Raum einmal vorbeizuschauen.

Verhaltenskodex

Website zum Kurs

rstatszh-k009.github.io/website/

Wir sind dran: Öffne und speichere die Kurswebsite als Lesezeichen

  1. Öffne einen Webbrowser auf deinem Arbeitsgerät.
  2. Gehe zur Website des Kurses: rstatszh-k009.github.io/website/
  3. Erstelle einen Lesezeichenordner mit dem Namen rstatszh-k009 in deiner Lesezeichenleiste.
  4. Füge dem Ordner rstatszh-k009 das Lesezeichen zur Kurs-Webseite hinzu.
05:00

Lernziele (für diese Woche)

  1. Die Lernenden können ein GitHub Issue öffnen und den Kursleiter markieren.
  2. Die Lernenden können ein Repository von GitHub klonen und das GitHub PAT verwenden, um einen Commit von ihrem lokalen Repository auf GitHub zu übertragen.
  3. Die Lernenden können vier Komponenten einer Quarto-Datei identifizieren (YAML, Code Chunk, R-Code, Markdown).
  4. Die Lernenden können die vier Fenster der RStudio IDE identifizieren.

Quarto

Wir holen euch dort ab, wo ihr seid

Ich gehe davon aus, dass du:

nicht über Erfahrung mit R oder Git verfügst

  • nicht schon einmal in einer IDE gearbeitet hast (z. B. RStudio IDE)

  • etwas über R lernen möchtest

  • mehr über Quarto und das Veröffentlichen von Berichten erfahren möchtest

  • lernen möchtest, wie man mit GitHub Projekte verwaltet

Ich bringe dir bei:

  • R

  • Quarto-Syntax und -Formate

  • Markdown

  • Git über RStudio IDE nutzen

  • GitHub-Issues, Projektmanagement und Veröffentlichung

Posit Cloud & RStudio IDE

-

-

-

-

-

-

Was ist Quarto?

Quarto …

  • ist ein neues, open-source, wissenschaftliches und technisches Publikationssystem
  • zielt darauf ab, den Prozess der Erstellung von Berichten und der Zusammenarbeit drastisch zu verbessern
A schematic representing the multi-language input (e.g. Python, R, Observable, Julia) and multi-format output (e.g. PDF, html, Word documents, and more) versatility of Quarto.

Artwork from “Hello, Quarto” keynote by Julia Lowndes and Mine Çetinkaya-Rundel, presented at RStudio Conference 2022. Illustrated by Allison Horst.

Ich bin dran: Ein Rundgang durch RStudio IDE und Quarto



Zurücklehnen und genießen!

Pause machen

Bitte steh auf und beweg dich. Lasst eure E-Mails in Frieden ruhen.

10:00

Ihr seid dran: md-01-uebungen

  1. Öffne posit.cloud in deinem Browser (verwende dein Lesezeichen).
  2. Öffne den rstatszh-k009 Arbeitsbereich (Workspace) für den Kurs.
  3. Klicke auf Start neben md-01-uebungen.
  4. Suche im Dateimanager im Fenster unten rechts die Datei “hallo-quarto.qmd” und klicke darauf, um sie im Fenster oben links zu öffnen.
  5. Render das Dokument.
  6. Füge deinen Namen zum Schlüssel author: im YAML-Header hinzu
  7. Render das Dokument.
  8. Untersuche die Komponenten des Dokuments und führe eine weitere Aktualisierung und ein erneutes Rendern durch.
  9. Besprich die Notizen zu den von dir vorgenommenen Aktualisierungen. Notiere alle Aspekte des Dokuments, die nach der Tour und deiner ersten Interaktion damit unklar sind.
15:00

Von deiner eigenen Arbeitsumgebung aus

A screenshot of a Quarto document rendered inside RStudio

A screenshot of a Quarto document rendered inside JupyterLab

A screenshot of a Quarto document rendered inside VSCode

Quarto formate

Mit einer Installation ist alles enthalten

  • RMarkdown entwickelte sich zu einem großen Ökosystem mit unterschiedlicher Syntax.

  • Quarto kommt mit allem was es braucht um verschiedene Formate zu erstellen.

    • HTML Berichte und Webseiten
    • PDF Berichte
    • MS Office (Word, Powerpoint)
    • Präsentationen (Powerpoint, Beamer, revealjs)
    • Bücher
  • Jede Programmiersprache, exakt gleiche Vorgehensweise und Syntax

Viele Quarto Formate

Feature R Markdown Quarto
Basic Formats

html_document

pdf_document

word_document

html

pdf

docx

Beamer beamer_presentation beamer
PowerPoint powerpoint_presentation pptx
HTML Slides

xaringan

ioslides

revealjs

revealjs
Advanced Layout

tufte

distill

Quarto Article Layout

Viele Quarto Formate

Feature R Markdown Quarto
Cross References

html_document2

pdf_document2

word_document2

Quarto Crossrefs
Websites & Blogs

blogdown

distill

Quarto Websites

Quarto Blogs

Books bookdown Quarto Books
Interactivity Shiny Documents Quarto Interactive Documents
Journal Articles rticles Journal Articles
Dashboards flexdashboard Quarto Dashboards

Pause machen

Bitte steh auf und beweg dich. Lasst eure E-Mails in Frieden ruhen.

05:00

Versionskontrolle

Versionskontrolle mit Git und GitHub

Eine Möglichkeit, Dateien mit anderen zu teilen, damit sie:

  • Dateien herunterladen,
  • wiederverwenden,
  • Etwas beitragen können.

Du kannst den Verlauf von Dateien anzeigen und zu jedem beliebigen Zeitpunkt zu einer früheren Version zurückgehen.

Warum ist es nützlich?

Git und GitHub

  • Git ist eine Software zur Versionskontrolle
  • Erstellt im Jahr 2005
  • Beliebt bei Programmierern, die gemeinsam Code entwickeln
  • Verfolgt Änderungen in einer Gruppe von Dateien (Verzeichnis/Ordner/Repository)

  • GitHub is a hosting platform for version control using Git

  • Launched in 2008, aquired by Microsoft in in 2018, Microsoft for US$ 7.5 billion

  • 100 million Users (20.5 in 2022 alone) (October, 2023)

  • Social media for software developers

Ich bin dran: Ein Rundgang durch GitHub

Zurücklehnen und genießen!

Ihr seid dran: Klone ein Repository von GitHub

  1. Öffne einen Webbrowser auf deinem Laptop.
  2. Gehe zur Website des Kurses: rstatszh-k009.github.io/website/
  3. Falls noch nicht geschehen, füge die Website des Kurses zu deinen Lesezeichen hinzu.
  4. Klicke im Menü auf der linken Seite auf Modul 1
  5. In der Modulübersicht, scrolle nach unten zur Sektion “Zusatzaufgaben” und öffne “Zusatzaufgabe 1: Git configuration”
  6. Folge den Anweisungen auf der Website, um das Repository von GitHub zu klonen.
15:00

Zusatzaufgaben Modul 1

Modul 1 Dokumentation

Danke!

Danke! 🌻

Folien erstellt mit revealjs und Quarto: https://quarto.org/docs/presentations/revealjs/

Access slides als PDF auf GitHub

Alle Materialien sind lizenziert unter Creative Commons Attribution Share Alike 4.0 International.