```{r}
library(tidyverse)
```
Abschlussprojekt
Daten auswählen
Am Ende des Kurses steht ein Abschlussprojekt in welchem ihr die Möglichkeit bekommt mit einem Datensatz eurer Wahl zu arbeiten und die im Kurs erlernten Methoden und Techniken anzuwenden und zu vertiefen. Die Auswahl des Datenprojekts ist frei, es sollte jedoch ein Datensatz sein, welcher öffentlich geteilt werden kann. Dies bedeutet nicht zwingend, dass der Datensatz als OGD Ressource im Datenkatalog verfügbar sein muss, aber es sollte die Möglichkeit bestehen, dass dieser über GitHub geteilt werden kann.
Dazu gibt es bei der Auswahl des Datensatzes folgendes zu beachten:
Nicht schützenswerte Daten
Auf Grundlage des Gesetzes über die Information und den Datenschutz (IDG) dürfen Verwaltungseinheiten und Organe des Kantons Zürich nicht schützenswerte Daten, die unter ihrer Hoheit stehen, als offene Behördendaten publizieren.
‘Nicht schützenswert’ bedeutet, dass die bereitgestellten Daten:
- nicht die Privatsphäre verletzen
- nicht sicherheitskritisch sind und
- keinen Drittrechten (wie zum Beispiel Copyrights) unterliegen.
Info entnommen aus: https://www.zh.ch/de/politik-staat/opendata/leitlinien.html#-932898780
Daten auswählen
Folgende Fragen stellen sich:
Habe ich Daten welche die oben genannten Kriterien erfüllen?
Habe ich ein bestimmtes Ziel für das Arbeiten mit diesen Daten?
Falls keine “nicht schützenswerten” Daten zur Verfügung stehen, kann ein offener Datensatz genutzt werden. Dazu gibt es den Datenkatalog des Kantons Zürich und andere offene Datenquellen, welche in Zusatzaufgabe 1: Ressourcen für OGD im Kanton Zürich beschrieben sind.
Daten Struktur & Leitlinien
Die Daten müssen nicht bereits in den vorgegeben Kriterien der Leitlinien des Kantons Zürich für einfach nutzbare Behördendaten vorliegen. Das Abschlussprojekt selbst könnte auch die Aufbereitung beinhalten und somit die Daten in ein Format bringen, welches den Leitlinien entspricht.
Arbeitsschritte
Schritt 1: Erstelle ein neues Repository auf GitHub & clone es in die Posit Cloud
Öffne die GitHub Organisation für den Kurs https://github.com/rstatszh-k009
Rechts neben dem Feld “Find a repository” klicke auf den grünen “New” Button.
Im Feld “Repository name” schreibe
projekt-USERNAME
. Ersetze USERNAME durch deinen GitHub Benutzernamen. Vermeide Leerzeichen.Skrolle auf der gleichen Seite nach unten und klicke auf “Create repository”.
Im Feld “Quick setup” klicke auf das Clipboard neben der HTTPs URL.
Öffne den rstatszh-k009 Arbeitsbereich (Workspace) auf posit.cloud
Klicke auf “New Project” > “New Project from Git Repository”
Füge die HTTPS-URL von GitHub in das Feld “URL of your Git Repository” ein. Beachte: Stelle sicher, dass die Box unter Packages ein Häkchen gesetzt hat.
Warte, bis das Projekt bereitgestellt wurde.
Schritt 2: Erstelle neue Ordner
Im Datei Manager im Fenster unten rechts, klicke auf “Folder” um einen neuen Ordner zu erstellen.
Benenne den Ordner
daten
.Klicke auf den Ordner
daten
im Datei Manager im Fenster unten rechts.Erstelle einen weiteren Ordner
raw
im Ordnerdaten
.Klicke auf den Ordner
raw
im Datei Manager im Fenster unten rechts.
Schritt 3: Daten hochladen
- Verwende den Datei Manager im unteren rechten Fenster, um die identifizierten Daten aus Aufgabe 1 in den
raw
Ordner hochzuladen. Für detaillierte Schritte, siehe Zusatzaufgabe 2 aus Modul 3.
Schritt 4: Quarto Datei erstellen
- Navigiere zurück zum Hauptverzeichnis deines Projekts, indem du auf den blauen R-Würfel klickst.
2. Erstelle einen neuen Ordner docs
im Hauptverzeichnis deines Projekts.
Klicke auf den Ordner
docs
.Erstelle ein neues Quarto-Dokument und speichere es als
index.qmd
imdocs
-Ordner.
Lösche den Inhalt des Quarto-Dokuments bis auf die YAML Metadaten zu Beginn des Dokuments.
Erstelle die folgenden Abschnitte in deinem Quarto-Dokument:
- Einleitung (formatiert als Heading 1)
- Daten (formatiert als Heading 2)
- Analyseziele (formatiert als Heading 2)
- Daten Aufbereitung (formatiert als Heading 1)
- Daten Visualisierung (formatiert als Heading 1)
- In der Einleitung, beschreibe kurz das Projekt, die Daten, und deine Analyseziele.
Schritt 5: R-Pakete laden und Daten importieren
- Vor der Einleitung, füge einen Code-Block hinzu und schreibe
library(tidyverse)
um die R-Pakete zu laden, welche du in diesem Kurs gelernt hast.
- Importiere deine Daten, indem du den folgenden Code in einem weiteren Code-Block schreibst (in diesem Beispiel verwenden wir eine CSV-Datei):
```{r}
read_csv(here::here("daten/raw/your-file-name.csv"))
```
here
Wir empfehlen das R-Paket here
zu verwenden, um auf Dateien in deinem Projekt zu verweisen. Das here
R-Paket hilft dabei, den richtigen Dateipfad zu deinen Daten zu finden. Wir werden Dateipfade und das Paket selbst in einem anderen Modul besprechen.
Schritt 6: Übertrage deine Änderungen auf GitHub
Überprüfe ob dein Projekt den gleichen Aufbau hat wie das Projekt von Rainbow Train: https://github.com/rstatszh-k009/projekt-rainbow-train
Falls der Aufbau nicht übereinstimmt, nehme nochmals Veränderungen vor.
Sobald du den Aufbau abgeschlossen hast, navigiere zum Git-Bereich im Fenster oben rechts.
Aktiviere die Kontrollkästchen neben allen Dateien, um sie für den Commit vorzubereiten.
Klicke auf die Schaltfläche “Commit”.
Gib eine Commit-Nachricht in das Feld “Commit Message” ein (z.B. Projekt aufsetzen).
Klicke auf die Schaltfläche “Commit”. Das Fenster, welches sich daraufhin öffnet kann geschlossen werden.
Klicke auf die Schaltfläche “Push”.
Gib deinen GitHub-Benutzernamen im Feld Username an.
Gib deinen GitHub Personal Access Token (PAT) im Feld “Password” ein.
Das Fenster kann geschlossen werden.
Schritt 7: Eröffne ein Issue auf GitHub
Öffne github.com in deinem Browser.
Navigiere zur GitHub-Organisation für den Kurs: github.com/rstatszh-k009
Finde das Repository projekt-USERNAME, das mit deinem GitHub-Benutzernamen endet.
Klicke auf die Schaltfläche “Issues”.
Klicke auf die grüne Schaltfläche “New issue”.
Schreibe in das Feld “Title”: “Daten für das Abschlussprojekt ausgewählt”.
Markiere im Feld “Leave a comment” den Kursleiter mit @larnsce und hinterlasse mir ein Kommentar, falls du möchtest.