Total geschaffene Stellen

Author

tfi84

Published

December 2, 2024

library(tidyverse)
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.1
✔ ggplot2   3.5.1     ✔ tibble    3.2.1
✔ lubridate 1.9.3     ✔ tidyr     1.3.1
✔ purrr     1.0.2     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(ggplot2)
library(knitr)
#devtools::install_github("statistikZH/statR")
library(statR)

Einleitung

Analyseziele

In diesem Projekt wird die Anzahl geschaffenen Stellen in den jeweiligen Bezirken des Kantons Zürich visualisiert und analysiert. Wie ist die Entwicklung der geschaffenen Stellen über die Jahre in den Bezirken? Gibt es Bezirke mit Signifikat mehr geschaffenen Stellen? Wie hoch ist die Volatilität?

Daten

Die Daten wurden vom Statistisches Amt des Kantons Zürich publiziert und enthalten die Total geschaffene Stellen (2. und 3. Sektor) im Kanton Zürich für die Jahre 2013 bis 2021. Die Statistik der Neugründungen erfasst nur tatsächlich - also «ex nihilo» - neu entstandene Unternehmen mit marktwirtschaftlicher Tätigkeit. Aus Fusionen, Übernahmen, Spaltungen oder Restrukturierungen hervorgegangene Unternehmen werden folglich nicht berücksichtigt. Werte < 4 werden nicht ausgewiesen.

Link: https://www.web.statistik.zh.ch/ogd/data/KANTON_ZUERICH_356.csv

data <- read_csv(here::here("daten/raw/KANTON_ZUERICH_356.csv"))
New names:
Rows: 1721 Columns: 12
── Column specification
──────────────────────────────────────────────────────── Delimiter: "," chr
(8): GEBIET_NAME, THEMA_NAME, SET_NAME, SUBSET_NAME, INDIKATOR_NAME, IND... dbl
(3): BFS_NR, INDIKATOR_ID, INDIKATOR_JAHR lgl (1): ...12
ℹ Use `spec()` to retrieve the full column specification for this data. ℹ
Specify the column types or set `show_col_types = FALSE` to quiet this message.
• `` -> `...12`
data_reduziert <- data |> 
  select(BFS_NR, GEBIET_NAME, INDIKATOR_JAHR, INDIKATOR_VALUE) |> 
  rename(Jahr = INDIKATOR_JAHR, Stellen = INDIKATOR_VALUE, Gebiet = GEBIET_NAME) |> # Spalten werden umbenannt
  mutate(Stellen = ifelse(Stellen == "null", 0, Stellen)) |> # konvertiert Wert null in 0
  mutate(Stellen = as.numeric(Stellen)) |>  # Konvertierung zu numerisch
  filter(!is.na(Stellen)) |> # Filtert NA raus
  filter(!str_detect(Gebiet, "bis")) |> # Filtert Gemeinde welche Fusioniert haben raus
  filter(str_detect(Gebiet, "Bezirk")) # Filtern nur auf Bezirke


write_csv(x = data_reduziert, 
          here::here("daten/processed/daten_reduziert.csv"))
Bezirk <-"Bezirk Pfäffikon"
titel_zeitreihe_spez <- paste("Entwicklung der Stellen in", Bezirk,"über die Jahre")

# Daten aufbereiten
data_zf_stat <- data_reduziert |> 
  group_by(Gebiet) |> 
  summarise(
    Durchschnitt_Stellen = mean(Stellen, na.rm = TRUE),
    Max_Stellen = max(Stellen, na.rm = TRUE),
    Min_Stellen = min(Stellen, na.rm = TRUE)
  ) |> 
  arrange(desc(Durchschnitt_Stellen))

Ergebnisse

Verteilung der Anzahl Stellen pro Jahr

In Figure 1 sind die Anzahl Stelle pro Jahr dargestellt. Es ist erkennbar ist das der Median relativ stabil war über die anlysierten Jahre.

# Boxplot für die Verteilung der Stellen nach Jahr
ggplot(data_reduziert, aes(x = as.factor(Jahr), y = Stellen)) +
  geom_boxplot(fill = "#3F98CC") +
  scale_y_continuous(trans='log10')+
  labs(title = "Verteilung der Stellen nach Jahr",
       x = "Jahr",
       y = "Anzahl Stellen") +
  theme_stat()
Figure 1

Anzahl Stelle pro Bezirk

In Figure 2 sind die Anzahl Stelle pro Jahr und Bezirk dargestellt. Der Bezirk Zürich schafft rund vier Mal so viele Stellen wie der nachfolgenden Bezirk Winterthur.

# Visualisierung: Balkendiagramm der Gebiete
ggplot(data_reduziert, aes(x = Jahr, y = Stellen, color = Gebiet)) +
  geom_point() +
  geom_line() +
  scale_x_continuous(breaks = unique(data_reduziert$ Jahr))+
  scale_y_continuous(trans='log10')+
  labs(title = "Gebiete nach Anzahl Stellen pro Jahr",
       x = "Anzahl Stelle",
       y = "Jahr") +
  theme_stat()
Figure 2

Gebiete nach durchschnittlichen Stellen

In @tbl-durchschnitt_stelle_gebiet sind die Bezirke mit den Werten dem durchschnittlichen Stellenzuwachs in den Jahren 2013-2021 und dem maximalen, wie auch minimalen Stellenzuwachs ersichtlich. Wobei bei den Stadtbezirken die Differenz zwischen den höchsten und tiefsten Wert relativ klein ist und bei den ländlichen Bezirken eine höheren Volatilität erkennbar ist.

# Tabelle erstellen
#kable (data_zf_stat, caption = "<font size= 4, color= #000000>Gebiete nach durchschnittlichen Stellen</font>")
data_zf_stat |> 
  gt::gt() |> 
  gt::fmt_number(decimals = 1)
Table 1: Gebiete nach durchschnittlichen Stellen
Gebiet Durchschnitt_Stellen Max_Stellen Min_Stellen
Bezirk Zürich 4,441.6 4,635.0 4,219.0
Bezirk Winterthur 944.6 971.0 922.0
Bezirk Bülach 879.7 1,028.0 731.0
Bezirk Uster 782.3 865.0 700.0
Bezirk Meilen 659.4 721.0 560.0
Bezirk Horgen 641.7 747.0 539.0
Bezirk Dietikon 599.0 640.0 541.0
Bezirk Dielsdorf 505.4 584.0 425.0
Bezirk Hinwil 470.3 531.0 401.0
Bezirk Pfäffikon 282.1 321.0 224.0
Bezirk Affoltern 244.1 319.0 182.0
Bezirk Andelfingen 135.6 160.0 107.0

Entwicklung der Stelle im Bezirk Pfäffikon über die Jahre

Die @fig-entwicklung_stellen_pro_gebiet zeit die Entwicklung der neu geschaffenen Stelle für den Bezirk Pfäffikon.

Bezirk <-"Bezirk Pfäffikon"
titel_zeitreihe_spez <- paste("Entwicklung Stellen in", Bezirk,"über die Jahre")

# Zeitreihenanalyse für ein spezifisches Gebiet
data_bezirk <- data_reduziert |> 
  filter(Gebiet == Bezirk) |> 
  arrange(Jahr)

ggplot(data_bezirk, aes(x = Jahr, y = Stellen, color = Gebiet)) +
  geom_line() +
  geom_point() +
  scale_x_continuous(breaks = unique(data_reduziert$ Jahr))+
  labs(title = titel_zeitreihe_spez ,
       x = "Jahr",
       y = "Anzahl Stellen") +
  theme_stat()
Figure 3

Schlussfolgerungen

  • Höhere Volatilität in Bezirken mit ländlichen Regionen

  • Bezirk Zürich schafft über vier Mal mehr Stelle wie jeder andere Bezirk