Google Mobility

Niveau 2
Cartographier l’évolution de la mobilité durant la pandémie
Date de rendu

23 octobre 2024

Préparation

  • Créer un dossier à la racine de votre ordinateur, puis un projet R correspondant à ce dossier.
    • Ouvrez un nouveau script que vous nommerez google.R.
  • Importez le package tidyverse.
  • Rendez-vous sur cette page et lisez la documentation.
  • Téléchargez le CSV pour le monde entier dans le dossier que vous venez de créer.

Importation

Importez les données à l’aide de la fonction vroom du package du même nom, avec la syntaxe vroom::vroom. Assignez les à un objet nommé google.

Inspection

  • Regardez ce qu’elles contiennent à l’aide de la fonction glimpse.

filter

  • À l’aide de la fonction filter du package dplyr, sélectionnez uniquement :
    • les observations au niveau national, et non infranational.
    • les pays suivants : Allemagne, Pays-Bas, France, Danemark, Italie, Espagne.
    • les observations situées entre le 1er mars 2020 et le 1er juin 2020.
  • Assignez le résultat à un objet nommé europe_subset.
  • À l’aide du package ggplot2 et en particulier de la fonction geom_line, visualisez l’évolution temporelle de la fréquentation des espaces verts (variable parks…) et du temps passé chez soi (residential…) dans les 6 pays sélectionnés Vous pourrez utiliser la fonction facet_wrap afin de créer un graphique distinct pour chaque pays.

summarise

  • Repartez de l’objet google.
  • Sélectionnez uniquement :
    • les observations au niveau national, et non infranational.
    • les observations situées entre le 1er mars 2020 et le 1er juin 2020.
  • En utilisant successivement les fonctions group_by et summarise, calculez l’évolution moyenne de la fréquentation des espaces verts (variable parks…) pour chaque pays.
  • À l’issue de cette opération, vous obtenez normalement un tableau contenant deux variables, et autant de lignes qu’il y a de pays. Assignez ce résultat à un objet nommé google_countries.

Cartographie

  • À l’aide du package giscor, obtenez un objet sf représentant les frontières de l’ensemble des pays du monde.
  • Reprojetez le en Eckert 4 à l’aide de la fonction st_transform du package sf.
  • Assignez le résultat à un objet nommé countries.
  • À l’aide de la fonction left_join, combinez le dataframe/objet sf countries et le dataframe google_countries.
  • Choisissez une discrétisation adaptée à l’aide de la fonction classInt::classIntervals.
  • Cartographiez l’évolution de la fréquentation des espaces verts dans le monde au printemps 2020 en utilisant les 3 fonctions suivantes : ggplot, geom_sf, scale_fill_viridis_b.

Obtenir de l’aide

  • Pour obtenir de l’aide sur une fonction directement depuis R, tapez ? suivi du nom de la fonction. Il se peut qu’un même nom renvoie à des fonctions différentes, appartenant à des packages différents. Par exemple, ?filter renvoie deux résultats. Pour éviter toute ambiguïté, vous pouvez utiliser la syntaxe package::function, par exemple : ?dplyr::filter.
  • Les sites des packages contiennent de très nombreux exemples. Il est vivement conseillé de les consulter.
  • Deux livres en accès libre sont particulièrement précieux lorsqu’on débute (et même au-delà) : Introduction à R et au tidyverse de Julien Barnier et R for Data Science de Hadley Wickham (auteur du package tidyverse).
  • En particulier, le chapitre Les Verbes de dplyr est une lecture utile.
  • Pour celles et ceux qui étaient absents à la séance 3, il sera utile de lire la section Tests et comparaisons de Introduction à R et au tidyverse.
  • De même, pour celles et ceux qui auraient du mal avec le pipe ( |> ou %>%), il est utile de lire la section correspondante.