Google Mobility
Niveau 2
Cartographier l’évolution de la mobilité durant la pandémie
Préparation
- Créer un dossier à la racine de votre ordinateur, puis un projet R correspondant à ce dossier.
- Ouvrez un nouveau script que vous nommerez
google.R
.
- Ouvrez un nouveau script que vous nommerez
- Importez le package tidyverse.
- Rendez-vous sur cette page et lisez la documentation.
- Téléchargez le CSV pour le monde entier dans le dossier que vous venez de créer.
Importation
Importez les données à l’aide de la fonction vroom
du package du même nom, avec la syntaxe vroom::vroom
. Assignez les à un objet nommé google.
Inspection
- Regardez ce qu’elles contiennent à l’aide de la fonction
glimpse
.
filter
- À l’aide de la fonction
filter
du package dplyr, sélectionnez uniquement :- les observations au niveau national, et non infranational.
- les pays suivants : Allemagne, Pays-Bas, France, Danemark, Italie, Espagne.
- les observations situées entre le 1er mars 2020 et le 1er juin 2020.
- Assignez le résultat à un objet nommé europe_subset.
- À l’aide du package ggplot2 et en particulier de la fonction
geom_line
, visualisez l’évolution temporelle de la fréquentation des espaces verts (variable parks…) et du temps passé chez soi (residential…) dans les 6 pays sélectionnés Vous pourrez utiliser la fonctionfacet_wrap
afin de créer un graphique distinct pour chaque pays.
summarise
- Repartez de l’objet google.
- Sélectionnez uniquement :
- les observations au niveau national, et non infranational.
- les observations situées entre le 1er mars 2020 et le 1er juin 2020.
- En utilisant successivement les fonctions
group_by
etsummarise
, calculez l’évolution moyenne de la fréquentation des espaces verts (variable parks…) pour chaque pays. - À l’issue de cette opération, vous obtenez normalement un tableau contenant deux variables, et autant de lignes qu’il y a de pays. Assignez ce résultat à un objet nommé google_countries.
Cartographie
- À l’aide du package giscor, obtenez un objet sf représentant les frontières de l’ensemble des pays du monde.
- Reprojetez le en Eckert 4 à l’aide de la fonction
st_transform
du package sf. - Assignez le résultat à un objet nommé countries.
- À l’aide de la fonction
left_join
, combinez le dataframe/objet sf countries et le dataframe google_countries. - Choisissez une discrétisation adaptée à l’aide de la fonction
classInt::classIntervals
. - Cartographiez l’évolution de la fréquentation des espaces verts dans le monde au printemps 2020 en utilisant les 3 fonctions suivantes :
ggplot
,geom_sf
,scale_fill_viridis_b
.
Obtenir de l’aide
- Pour obtenir de l’aide sur une fonction directement depuis R, tapez
?
suivi du nom de la fonction. Il se peut qu’un même nom renvoie à des fonctions différentes, appartenant à des packages différents. Par exemple,?filter
renvoie deux résultats. Pour éviter toute ambiguïté, vous pouvez utiliser la syntaxepackage::function
, par exemple :?dplyr::filter
. - Les sites des packages contiennent de très nombreux exemples. Il est vivement conseillé de les consulter.
- Deux livres en accès libre sont particulièrement précieux lorsqu’on débute (et même au-delà) : Introduction à R et au tidyverse de Julien Barnier et R for Data Science de Hadley Wickham (auteur du package tidyverse).
- En particulier, le chapitre Les Verbes de dplyr est une lecture utile.
- Pour celles et ceux qui étaient absents à la séance 3, il sera utile de lire la section Tests et comparaisons de Introduction à R et au tidyverse.
- De même, pour celles et ceux qui auraient du mal avec le pipe (
|>
ou%>%
), il est utile de lire la section correspondante.