Chaînes de caractères

Packages et fonctions utiles pour manipuler du texte
Manipuler
Auteur·rice
Date de publication

30 septembre 2023

Modifié

26 janvier 2024

Remplacer tous les accents

Pour remplacer tous les accents par des caractères non accentués, dans toutes les langues :

x <- c("soñar", "camión", "égoïste")
stringi::stri_trans_general(x, "Latin-ASCII")
[1] "sonar"   "camion"  "egoiste"

Nettoyage à options

Astuce

Penser au package fedmatch, et notamment à sa (très rapide) fonction clean_strings

Citation

BibTeX
@online{boulakia2023,
  author = {Boulakia, Théo},
  title = {Chaînes de caractères},
  date = {2023-09-30},
  url = {https://tblk.github.io/data-tips/chaines-de-caracteres/},
  langid = {fr}
}
Veuillez citer ce travail comme suit :
Boulakia, Théo. 2023. “Chaînes de caractères.” September 30, 2023. https://tblk.github.io/data-tips/chaines-de-caracteres/.