Chaînes de caractères

Packages et fonctions utiles pour manipuler du texte
Manipuler
Auteur·rice
Date de publication

30 septembre 2023

Modifié

3 février 2025

Remplacer tous les accents

Pour remplacer tous les accents par des caractères non accentués, dans toutes les langues :

x <- c("soñar", "camión", "égoïste")
stringi::stri_trans_general(x, "Latin-ASCII")
[1] "sonar"   "camion"  "egoiste"

Nettoyage à options

Astuce

Penser au package fedmatch, et notamment à sa (très rapide) fonction clean_strings

Citation

BibTeX
@online{boulakia2023,
  author = {Boulakia, Théo},
  title = {Chaînes de caractères},
  date = {2023-09-30},
  url = {https://tblk.github.io/data-tips/chaines-de-caracteres/},
  langid = {fr}
}
Veuillez citer ce travail comme suit :
Boulakia, Théo. 2023. “Chaînes de caractères.” September 30, 2023. https://tblk.github.io/data-tips/chaines-de-caracteres/.