Océrisation

Installation et utilisation de tesseract
Récolter
Auteur·rice
Date de publication

20 octobre 2023

Modifié

26 janvier 2024

Voir le site de la librairie, la page github du package R et celle du plugin Zotero.

Installation Ubuntu

Vérifier s’il n’est pas déjà installé :

tesseract -v

Si ce n’est pas le cas :

sudo apt install tesseract-ocr # installe aussi le paquet anglais
sudo apt install tesseract-ocr-fra # installe le paquet français
sudo apt install libtesseract-dev # developper tools : nécessaires pour installer le package R

Installation du package R

tesseract dépend de pdftools, qui requiert l’installation de poppler. D’où :

sudo apt install libpoppler-cpp-dev

Puis :

install.packages("pdftools")

Si on a oublié l’installation des developper tools, il est nécessaire de les installer. Ceci marche également :

sudo apt install libtesseract-dev libleptonica-dev

Enfin :

install.packages("tesseract")

Installation du plugin Zotero

Depuis le fichier .xpi, tout simplement.

Citation

BibTeX
@online{boulakia2023,
  author = {Boulakia, Théo},
  title = {Océrisation},
  date = {2023-10-20},
  url = {https://tblk.github.io/data-tips/ocerisation/},
  langid = {fr}
}
Veuillez citer ce travail comme suit :
Boulakia, Théo. 2023. “Océrisation.” October 20, 2023. https://tblk.github.io/data-tips/ocerisation/.