Présentation
Pandoc est un logiciel libre de conversion de documents numériques en ligne de commande. Il a été créé en 2006 par John MacFarlan, qui l’a développé en Haskell, un langage de programmation fonctionnel. Pandoc est publié sous licence GPL, c’est-à-dire qu’il est un logiciel libre pouvant être utilisé gratuitement, partagé et modifié.
Le logiciel, disponible uniquement en anglais, peut être installé sur Windows, macOS, Linux, Chrome OS et BSD. Il est hébergé sur GITHub.
S’il permet de convertir vers et depuis de multiples formats, sa puissance réside dans l’automatisation de tâches et la possibilité d’utiliser des modèles afin d’obtenir des conversions en lot efficaces.
Parmi les formats pris en charge par le logiciel, on compte les formats de balisage légers comme le Markdown, les formats HTML, les formats de traitement de texte, par exemple Microsoft Word ou OpenOffice, des formats de mise en page comme InDesign, des formats de documentation, de balisage Wiki, de diaporama, mais également des formats de données, comme les tableaux CSV ou encore des formats bibliographiques et, bien évidemment, les formats TeX, tels que LaTeX.
Créer des documents
Considéré comme le « couteau suisse de l’édition », le programme de ligne de commande autonome doit tout d’abord être téléchargé. Pandoc ne possède pas d’interface utilisateur graphique, il ne va donc pas s’afficher comme un programme informatique classique, avec une icône sur laquelle cliquer et affichant ensuite une interface de travail spécifique. À la place, et une fois les bibliothèques d’utilisation et les modules installés, il s’agit pour l’utilisateur.rice d’effectuer des « commandes » à partir d’instructions textuelles depuis une fenêtre de terminal.
Par exemple, pour convertir un fichier texte vers du HTML, il suffira à l’utilisateur.rice d’inscrire, dans la fenêtre de terminal, la commande suivante : pandoc nomdufichier.txt -o nomdufichier.html
Les options de commande sont très variées, permettant par exemple d’associer un fichier CSS ou des références bibliographiques au document d’origine.
Pandoc et le Markdown
Le Markdown est un format de balisage léger particulièrement populaire et très bien pris en charge par Pandoc. Ce format est notamment préféré dans la rédaction de contenus académiques, avec le support, notamment, des références bibliographiques, des tableaux, des notes de bas de page ou encore des formules mathématiques ou d’une liste de définitions.
Ainsi, si le Markdown sert généralement à fabriquer un fichier HTML, son utilisation sous Pandoc permettra de générer des documents complets dans tous les formats habituellement pris en charge par Pandoc.
Les modèles
Pandoc peut utiliser un modèle dont le but est principalement de définir une architecture de document ainsi qu’une mise en page spécifique. Ces modèles sont particulièrement utiles dans l’automatisation des tâches de création ou de conversion de documents.
Les modèles sous Pandoc permettent notamment d’inclure des variables ajoutant des informations à n’importe quel endroit d’un document.
Quelques réalisations
- La maison d’édition associative Abrüpt utilise Pandoc pour convertir un texte source brut en de nombreux formats (PDF, EPUB, HTML) dans le but de produire ses ouvrages numériques et papier.
- Pandoc Scholar permet la création de plusieurs formats de documents adaptés aux manuscrits universitaires. Contrairement à Pandoc, qui ne gère pas directement les métadonnées, Pandoc Scholar permet d’inclure celles-ci en les ajoutant dans l’entête des documents. Pandoc Scholar autorise également l’exportation des entrées en JSON-LD, un format standardisé pour le web sémantique.