Présentation

Mathilde Verstraete est candidate au doctorat en humanités numériques à l’Université de Montréal. Après l’obtention d’un master en langues et lettres classiques à l’Université Catholique de Louvain, en Belgique, elle intègre la Chaire de recherche du Canada sur les écritures numériques (CRCEN) et prend la coordination du projet d’édition numérique collaborative de l’Anthologie grecque. Sous la direction de Marcello Vitali-Rosati et d’Elsa Bouchard, elle effectue ses recherches sur les potentialités de réception du manuscrit de l’Anthologie grecque à l’ère du numérique. 

Qu’est-ce que l’Anthologie grecque ?

L’Anthologie grecque est un large recueil nous livrant la poésie épigrammatique grecque.

L’épigramme est un genre littéraire : il s’agit d’un court poème qui avait pour objectif premier d’être inscrit (cette information se trouve dans le nom même du genre : « épi » signifie « sur » et « gramma » « caractère », on grave un caractère sur une surface). À l’origine donc, il s’agissait d’une simple inscription en prose qui accompagnait une dédicace, un ex-voto ou une épitaphe. Peu à peu, vers le VIe siècle av. J.-C., ces inscriptions se versifient, et les sujets abordés deviennent de plus en plus variés (épigrammes amoureuses, satiriques ou sous forme d’énigmes…). Le genre se caractérise par sa brièveté et par l’argutia, concept latin qui désigne une pointe, ingénieuse, piquante, humoristique (ou les trois à la fois), apparaissant à la fin du poème.

Les épigrammes sont rassemblées en anthologies (là encore, l’étymologie est éloquente : « antho- » signifie « fleur » et « logie », dans ce cas, « rassemblement »), la plus célèbre étant sans doute l’Anthologie grecque. Celle-ci est composée de 16 livres, classés par sujets. Il y en a pour tous les goûts : par exemple, le premier livre contient des épigrammes chrétiennes tandis que le livre V rassemble des épigrammes amoureuses et érotiques. 

Sur le plan matériel, il importe de distinguer l’Anthologie grecque de l’Anthologie palatine. Ce que l’on appelle Anthologie grecque correspond principalement à la réunion de l’Anthologie palatine et de l’Appendix Planudea.

L’Anthologie palatine est un manuscrit grec, daté de 940 apr. J.-C., (re)découvert au XVIe siècle dans la bibliothèque palatine de Heidelberg, en Allemagne : d’où le nom donné au manuscrit ! 

Le manuscrit de l’Anthologie palatine comprend environ 3700 épigrammes, écrites par près de 325 auteur.es différent.es entre le début de la période classique et la fin de la période byzantine, donc près de 16 siècles de littérature. 

L’Appendix Planudea, d’autre part, est composée de quelque 300 épigrammes présentes dans l’Anthologie de Planude (Planude étant un érudit byzantin du XIIIe siècle) mais absentes de l’Anthologie palatine. 

Le corpus de l’Anthologie grecque est particulièrement vaste et riche. Par définition, une anthologie se caractérise par la reprise et le regroupement de plusieurs sources, par un enrichissement continu. L’Anthologie grecque résulte de la composition de nombreuses anthologies avant elle ! 

Il y a donc plusieurs anthologies ? 

Bien sûr! L’Anthologie grecque est, en quelque sorte, une anthologie d’anthologies. Ses compilateurs se sont basés sur plusieurs sources, elles-mêmes successivement enrichies et reconfigurées. ll y a toujours l’idée de récupération, d’amélioration et d’augmentation du corpus.

Parmi les anthologies plus anciennes, il y a celle de Constantin Céphalas, composées vers 900 apr. J.-C., elle-même composée à partir des Couronnes de Méléagre (Ier siècle av. J.-C.), de Philippe (Ier siècle apr. J.-C.), de Diogénien (IIe siècle apr. J.-C.) ou encore du Cycle d’Agathias (au VIe siècle apr. J.-C.). Elles sont toutes différentes, par leur contenu et leur organisation. 

exemple d’épigramme de l’Anthologie grecque

Quels sont les objectifs du projet et quel est ton rôle en tant que coordinatrice?

Le projet « Anthologie grecque » propose une édition numérique collaborative de l’Anthologie grecque. Il s’agit d’une édition de l’ensemble du corpus, où chacune des épigrammes est considérée comme une entité. Concrètement, chaque épigramme possède une page, sur laquelle les éditeurs et éditrices peuvent ajouter le texte grec, l’image correspondante du manuscrit, mais aussi des traductions (en plusieurs langues, amateurs ou « érudites »), des commentaires, des informations concernant les auteurs, les dates et des mots-clés — sous forme de métadonnées liées à Wikidata.

Le but du projet est de rendre la plateforme accessible à un public large et varié, mais également de « gommer » cette distinction entre les spécialistes (philologues, linguistes, etc.) à qui sont généralement réservées les éditions critiques, et les curieux, c’est-à-dire toute personne intéressée par le texte. Jusqu’à présent, plusieurs étudiant.es à la CRCEN, mais aussi des étudiant.es à la maîtrise ont participé à ce projet : ils et elles éditent et annotent le manuscrit. On a aussi eu des classes de lycées italiens, sous la supervision de leur professeur.es. Ces lycées ont réalisé des traductions, des alignements entre les textes grecs et italiens et ont ajouté des mots-clés : iels ont réalisé un travail remarquable. Notre souhait est véritablement d’ouvrir cette plateforme à une collaboration la plus large possible. 

En ce qui me concerne, j’ai intégré la Chaire de recherche du Canada sur les écritures numériques pour prendre la coordination du projet Anthologie grecque il y a tout juste un an. Mon travail de coordinatrice me demande d’avoir une vision d’ensemble de l’état du projet. D’un point de vue éditorial, je suis le travail des éditeur.trices : nous nous rencontrons toutes les deux semaines pour constater l’avancement de l’édition et pour échanger sur les éventuelles difficultés rencontrées. Un exemple récent concerne le traitement des didascalies en milieu de texte : pour quelques rares épigrammes, le manuscrit a le texte grec, des scholies en marge et des didascalies au sein même du poème. Les diverses éditions critiques éditent cela différemment : les didascalies font-elles partie de l’épigramme? S’agit-il d’éléments comparables aux scholies? Ces rencontres permettent de construire une réflexion collaborative sur ce genre de questions précises et propres à certaines épigrammes. 

La coordination du projet me demande en outre de gérer plusieurs partenariats. J’ai mentionné les lycées italiens plus haut, mais nous avons également des échanges avec la bibliothèque de Heidelberg où est conservé le manuscrit. Celui-ci est disponible numériquement et nous avons mis en place la possibilité de l’annoter directement sur le site de la bibliothèque grâce aux standards iiif (un protocole permettant l’interopérabilité des images sur le Web). Cet accord facilite grandement le travail des éditeur.trices et permet d’importer les annotations sur notre plateforme grâce à quelques lignes de code. 

Enfin, je réfléchis également à la direction éditoriale du projet, aux améliorations possibles et souhaitables. Ces développements sont mis en place avec le chercheur principal, Marcello Vitali-Rosati, et une équipe de développeurs que nous rencontrons une fois par semaine. 

Enfin, je suis disponible pour répondre aux éventuelles questions et requêtes par rapport au projet. Récemment, un chercheur nous a approchés, car il avait besoin d’une grande quantité d’images de manuscrits grecs et de leur transcription. Nous avons ajouté cette fonctionnalité à notre API (une API est une interface qui nous permet de communiquer, de faire des requêtes avec notre base de données). 

Pour résumer, le rôle de coordinatrice est très vaste, mais aussi très stimulant. 

Quel est l’intérêt d’une édition collaborative, par rapport à une édition critique?

Pour rappel, une édition critique d’un texte ancien vise à éditer le texte de manière à en retrouver sa forme originale (altérée au fil des nombreuses copies), le texte qu’a effectivement écrit l’auteur. Pour ce faire, les philologues comparent les différents manuscrits en leur possession (c’est ce qu’on appelle la collation), analysent les variantes et décident laquelle est la plus probable. Les variantes sont alors notées dans un apparat critique : il s’agit, en quelque sorte, de notes où l’éditeur peut rendre compte de ce que comportent les autres manuscrits. 

Ces éditions sont primordiales et très riches, mais là n’est pas notre but. La différence principale est que nous ne voulons pas retrouver la vérité du texte original, mais bien prendre en compte la multiplicité des versions d’un texte, d’une épigramme; multiplicité de lectures, de traductions, de références externes quelles qu’elles soient… Les éditions critiques sont bien entendu une source non négligeable pour notre édition, mais nous n’avons pas pour ambition d’en produire une.

Pour ce faire, nous avons mis en place une édition collaborative, permettant à chacun.e, quelle que soit sa connaissance du texte ou les langues qu’iel maîtrise, d’ajouter sa pierre à l’édifice. La collaboration permet d’inclure de nouveaux publics dans la démarche scientifique et elle rend ce corpus accessible. Les éditions critiques, avec leurs nombreuses notes et leur apparat critique écrit en latin, sont plutôt réservées à un public averti. 

Comment la plateforme pense-t-elle cet ensemble d’épigrammes? 

À la base de la plateforme, les épigrammes sont indexées. Concrètement, on retrouve les liens de chacune des épigrammes sous le livre dont elle fait partie. 

Le projet en réalité est né de cette absence d’indexation et d’accessibilité des épigrammes : Marcello Vitali-Rosati cherchait alors une épigramme précise, sans succès. Il devait donc soit relire l’intégralité des seize livres qui composent l’Anthologie grecque, soit abandonner la recherche de cette épigramme. Prendre en compte ce besoin d’indexation a donc été très important. 

Il est possible de retrouver une épigramme par son numéro, via une liste sur le menu principal, mais aussi par leur auteur ou par divers types de mots-clés. 

capture d’écran de la navigation par épigramme

Pourquoi avoir choisi une édition numérique?

L’édition numérique permet plus facilement de rendre compte de la structure anthologique qu’une édition papier. La structure du Web de manière générale se rapproche beaucoup du modèle anthologique. En effet, il est possible de faire des liens, d’ajouter des références internes (donc au sein de l’Anthologie, entre plusieurs épigrammes), mais aussi externes, vers des liens divers – les liens hypertextes faisant office d’intertextualité. 

Ces liens, renvois, dialogues, sont présents dans les éditions imprimées, mais le geste est tout autre et plus complexe : il y a des notes de bas de page qui renvoient à d’autres épigrammes. Cependant, la vue d’ensemble n’est pas aussi évidente; l’édition des Belles Lettres, par exemple, compte 13 tomes, publiés entre 1929 et 1994, par 14 auteur.es ! 

Est-ce que l’intelligence artificielle pourrait apporter quelque chose à ce travail? 

Bonne question. Nous lançons sous peu un projet pilote qui utilise intelligence artificielle, développement algorithmique et apprentissage automatique : Anthalgo

Ce projet a pour but de développer des algorithmes dans le but de redéfinir des concepts littéraires. Nous analyserons plus particulièrement le concept de variation au sein du corpus anthologique. 

La variation est un concept littéraire assez commun dans les études classiques. C’est lorsqu’un auteur va reprendre une composition d’un de ses contemporains ou d’un auteur antérieur et va l’améliorer, la modifier, l’adapter en fonction de son propre style. Ce concept est particulièrement présent dans le genre épigrammatique, car les textes sont très courts : un auteur, en quatre vers, ne peut traiter un sujet dans son ensemble. Quand un poème est repris, remanié ou revu par un autre auteur, ce dernier peut se focaliser sur autre chose, sur une autre facette du sujet, créant une multiplicité de variations possibles. L’auteur peut alors faire varier les mots employés, la syntaxe, ou encore garder la syntaxe et le vocabulaire mais changer complètement le sujet. Un bel exemple se trouve notamment dans les épigrammes 6.13, 6.14, et 6.17 (parmi une suite de variations bien plus longue) que je vous invite à consulter sur le site https://anthologiagraeca.org/

Les définitions d’un même concept littéraire peuvent beaucoup varier d’un.e chercheur.e à un.e autre. Notre objectif est alors de faire une synthèse et d’arriver à une définition complète, cohérente et surtout, formelle ! 

Concrètement, on va « nourrir » les algorithmes du plus de données possibles, ici les données étant les épigrammes de l’Anthologie, et ensuite on va leur faire appliquer des traitements spécifiques. Par exemple, dans un cas de figure, on peut leur demander de mesurer la distance qui sépare les mots entre plusieurs épigrammes. Suivant les résultats, on peut faire évoluer l’algorithme en ajustant ses paramètres. Quand les résultats obtenus seront bel et bien des variations, nous pourrons déduire que les paramètres entrés sont la définition formelle du concept.

Si l’expérimentation initiale se fait sur le concept de variation et à partir des textes de l’Anthologie, il est bien évidemment prévu d’étendre ces recherches à d’autres corpus et concepts.

Dans quelle direction souhaiterais-tu que la plateforme évolue? 

La plateforme est loin d’être terminée – et, a priori, elle ne le sera jamais : c’est le principe d’une démarche anthologique. Elle est vouée à être enrichie et améliorée! L’idée, actuellement, c’est d’éditer toutes les épigrammes pour qu’elles aient au minimum la transcription, une traduction, et un mot-clé. En parallèle de l’édition, nous essayons d’intégrer de nouvelles fonctionnalités techniques. Récemment, nous avons ajouté la possibilité de créer des alignements entre les textes. 

Il y a encore beaucoup de travail, et il est important d’établir des priorités. Actuellement, dans notre to-do list, il y a, entre autres, l’intégration d’un meilleur référencement pour les éditions que nous utilisons ou l’ajout d’outils issus des Digitals Classics

Quels sont ces outils? Dans quelle mesure le numérique est-il utile pour les études classiques? 

Concernant les outils que nous pourrions ajouter sur la plateforme, je pense particulièrement à ceux développés par le projet Alpheios. L’équipe a notamment mis en place la possibilité d’ajouter, sur tout site Web, des fenêtres contenant des grammaires et dictionnaires de langues anciennes, ainsi que des analyses grammaticales de mots en particulier. C’est très utile pour des usages pédagogiques. 

Du reste, les outils sont nombreux. Il y a une communauté très active qui développe des outils numériques et techniques permettant d’étudier et de revaloriser les langues classiques – le latin, le grec, mais aussi l’hébreu, l’égyptien et bien d’autres.

Parmi les outils les plus courants, mais également les plus utiles : les lemmatiseurs ! Ils permettent de lemmatiser un texte, c’est-à-dire d’analyser un texte grec, latin ou autre  et, pour chaque mot, de retrouver le lemme – le radical en quelque sorte, la forme que l’on retrouve dans le dictionnaire – et de l’analyser (s’agit-il d’un nom, d’un adjectif, d’un verbe; à quel cas, genre, nombre est-il; comment est-il conjugué ?). Ces développements, même s’ils sont loin d’être parfaits, simplifient l’accès aux textes antiques, souvent dans une perspective d’apprentissage, pour qui ne connaît pas très bien les langues anciennes. C’est également pratique pour la gestion algorithmique : les méthodes de traitement automatique du langage fonctionnent mieux – dans le cas des langues avec peu de données, comme le grec – lorsque l’on utilise des textes lemmatisés. En effet, les outils de traitement automatique du langage ont été développés essentiellement pour la langue anglaise. 

Manipuler du grec est particulièrement ardu : le corpus à notre disposition est bien plus mince; la langue – en vingt siècles – a beaucoup évolué; et il y a en outre de nombreuses différences dialectales ou poétiques. Il s’agit d’une langue à déclinaisons, il faut donc retrouver le lemme, comme je l’ai expliqué juste avant. Se pose également la question des possibles gestions des accentuations ou même de la ponctuation. Il y a donc un gros travail de prétraitement (preprocessing) avant de nourrir les algorithmes de ces textes. 

Enfin, il faut aussi citer la Perseus Digital Library, une institution dans le domaine des Digital Classics : le projet rend accessibles les textes classiques, au début seulement les textes latins et grecs, puis toutes les langues classiques. Ces textes sont récupérables en XML.  C’est d’ailleurs comme ça qu’on a récupéré les épigrammes de l’Anthologie, tout est en code source ouvert (open source). 

Y a-t-il des actualités du projet à venir?

Oui! Nous organisons un beau colloque les 27, 28 et 29 octobre 2022 à l’Université de Montréal ! L’événement s’intitule « Navigations anthologiques : l’Anthologie grecque à l’ère des Digital Classics » et regroupera un grand nombre de chercheur.es aux spécialités variées, philologiques ou techniques. Il y aura deux journées de conférences, la première consacrée essentiellement à l’actualité philologique de l’Anthologie, la seconde aux développements techniques et numériques appliqués ou applicables à ce vaste corpus. L’événement se terminera par un hackathon (sur inscription) afin d’enrichir, de manipuler et de réutiliser nos données! Plus d’infos sous peu sur le site Web de la CRCEN. On s’y voit? 

0 Shares:
Vous aimerez aussi...
Médialab
Lire plus

Les services numériques des bibliothèques québécoises publiques : un survol

Lorsqu’il s’agit d’aborder le sujet des bibliothèques, il y a de fortes chances que l’on pense spontanément aux milliers de livres qu’elles contiennent, dû à l’imaginaire que ces institutions culturelles évoquent. Or, avec l’arrivée du numérique et le développement effréné des nouvelles technologies, ces lieux publics vivent des bouleversements qui les appellent à renouveler leurs services pour s’adapter aux pratiques culturelles actuelles.