Les archives historiques du Parlement européen peuvent désormais parler directement aux citoyens
La révolution de l’intelligence artificielle touche de nombreux aspects de notre vie quotidienne, y compris la façon dont nous nous plongeons dans notre passé. Le tableau de bord de l’unité des archives est un projet novateur élaboré par l’unité des archives du Parlement européen. L’objectif est de démocratiser la connaissance de l’histoire de cette institution, en aidant les citoyens et les chercheurs à naviguer dans les archives. Et aujourd’hui, grâce au développement de l’IA, cet outil leur permet même de dialoguer directement avec les documents des archives. Le site est accessible à tous et permet aux utilisateurs de poser directement des questions telles que: «Qui était Simone Veil?» Ou «Qu’est-ce que le traité de Maastricht?»
Le nouvel outil est basé sur un type d’intelligence artificielle appelé «grand modèle de langage». Entraîné à comprendre le langage naturel, ce type d’intelligence artificielle peut traiter les requêtes des utilisateurs et créer des réponses spécifiques (on parle d’IA générative). Pour ce faire, il analyse, extrait et établit des liens entre les informations de la vaste collection de documents que l’équipe de l’unité des archives a numérisés et mis en ligne. Cette technique s’appelle le «deep learning», ou apprentissage en profondeur.
Comment ça fonctionne? La génération augmentée de récupération
Lorsque l’outil reçoit une requête, il en identifie les mots clés et recherche les documents potentiellement pertinents dans un index. Le site utilise une IA standard qui a été alimentée par des données spécifiques: un index de plus de 100 000 documents provenant des archives du Parlement européen. Cette solution, inventée en 2020, s’appelle la génération augmentée de récupération, («Retrieval Augmented Generation» (RAG)). Elle permet d’améliorer la précision et la fiabilité des modèles d’IA générative grâce à des faits issus de sources externes.
L’outil sélectionne dans l’index les documents qu’il estime pertinents pour répondre à la question de l’utilisateur et il les intègre à la requête. Ensuite, grâce à l’IA générative, il est capable de lire tous les documents et de produire un court texte explicatif plus compréhensible pour l’utilisateur.
Comment l’utiliser?
L’outil est disponible via ce lien. Choisissez l’option «"Select Dashboard: content-analysis» (en haut à droite), puis cliquez sur l’onglet «Ask the EP archives». L’outil a accès aux documents relatifs à l’Assemblée commune de la Communauté européenne du charbon et de l’acier à partir de 1952, à l’Assemblée ad hoc et au Parlement européen jusqu’en 1994. Même s’ils sont principalement en français, grâce à la traduction automatique, l’outil peut être utilisé dans 55 langues.