Pour rendre accessibles en ligne des images et des textes d’archives, il faut relever les défis – colossaux – de leur numérisation et de leur documentation. Deux chercheurs du réseau de l’Université du Québec et leurs équipes s’y attaquent.
Vous demandez-vous à quoi ressemblait votre ville il y a 100 ans ? Ou encore, avez-vous envie de voir des photos d’Expo 67 ? Vous avez de bonnes chances de trouver ces images patrimoniales sur Chronoscope. Cette plateforme est le résultat d’un
projet financé par le Fonds de recherche du Québec – Société et culture. Il a été réalisé entre 2018 et 2021, sous la direction du sociologue Christian Boudreau, professeur à l’École nationale d’administration publique (ENAP).
Il existe une foule de services d’archives dans la province, comme Bibliothèque et Archives nationales du Québec (BAnQ) et les villes. « Chacun a une grande quantité de photos, précise le chercheur. Déjà, les numériser représente un travail colossal, et les ressources manquent pour documenter chaque photo. C’est là que les citoyens peuvent intervenir. »

Le pavillon Canadien Pacifique-Cominco et le minirail d’Expo 67.
Parce que, si le projet permet à tout le monde de voir de belles images, il tire aussi profit de ces nombreuses paires d’yeux. « La participation citoyenne m’a intéressé dans ce projet qui permet aux gens non seulement de consulter les images, mais aussi d’aider les organisations qui les déposent à les documenter », indique celui qui a créé l’organisme à but non lucratif Savoir citoyen en 2022, pour continuer de faire vivre le projet et le déployer dans tout le Québec. Peut-être reconnaissez-vous une personne sur une des images d’Expo 67 ? Ou alors l’endroit exact dans votre ville où cette autre photo a été prise il y a belle lurette ?
Ainsi, les gens, qu’ils soient experts, adeptes d’histoire ou simples citoyens et citoyennes, peuvent entrer des informations à propos des images, comme la date précise ou approximative, la situation géographique, la catégorie ou les mots-clés. « Une fois que l’info est entrée, les autres personnes qui contribuent peuvent voter pour dire s’ils sont en accord ou non avec l’information, indique le chercheur. C’est de la validation par les pairs. »

Vue de l’hôpital des Orphelins desservi par les Ursulines, prise de dessus le rempart (1761), par James Mason.
Et ça fonctionne ! « Nous avons regardé les 100 images qui avaient eu le plus de contributions entre 2019 et 2021, soit près de 2400, et elles sont exactes à 96 %, donc les gens n’inscrivent pas de niaiseries », se réjouit le chercheur. Au total, plus de 300 personnes avaient enregistré quelque 9000 contributions.
Pour susciter autant d’intérêt auprès de la population pour le projet, un partenariat a eu lieu avec Le Soleil, à Québec. Pendant un an et demi, le journal a diffusé des photos de Chronoscope dans la chronique D’hier à aujourd’hui. « À chaque publication, nous voyions clairement le volume de visites augmenter sur le site », précise Christian Boudreau.
Maintenant, le défi que doit relever Savoir citoyen, qui peut compter sur Christian Boudreau dans son conseil d’administration, est de maintenir l’intérêt du public. Plusieurs voies sont explorées, comme donner de la reconnaissance aux plus grands contributeurs et contributrices. Des expositions virtuelles seront aussi créées avec des partenaires. Par exemple, Mémoire en partage, réalisée avec la Ville de Québec, sera lancée en avril 2024 et présentera plus de 800 images. À notre tour de les scruter !
Découvrir des écrits de la Nouvelle-France
Vous avez un appétit pour un passé encore plus lointain ? Consulter en quelques clics des écrits de la Nouvelle-France devrait être possible d’ici trois ans !
Depuis 2018, Maxime Gohier, professeur au Département des lettres et humanités de l’Université du Québec à Rimouski (UQAR), travaille à construire un catalogue intelligent pour faciliter les recherches.
Il utilise Transkribus, une plateforme autrichienne qui se sert de l’intelligence artificielle (IA) pour déchiffrer et transcrire des textes numérisés. Ces documents peuvent venir des différents centres d’archives, comme BAnQ, le Musée de la civilisation, qui possède les archives du Séminaire de Québec, et Archives nationales d’outre-mer, en France, qui conserve les documents officiels de l’administration de la Nouvelle-France.
Le catalogue contient déjà environ 300 000 pages de documents manuscrits transcrits. Mais le potentiel est bien plus grand. « Nous aimerions travailler avec toutes les archives de la Nouvelle-France, mais le problème, c’est la numérisation, indique Maxime Gohier. Il y a énormément d’images, et les numériser prend beaucoup de temps et de ressources pour les organisations. »
Du côté de l’intelligence artificielle, beaucoup de travail a été fait. « Nos modèles ont appris à reconnaître le texte ancien donné et nous continuons à les entraîner lorsque nous voyons des changements dans l’écriture [au fil des époques] », explique le professeur.
Le grand défi actuellement est de reconnaître les entités nommées, comme les noms propres, les statuts professionnels et les dates. « Par exemple, la date du 15 février 1839 peut être écrite tout en lettres, à moitié en lettres et à moitié en chiffres, puis tout en chiffres, énumère Maxime Gohier. Il faut attacher toutes les façons d’écrire cette date dans les documents et créer un identifiant unique pour qu’on puisse facilement retrouver toutes les mentions » en faisant une simple recherche.
Du travail commence aussi à se faire pour développer des modèles qui permettront de reconnaître les langues autochtones ; les missionnaires de la Nouvelle-France avaient des documents pour les apprendre, comme des dictionnaires et des grammaires.
Grâce à des subventions de la Fondation canadienne pour l’innovation et d’Innovation Québec, le chercheur créera un dépôt numérique au Québec pour stocker tous les textes transcrits par Transkribus. « Ces documents seront ainsi accessibles à tout le monde, et la communauté de recherche pourra y accéder, explique le professeur. Le défi est de bien construire cet outil pour qu’il indique, par exemple, qui a entré des données pour améliorer la documentation des textes et à quel moment. C’est une toute nouvelle façon de travailler et c’est excitant, parce que l’IA permettra de faire en quelques minutes ce que quelques personnes passaient toute leur carrière à faire. »
Sur la photo en ouverture: Montréal dans les années 1920
Crédits: ACHF/Exporail; Domaine public; Bibliothèque et Archives nationales du Québec