Que cherchez-vous ?

Publicité
11 janvier 2024
Temps de lecture : 3 minutes

Des machines apprenantes moins gourmandes en énergie

Une série d’images encodées dans des impulsions optiques, en vert, est identifiée grâce aux fréquences générées dans le processeur neuronal optique. Image:

L’apprentissage automatique pourra se faire plus rapidement, et à un coût énergétique bien moindre, grâce à un procédé entièrement optique.

Des programmes qui composent des poèmes sur demande, appren­nent à reconnaître des chats, jouent au jeu de go… Les prouesses récentes de l’intelligence artificielle, propulsées par l’apprentissage automatique, sont stupéfiantes.

Cet apprentissage automatique, même s’il s’inspire des interactions entre les neurones dans notre cerveau, fonctionne en fait sur l’architecture classique des ordinateurs : des composantes électroniques où l’information est encodée de manière numérique (des 0 et des 1) et traitée dans des « portes logiques », après quoi chaque résultat est stocké dans des registres de mémoire temporaires.

Mais ces tâches exigent de nombreux allers-retours entre les unités de traitement et les registres de mémoire, avec un coût énergétique inouï : l’entraînement de ChatGPT-4, par exemple, a exigé quelque 50 GWh d’énergie, ce qui représente près de 2,5% de l’électricité produite par Hydro-Québec en 2022.

Lueur d’espoir

Afin de créer des systèmes à faible consommation d’énergie, plusieurs approches basées sur des composantes optiques ont vu le jour, capables de mener plusieurs opérations en parallèle sans avoir besoin de méga-infrastructure électronique. Une de ces techniques repose sur une particularité des fibres opti­ques : lorsque des impulsions lumineuses s’y propagent, elles sont modifiées à cause d’interactions entre la lumière et la fibre.

À partir de cette particularité, l’équipe de Tiago Falk et de Roberto Morandotti, de l’INRS – Énergie, matériaux et télécommunications, a réussi à concevoir un système d’apprentissage automatique parfaitement fonctionnel. Un tour de force qui a fait l’objet d’un article dans Advanced Science en 2023. Le principe de base : quand une impulsion lumineuse courte, mais de forte intensité et composée d’une large bande de fréquences (plusieurs couleurs superposées) se propage dans une fibre optique, certaines nouvelles couleurs apparaissent, d’autres sont atténuées.

Une vingtaine de personnes se tiennent debout sur le gazon devant le bâtiment de l'INRS.

Roberto Morandotti et son groupe de recherche. Photo: Josée Lecompte

Prenons un exemple classique d’apprentissage automatique : l’identification de fleurs à partir d’images de pétales. Des caractéristiques précises d’une image de pétale sont d’abord encodées dans une impulsion lumineuse, ce qui peut être fait en laboratoire avec un appareil commun qui modifie la phase des fréquences dans l’impulsion. Puis, on fait circuler cette impulsion dans une fibre optique et on mesure le spectre des couleurs à la sortie de la fibre, afin d’obtenir une courbe de fréquence spécifique à l’image de départ. Ici aussi, l’appareillage de laboratoire courant suffit.

Pour entraîner la machine, il faut lui fournir plus de 1000 images différentes (disons 1500 pétales de fleurs, dans notre exemple), que le système transforme en autant de courbes de fréquence. Une fois cet apprentissage terminé, l’ordinateur peut déterminer sans problème les caractéristiques de nouvelles images de fleurs qu’il n’a jamais vues – et identifier l’espèce ! Avec une fraction minime de l’énergie qu’utiliserait un système traditionnel.

L’équipe des professeurs Falk et Morandotti a testé son système avec succès sur cinq bases de données déjà connues, dont la base « MNIST » pour la reconnaissance de l’écriture manuscrite. Dans les systèmes classiques (et énergivores), chacune de ces tâches aurait nécessité sa propre architecture. L’équipe de l’INRS, elle, a pu réaliser toutes ces tâches avec le même système ! Et si la première étape – l’encodage d’images – nécessite en ce moment beaucoup de temps, ce travail pourra être fait de manière automatisée en quelques fractions de seconde dans le futur.

L’équipe a même testé son approche sur un défi lancé à la communauté scientifique pendant la pandémie : développer un système pouvant identifier les personnes souffrant de la COVID-19 uniquement sur l’analyse de leur voix (convertie en courbe de fréquence). Le résultat obtenu (77,1 % de bons diagnostics) a été plus fiable que celui atteint avec les meilleurs systèmes de traitement numériques (72,9 %).

Roberto Morandotti ne cache pas sa fierté : « Mes étudiants et post-doctorants ont réalisé un système de reconnaissance d’images polyvalent, ultrarapide et bien moins énergivore que la plupart des systèmes actuels – avec du matériel de laboratoire tout simple. C’est une percée qui pourrait révolutionner le domaine de la photonique et de l’apprentissage automatique au Québec et ailleurs. »

L'AVIS DU JURY Réduire les besoins énergétiques des technologies d’apprentissage automatique est crucial. Cette équipe propose une solution originale, basée sur l’optique.

Ont aussi participé à cette découverte : Yi Zhu, Nicolas Perron, Piotr Roztocki, Benjamin MacLellan, Luigi Di Lauro, Aadhi Abdul Rahim, Bennet Fischer, Mario Chemnitz et Cristina Rimoldi. (Institut national de la recherche scientifique, Institut Leibniz de technologie photonique en Allemagne et École polytechnique de Turin).

Erratum: Une version précédente du texte indiquait que l’entraînement de ChatGPT-3 avait exigé quelque 50 TWh d’énergie, ce qui est très surestimé.

Publicité