L’intelligence artificielle : toujours confidentielle ?

Les modèles d’intelligence artificielle peuvent à l’occasion se montrer trop bavards ! En les étudiant, on peut parfois reconstituer des données confidentielles qui ont servi à leur entraînement.

On connaît tous le jeu de sudoku : il faut compléter une grille à partir de quelques chiffres de départ. En adoptant une approche semblable, une équipe de Polytechnique Montréal a pu reconstruire pratiquement 100 % des données qui avaient servi à entraîner un modèle d’intelligence artificielle (IA).

« Plusieurs croient qu’il y a une séparation entre les modèles [d’IA] et les données qui servent à les entraîner, de la même façon que la moyenne d’une classe ne révèle pas les notes individuelles des élèves. Mais notre travail démontre que c’est faux, et ça peut être très problématique si les données sont sensibles ! » explique Thibaut Vidal, professeur au Département de mathématiques et de génie industriel et titulaire de la Chaire SCALE-AI sur les chaînes d’approvisionnement pilotées par les données.

Par exemple, on voudrait éviter que des données de santé confidentielles soient dévoilées à partir d’IA utilisées en contexte médical. « Pour notre étude, on a seulement utilisé des jeux de données publiquement accessibles, donc on n’a pas mis en péril les données de qui que ce soit », précise cependant Thibaut Vidal.

L’étude en question, publiée en juillet 2024 dans les

Les 10 découvertes de 2024

L’intelligence artificielle : toujours confidentielle ?

Vous avez déjà lu vos 2 articles gratuits ce mois-ci.

Infolettre

Abonnez-vous!

Des histoires de science passionnantes, chaque mois, dans votre boîte courriel

Vous avez déjà lu vos
2 articles gratuits ce mois-ci.