Que cherchez-vous ?

Publicité
20 février 2025
Temps de lecture : 3 minutes

L’intelligence artificielle pollue Internet

Illustration: portrait en noir et blanc de Marine Corniou.

Vous le savez, il ne faut pas croire tout ce qu’on voit sur Internet. Et la situation ne fera qu’empirer! L’intelligence artificielle est en train d’inonder la Toile de contenus absurdes ou simplement mauvais qui risquent de noyer les références de qualité. Est-ce la fin d’Internet?

Les adeptes de la cueillette de champignons se laissent parfois séduire, en ligne, par un livre de cuisine de champignons sauvages ou par le poétique Champignons du Manitoba : une odyssée fongique au cœur du Canada. Sur Amazon, ce type d’ouvrage abonde. Mais selon plusieurs signalements récents, ces livres sont truffés de phrases absurdes et certains conseillent même de consommer des champignons vénéneux ! Et pour cause : ils ont été écrits par ChatGPT et disent donc… n’importe quoi.

Cet exemple illustre un phénomène terrifiant, qui pourrait bien mener Internet à sa perte : la pollution du Web par l’intelligence artificielle (IA) générative. Peu chers et faciles à produire, les récits sans queue ni tête, les images irréelles et les textes plus ou moins faux, dont le but n’est pas nécessairement de tromper, mais de générer des clics et de l’argent, sont en train d’inonder le Web. À la manière d’une espèce envahissante, ces contenus synthétiques se répandent de façon exponentielle. Résultat : il devient de plus en plus difficile de dénicher de vraies informations.

D’autres exemples ? Des images fantaisistes, trompeuses, surgissent dans Google Images lorsqu’on cherche les noms latins de plantes ou d’animaux. Sur LinkedIn, 54 % des publications longues en anglais sont désormais générées par l’IA. Sur Facebook, les « photos » virales incongrues, aux allures de vrais reportages, se multiplient. Sur Wikipédia, 1 page sur 20 serait en partie écrite par ChatGPT. Côté info, l’organisme américain NewsGuard a recensé 1150 sites de médias d’apparence plausible, mais totalement bidon. Les commentaires, les publications sur X, les avis Google : rien n’y échappe, tant il est facile de produire ce slop médiocre. Et à part quelques mains à 8 doigts et quelques textes vraiment étranges, rien n’alerte sur l’imposture.

L’an dernier, le directeur général d’OpenAI a déclaré que ChatGPT générait chaque jour 100 milliards de mots – l’équivalent d’un million de romans (insipides), dont une partie va contaminer la Toile.

À ce rythme, l’IA va tout cannibaliser. Aujourd’hui, environ 10 % du contenu d’Internet est issu d’un robot. Dès 2026, ce pourrait être l’immense majorité, selon plusieurs spécialistes. Au menu : un marasme de données amalgamées, des banalités fausses ou sans nuances. Et, surtout, une dégénérescence de tout le système.

Car ces outils d’IA doivent s’abreuver de matière pour « s’entraîner ». Plus on leur fournit de données, meilleurs ils deviennent. Jusqu’ici, ils l’ont fait en passant au crible des articles de journaux, des archives, des publications scientifiques, les pages de Wikipédia… Mais, à mesure que les créations de l’IA envahissent le Web, les outils s’entraîneront de plus en plus sur du contenu qu’ils ont eux-mêmes généré. Les sources authentiques deviendront marginales. L’IA ressassera du contenu secondaire, puis tertiaire… Dans une spirale d’érosion susceptible de mener à l’effondrement.

C’est le terme employé par une équipe de l’Université d’Oxford dans Nature. Elle a montré que, lorsque les modèles ingèrent des données qu’ils ont eux-mêmes produites, les erreurs mineures sont reproduites et amplifiées, d’autres erreurs s’y ajoutent et tous ces couacs finissent par mettre le système K.-O. Comme une chambre d’écho extrême dans laquelle on n’entendrait plus que des inepties.

Idem pour les images. Rapidement, les images s’uniformisent et des mal­formations grossières apparaissent, selon une équipe de l’Université Rice. Et que dire des robots qui se répondront à eux-mêmes, dans des boucles sans fin, sur X ou Instagram ?

On me demande souvent si je pense que l’IA menace le journalisme. Ma réponse : une IA est incapable de choisir et d’interviewer des spécialistes, de constater des faits, de dénicher les données pertinentes, de compiler tout ça avec logique et discernement. Toutefois, ce qui menace le journalisme, c’est ce tsunami de pseudo-contenu informe qui noiera encore plus l’information.

Ce qui menace le journalisme – et plus largement la création de contenus de qualité –, c’est aussi l’impossibilité croissante de discerner le véridique de la fabulation robotique. D’autant que les moteurs de recherche – Google, Bing, ou celui de Meta – pourraient bientôt favoriser les résultats issus de l’IA plutôt que les sources originales. Même YouTube veut encourager la création de vidéos courtes avec des outils d’IA.

Alors que les ressources et les finances des médias s’étiolent comme peau de chagrin, qui ira vérifier ce qui se passe sur le terrain ? Qui ira parler aux scientifiques, aux spécialistes, aux gens ? Qui produira du nouveau contenu nuancé, drôle, riche… intéressant ? Pas ChatGPT, assurément.

Laissez un commentaire
S’abonner
Notification pour
*Votre courriel ne sera pas affiché publiquement
7 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
jacques ricard
9 mois il y a

Très inquiétant surtout lorsque ça va toucher le domaine de la santé

Slimani
9 mois il y a

C est exact l IA inonde internet et il nous est difficile de décrypter le vrai du faux

Line Gosselin
9 mois il y a

Merci beaucoup pour cet édito qui, malheureusement, expose clairement tout ce que je crains de la prolifération de l’IA. Je refuse de l’utiliser, car je crois encore en mes capacités cognitives et en mes connaissances pour écrire de bons textes «nuancés, riches et intéressants»!

André
9 mois il y a

Constat absolument crédible et inquiétant!

Jo-Anne Massé
9 mois il y a

Il faudrait enseigner cela dans les écoles secondaires et dans les cours de philo au cégep.

Isabelle Coulombe
9 mois il y a

Bonjour,
Vous faites références à des spécialistes sans les nommer. Pourquoi?

Patrice Fortin
6 mois il y a

A quand le filtre anti-IA????

Publicité