Image: Oxford Nanopore Technologies
Propulsées par les nouvelles technologies, les sciences « omiques » promettent d’analyser des quantités phénoménales de données biologiques pour mieux nous soigner.
Génomique, épigénomique, transcriptomique, protéomique, métabolomique… Vous auriez besoin d’un lexique ? Rien d’étonnant, vu la vitesse à laquelle se développent ces nouvelles méthodes d’analyse de nos données biologiques.
Le premier séquençage du génome humain, il y a 20 ans, a marqué une étape majeure. Mais un génome, ça ne dit pas tout. La biologie s’est révélée infiniment plus complexe qu’une simple histoire de gènes. Si toutes les cellules d’une personne ont le même bagage génétique, la façon dont celui-ci s’exprime peut varier du tout au tout, en fonction du temps, de l’environnement ou de son rôle (cellule du foie ? du cœur ?), par exemple. Si bien que chaque cellule contient, à un instant donné, des milliers de molécules qui lui confèrent une signature unique : brins d’ARN, protéines, métabolites…
C’est cette signature que les sciences omiques cherchent à décrypter, pour comprendre comment elle évolue au cours de notre vie et de quelle manière cela reflète ou affecte notre état de santé.
En sciences omiques – « ome » signifie « totalité » ou « globalité » –, on ne travaille pas sur un seul gène ou une seule protéine à la fois. On capte l’ensemble des molécules présentes dans un échantillon (sang, salive, tissu biologique, sperme, sueur, sécrétions, larmes, alouette !) et on tente de dégager une vue d’ensemble. Cela suppose d’analyser des milliers d’indicateurs simultanés. Une révolution propulsée par de nouvelles technologies de détection et d’analyse, immensément plus rapides et abordables qu’il y a 20 ans.
« Il y a eu un gros changement de paradigme depuis les années 2010, constate le virologue Laurent Chatel-Chaix, du Centre Armand-Frappier Santé Biotechnologie de l’Institut national de la recherche scientifique (INRS). Avant, ce qui était limitant, c’était de générer des données omiques. Les machines traitaient peu d’échantillons, sans donner beaucoup de détails. Maintenant, générer des listes de 1000, 10 000, 20 000 ARN ou protéines [détectées dans un échantillon] ; c’est devenu très facile. Mais qu’est-ce qu’on fait avec ces données-là ? Comment est-ce qu’on les analyse ? Comment extraire ce qui est pertinent de ce qui ne l’est pas ? Ça prend de bons statisticiens, des bio-informaticiens. Moi, je suis incapable de faire ça ! »
Pour mieux comprendre ces disciplines aux noms exotiques, nous avons rencontré les responsables de trois projets de recherche québécois qui font appel aux sciences omiques. L’espoir est de poser des diagnostics plus rapidement, de mieux comprendre les mécanismes des maladies et de trouver de nouvelles cibles thérapeutiques. Avec, à la clé, la promesse d’une médecine plus personnalisée.
Projet 1 : Une réponse en cinq minutes
« Les applications cliniques ont toujours 10 ou 15 ans de retard sur la recherche », déplore le bio-informaticien Martin Smith. Dans son laboratoire du Centre de recherche du CHU Sainte-Justine, il cherche à développer de nouvelles approches de médecine personnalisée, mais, surtout, à les transférer vers la pratique médicale.
L’un de ses projets vise à améliorer la prise en charge des jeunes atteints de leucémie aiguë lymphoblastique, la forme de cancer pédiatrique la plus courante. Et il mise sur les technologies omiques pour y parvenir. « Le cancer est une maladie très, très hétérogène », rappelle Martin Smith. Les « défectuosités » cellulaires peuvent varier énormément d’un patient à l’autre, ce qui donne lieu à des signatures moléculaires différentes. Identifier ces signatures – à l’aide d’un échantillon de moelle osseuse prélevé chez l’enfant malade – est le premier pas vers la sélection d’un traitement adapté. « L’intensité du traitement de chimiothérapie d’un patient est déterminée en fonction du risque de récidive, qui est intimement lié à la génétique de sa leucémie », précise son collègue, le Dr Thai Hoa Tran, hématologue-oncologue pédiatrique au CHU Sainte-Justine. Selon l’altération génétique identifiée, le taux de survie sans rechute peut varier de 90 à 50 %.
Actuellement, des tests de laboratoire peuvent distinguer sept sous-types de leucémie aiguë lymphoblastique. Mais c’est long – d’une à trois semaines – et coûteux : 3000 à 4000 dollars, parfois plus. Surtout, 40 % des cas restent inclassables, ce qui complique le pronostic ainsi que le choix du traitement et prolonge l’incertitude pour les familles.
L’équipe de Martin Smith propose plutôt d’utiliser le séquençage par nanopores (voir l’encadré ci-dessus) pour analyser tout l’ARN contenu dans les cellules. Une fois l’échantillon prêt – ce qui nécessite quelques heures –, le diagnostic ne prend souvent que quelques minutes… et coûte moins de 200 dollars ! C’est une intelligence artificielle conçue par son équipe qui détermine avec précision le sous-type de cancer. L’algorithme a été entraîné à discerner 15 sous-types différents de leucémie aiguë lymphoblastique, à partir des données de 1200 patients.
Pour le moment, le modèle a été testé avec succès sur une douzaine d’échantillons. Il est aussi parvenu à écarter l’échantillon d’une personne non leucémique. Des résultats préliminaires impressionnants – que Martin Smith et ses collègues ont diffusés sur le serveur de prépublication medRxiv.
Reste à déterminer si ce diagnostic plus rapide et plus précis bénéficie réellement aux malades. Pour le moment, « c’est une preuve de concept qui doit être raffinée et validée indépendamment avant d’être adoptée en clinique », nuance le chercheur. Il faudra plusieurs années avant d’y arriver, mais, si le succès est au rendez-vous, les médecins auront un discours beaucoup plus clair pour les familles, indique le Dr Tran. « Avoir les bonnes informations tôt dans le diagnostic permet de rassurer les familles ou de mieux les préparer lorsqu’elles vivent un moment d’incertitude et de désarroi. »
Qu’est-ce que le séquençage par nanopores ?
Cette technologie consiste à faire passer les molécules biologiques d’un échantillon à travers une membrane percée de trous minuscules : les nanopores. Lorsqu’on dépose une goutte d’échantillon sur le dispositif de séquençage, un courant électrique attire les brins d’ARN ou d’ADN (selon ce qu’on choisit d’analyser) vers les nanopores. À mesure qu’un brin traverse un pore, le passage de chaque nucléotide crée une minuscule fluctuation de courant que le dispositif mesure. Le signal est interprété par un ordinateur, qui décode la séquence génétique.
Projet 2 : Les secrets d’un placenta
Après un accouchement, tout le monde n’en a que pour le nouveau-né ! Le placenta a beau avoir nourri, oxygéné et protégé le fœtus pendant neuf longs mois, il finit rejeté parmi les déchets biomédicaux… Sauf si l’équipe de Cathy Vaillancourt est dans les parages.
« Fan » du placenta depuis des décennies, cette chercheuse à l’INRS Centre Armand-Frappier Santé Biotechnologie, à Laval, étudie comment l’exposition à des facteurs de stress durant la grossesse (dépression, catastrophes naturelles, contaminants…) affecte la santé du placenta, de la mère et du bébé. Elle s’intéresse actuellement à l’effet de la détresse psychologique ressentie par les femmes enceintes durant la pandémie. L’effet du SRAS-CoV-2 comme tel est également dans sa mire.

Illustration: Shutterstock
Au total, 550 femmes participent à l’étude RESPPA (Résilience et stress périnatal en temps de pandémie) : 400 à Montréal et 150 en Abitibi-Témiscamingue. Elles ont répondu à un questionnaire psychosocial et accepté de fournir des échantillons de leur placenta. « Il faut récupérer le placenta immédiatement après l’accouchement, prélever l’échantillon, puis le congeler très rapidement dans l’azote liquide », explique Mme Vaillancourt. Car si l’ADN est assez résistant, ce n’est pas le cas des protéines et des molécules d’ARN, beaucoup plus délicates. Le moindre délai risque d’entraîner leur dégradation.
À l’aide des technologies omiques, son équipe scrutera les différentes molécules produites dans les cellules placentaires afin d’évaluer la « santé moléculaire » des placentas : épigénome, transcriptome, protéome, métabolome. De fines coupes de tissus ont aussi été collectées pour observer au microscope la morphologie de l’organe et la forme des vaisseaux sanguins qui l’irriguent, indicateurs de développement et de l’état du placenta. Les participantes et leur famille seront suivies pendant deux ans après l’accouchement.
« On essaie de comprendre s’il y a des signatures placentaires associées à des risques de développer des maladies, à court ou moyen terme. Le but de tout ça, c’est de pouvoir concevoir des tests diagnostiques très précoces, dans une optique de prévention. Que ce soit pour prévenir des complications de grossesse, comme la pré-éclampsie, ou des pathologies plus tard dans la vie de la mère ou de son enfant », explique Cathy Vaillancourt.
Les associations découvertes lors d’études de ce genre ne sont pas des liens causaux. On parle d’augmentation de ris-que de maladie, et non de certitude. Et la découverte de certains liens « molécule-complication » ne suffit pas. « C’est beau d’avoir une signature, mais, ensuite, il faut déterminer comment on peut intervenir. On doit donc comprendre le mécanisme d’action » à l’origine des maladies, souligne Cathy Vaillancourt.
Le but n’étant jamais de culpabiliser les femmes pour le stress durant leur grossesse, mais bien de pouvoir leur offrir le soutien nécessaire à une période charnière de la vie.

Illustration: Wikimedia Commons
Projet 3 : Riche en protéines
Imaginons notre génome comme un grand livre de recettes. Une page est réservée au pâté chinois. Mais selon l’endroit où les cuisiniers cellulaires – les ribosomes – commencent et arrêtent leur lecture sur la page, on obtient parfois un pâté chinois… parfois des patates pilées… ou juste un pot de ketchup maison ! Bref, une recette peut en cacher d’autres.
C’est la même chose dans notre corps : un gène peut contenir l’information nécessaire pour fabriquer plusieurs protéines : la protéine de référence et une ou plusieurs autres protéines dites « alternatives », ont découvert le professeur à l’Université de Sherbrooke Xavier Roucou et d’autres scientifiques il y a déjà une décennie. Laquelle sera produite ? Tout dépend de la manière dont le gène sera « lu ».
Mais par convention, depuis les débuts de la génomique dans les années 1990, les scientifiques annotent une seule recette par gène, la plus longue. Résultat : les bases de données officielles ne disent rien des patates pilées ni du ketchup. « Ça a biaisé toute la recherche médicale qui s’en est suivie », constate Xavier Roucou, rappelant qu’environ 21 000 gènes sont officiellement répertoriés.
Au début, bien des scientifiques avaient du mal à admettre l’existence même des protéines alternatives, ce qui est moins le cas aujourd’hui. « Mais, maintenant, ils mettent en doute l’implication potentielle de ces protéines dans les pathologies ! » Pourtant, certaines jouent un rôle dans le développement de maladies graves, comme la sclérose latérale amyotrophique.
Ce trouble neuromusculaire incurable se traduit par une paralysie progressive des muscles et entraîne un décès en quelques années seulement. On savait déjà qu’une mutation du gène FUS était associée à la maladie. Or, la mutation n’affecte en rien la protéine FUS ; elle altère plutôt la protéine alternative, altFUS, ce qui la rend toxique pour les neurones, a démontré une équipe du Centre hospitalier universitaire de Sherbrooke.
Cela démontre bien l’importance de tenir compte de toutes les protéines qui coexistent dans nos cellules. D’autant plus que jusqu’à 50 % des molécules détectées par les instruments d’analyse en protéomique ne sont pas des protéines déjà annotées et pourraient correspondre à des protéines alternatives ! « Actuellement, elles sont classées comme signal “orphelin”, car elles sont inexistantes dans les bases de données officielles… » déplore Xavier Roucou.
Pour y remédier, le chercheur a donc fondé la base de données OpenProt, qui répertorie les protéines alternatives humaines. Elle en compte déjà plus de 50 000, et les analyses informatiques du génome humain prédisent qu’il pourrait y en avoir jusqu’à un demi-million…
Bref, la communauté scientifique « a vraiment sous-estimé le pouvoir codant du génome humain », dit Xavier Roucou. Certes, on connaît chacune des 3 milliards de lettres qui forment notre génome. Mais la séquence est plus riche et plus complexe qu’on le croyait. Elle est remplie de messages cachés, qu’on redécouvre aujourd’hui. Décidément, notre génome n’a pas dit son dernier mot.
Glossaire
Génomique Étude du génome, l’ensemble du matériel génétique d’un être vivant. De plus en plus, on étudie aussi l’épigénome, c’est-à-dire les modifications à l’ADN qui surviennent pendant la vie d’un individu. Différents facteurs (vieillissement normal, alimentation, infections, tabagisme, etc.) modifient chimiquement la molécule d’ADN, sans toutefois en changer la séquence. Ces modifications dites « épigénétiques » sont temporaires et réversibles. Elles affectent l’activité des gènes en les « allumant » ou en les « éteignant ».
Transcriptomique C’est l’étude du transcriptome, l’ensemble de toutes les molécules d’ARN présentes dans un échantillon biologique à un moment donné.
ARN L’ARN est « transcrit » à partir de l’ADN et permet notamment de produire les protéines. Il reflète l’activité biologique de la cellule.
Protéomique Étude du protéome, soit l’ensemble de toutes les protéines détectées dans un échantillon.
Protéine Ce type de grosse molécule remplit plusieurs fonctions cruciales. « Ouvrières » de notre corps, les protéines réalisent ou facilitent les réactions chimiques, servent de soutien structurel dans nos tissus et nos organes, transportent des substances ou des messages, etc.
Métabolomique Étude du métabolome, l’ensemble des métabolites contenus dans un échantillon biologique.
Métabolite Petite molécule chimique issue du métabolisme – notamment les acides aminés, les acides gras, les sucres ou les vitamines résultant de la digestion.