Expliqué| AlphaFold : un tour de force scientifique

Expliqué|  AlphaFold : un tour de force scientifique

Comment nos méthodes de prédiction des structures protéiques ont-elles changé avec les outils basés sur l’IA ? Que signifie ce développement pour la biologie structurale ?

Comment nos méthodes de prédiction des structures protéiques ont-elles changé avec les outils basés sur l’IA ? Que signifie ce développement pour la biologie structurale ?

L’histoire jusqu’ici: DeepMind, une société basée à Londres et détenue par Google, a annoncé cette semaine avoir prédit les structures tridimensionnelles de plus de 200 millions de protéines en utilisant AlphaFold. C’est tout l’univers protéique connu des scientifiques aujourd’hui.

Qu’est-ce qu’AlphaFold ?

AlphaFold est un outil de prédiction de la structure des protéines basé sur l’IA. Il est basé sur un système informatique appelé réseau neuronal profond. Inspirés du cerveau humain, les réseaux de neurones utilisent une grande quantité de données d’entrée et fournissent la sortie souhaitée exactement comme le ferait un cerveau humain. Le vrai travail est effectué par la boîte noire entre les couches d’entrée et de sortie, appelée les réseaux cachés. AlphaFold est alimenté avec des séquences de protéines en entrée. Lorsque les séquences protéiques entrent par une extrémité, les structures tridimensionnelles prédites sortent par l’autre. C’est comme un magicien sortant un lapin d’un chapeau.

Comment fonctionne AlphaFold ?

Il utilise des processus basés sur « la formation, l’apprentissage, le recyclage et le réapprentissage ». La première étape utilise les structures disponibles de 1 70 000 protéines dans la Protein Data Bank (PDB) pour former le modèle informatique. Ensuite, il utilise les résultats de cette formation pour apprendre les prédictions structurelles des protéines qui ne se trouvent pas dans le PDB. Une fois cela fait, il utilise les prédictions de haute précision de la première étape pour se recycler et réapprendre afin d’obtenir une plus grande précision des prédictions précédentes. En utilisant cette méthode, AlphaFold a maintenant prédit les structures de l’ensemble des 214 millions de séquences protéiques uniques déposées dans la base de données Universal Protein Resource (UniProt).

Quelles sont les implications de cette évolution ?

Les protéines sont les fins commerciales de la biologie, ce qui signifie que les protéines remplissent toutes les fonctions à l’intérieur d’une cellule vivante. Par conséquent, connaître la structure et la fonction des protéines est essentiel pour comprendre les maladies humaines. Les scientifiques prédisent les structures des protéines à l’aide de la cristallographie aux rayons X, de la spectroscopie par résonance magnétique nucléaire ou de la microscopie électronique cryogénique. Ces techniques ne sont pas seulement chronophages, elles prennent souvent des années et reposent principalement sur des méthodes d’essais et d’erreurs. Le développement d’AlphaFold change tout cela. C’est un mouvement décisif dans la science et la biologie structurale en particulier.

AlphaFold a déjà aidé des centaines de scientifiques à accélérer leurs découvertes dans le développement de vaccins et de médicaments depuis la première publication publique de la base de données il y a près d’un an.

Que signifie ce développement pour l’Inde ?

De la contribution fondamentale de GN Ramachandran à la compréhension des structures protéiques jusqu’à nos jours, l’Inde n’est pas étrangère au domaine et a produit d’excellents biologistes structuraux. La communauté indienne de la biologie structurale est forte et compétente. Il doit tirer rapidement parti de la base de données AlphaFold et apprendre à utiliser les structures pour concevoir de meilleurs vaccins et médicaments. Ceci est particulièrement important dans le contexte actuel. Comprendre les structures précises des protéines du virus COVID-19 en quelques jours plutôt qu’en quelques années accélérera le développement de vaccins et de médicaments contre le virus.

L’Inde devra également accélérer la mise en place de partenariats public-privé dans le domaine des sciences.

Le partenariat public-privé entre l’Institut européen de bioinformatique du Laboratoire européen de biologie moléculaire et DeepMind a rendu l’ensemble de données AlphaFold de 25 téraoctets accessible gratuitement à tous les membres de la communauté scientifique.

En apprenant cela, l’Inde pourrait faciliter des collaborations conjointes avec les talents prédominants en matière de matériel informatique et de science des données dans le secteur privé et les spécialistes des institutions universitaires pour ouvrir la voie aux innovations en science des données.

AlphaFold est-il un outil unique en son genre pour prédire les structures des protéines ?

Bien qu’il s’agisse d’un tour de force en biologie structurale, comme toute autre méthode, AlphaFold n’est ni parfait ni le seul outil de prédiction de la structure des protéines basé sur l’IA. RoseTTaFold, développé par David Baker à l’Université de Washington à Seattle, aux États-Unis, est un autre outil. Bien que moins précis qu’AlphaFold, il peut prédire la structure des complexes protéiques.

Le développement d’AlphaFold ne manquera pas de rendre de nombreux scientifiques vulnérables, en particulier lorsqu’ils comparent leurs efforts d’années de travail acharné en laboratoire à ceux d’un système informatique. Cependant, c’est le moment de s’adapter et de profiter de la nouvelle réalité.

Cela revigorera la recherche scientifique et accélérera la découverte.

Binay Panda est professeur à l’Université Jawaharlal Nehru, New Delhi

L’ESSENTIEL

DeepMind, une société détenue par Google, a annoncé cette semaine avoir prédit les structures tridimensionnelles de plus de 200 millions de protéines à l’aide d’AlphaFold.

AlphaFold est un outil de prédiction de la structure des protéines basé sur l’IA. Il a utilisé des processus basés sur “l’entraînement, l’apprentissage, le recyclage et le réapprentissage” pour prédire les structures de l’ensemble des 214 millions de séquences protéiques uniques déposées dans la base de données Universal Protein Resource (UniProt).

La communauté indienne de la biologie structurale doit tirer parti de la base de données AlphaFold et apprendre à utiliser les structures pour concevoir de meilleurs vaccins et médicaments.

Lire aussi  La santé de Chandrayaan-3 est normale, entre dans la sphère d'influence de la lune

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick