Qu’est-ce que l’informatique par l’ADN, comment fonctionne-t-elle et pourquoi est-ce si important ?

Depuis une dizaine d’années, les ingénieurs se heurtent à la dure réalité de la physique dans leur quête d’ordinateurs plus puissants : les transistors, les interrupteurs qui alimentent le processeur de l’ordinateur, ne peuvent pas être rendus plus petits qu’ils ne le sont actuellement. Au-delà de la puce en silicium, une alternative intuitive est en train d’être développée en utilisant l’ADN pour effectuer les mêmes types de calculs complexes que les transistors en silicium. Mais qu’est-ce que l’informatique à ADN, comment fonctionne-t-elle et pourquoi est-ce une si grande affaire ?

Au-delà du transistor

Puce de silicium
Source : Fritzchens Fritz / Flickr

Le problème avec les transistors est qu’ils existent aujourd’hui à l’échelle de quelques nanomètres – seulement quelques atomes de silicium d’épaisseur. Ils ne peuvent pas être rendus plus petits qu’ils ne le sont actuellement.

S’ils deviennent plus petits, le courant électrique qui circule dans le transistor fuit facilement dans les autres composants à proximité ou déforme le transistor à cause de la chaleur, le rendant inutile. Il faut un nombre minimum d’atomes pour que le transistor fonctionne et nous avons fonctionnellement atteint cette limite.

Les ingénieurs ont trouvé des solutions de contournement pour ce problème en utilisant des systèmes multicœurs et multiprocesseurs pour augmenter la puissance de calcul sans avoir à rétrécir davantage les transistors, mais cela s’accompagne également de contreparties en termes de défis de programmation et de besoins en énergie, de sorte qu’une autre solution est nécessaire si nous espérons voir des ordinateurs plus puissants à l’avenir.

SAILLEZ AUSSI : L’INFORMATIQUE COGNITIVE : PLUS HUMAIN QUE L’INTELLIGENCE ARTIFICIELLE

Alors que l’informatique quantique fait beaucoup parler d’elle ces derniers temps, l’informatique ADN peut être tout aussi – voire plus – puissante que même l’informatique quantique et elle ne se heurte pas à autant de contraintes de stabilité que l’informatique quantique. De plus, nous savons que cela fonctionne ; nous sommes nous-mêmes des exemples vivants du stockage de données et de la puissance de calcul de l’informatique de l’ADN.

Le défi pour l’informatique de l’ADN est que, comparé à l’informatique classique, il est douloureusement lent. L’évolution a eu des centaines de millions d’années pour développer la séquence compliquée d’ADN qui existe à l’intérieur de chacune de nos cellules, de sorte que l’ADN est habitué à travailler selon des échelles de temps géologiques, et non selon les multiples gigahertz des processeurs classiques modernes.

Alors, comment fonctionne l’informatique de l’ADN et pourquoi la poursuivons-nous si elle est si lente ?

Qu’est-ce que le calcul de l’ADN, comment fonctionne-t-il et pourquoi est-ce si important ?

Hélix de l'ADN
Source :

Pour comprendre ce qu’est l’informatique de l’ADN, comment elle fonctionne et pourquoi l’informatique de l’ADN est une si grosse affaire, il faut d’abord arrêter d’y penser comme une sorte de remplacement de notre utilisation quotidienne classique de l’ordinateur ; nous ne jouerons pas à des jeux sur un ordinateur de l’ADN de sitôt, si une telle chose était même possible. Les puces en silicium seront avec nous pour un très long moment encore.

L’informatique ADN est ce que nous utiliserions pour résoudre des problèmes dépassant la portée de ce qu’un ordinateur classique peut résoudre, de la même manière que l’informatique quantique peut casser le cryptage RSA en quelques instants alors que cela pourrait prendre des milliers d’années à un ordinateur classique pour faire de même.

L’informatique ADN a été décrite pour la première fois en 1994 par l’informaticien Leonard Adleman de l’Université de Californie du Sud. Après avoir lu sur la structure de l’ADN, il a été inspiré pour écrire un article dans la revue Science montrant comment vous pourriez utiliser l’ADN à un problème mathématique et informatique tristement célèbre connu sous le nom de problème du chemin de Hamilton dirigé, communément appelé le problème du « voyageur de commerce » (bien que le problème du chemin de Hamilton soit une version légèrement différente du problème du voyageur de commerce, pour nos besoins, ils sont essentiellement interchangeables).

Qu’est-ce que le problème du voyageur de commerce?

Voyageur de commerce
Source : BarnImages

Comme le définit le problème du voyageur de commerce, une entreprise a un vendeur qui doit visiter n nombre de villes en faisant des appels et ne peut visiter chaque ville qu’une seule fois. Quelle séquence de villes visitées fournit le chemin le plus court, et donc le moins cher ?

Lorsque n est égal à 5, le problème peut être résolu à la main sur une feuille de papier et un ordinateur classique peut tester tous les chemins possibles relativement rapidement. Mais qu’en est-il si n est égal à 20 ? Trouver le chemin le plus court à travers 20 villes devient beaucoup plus difficile sur le plan informatique et il faudrait à un ordinateur classique un temps exponentiellement plus long pour trouver la réponse.

Essayer de trouver le chemin le plus court entre 500 villes et il faudrait à un ordinateur classique plus de temps que la durée de vie entière de l’Univers pour trouver le chemin le plus court puisque la seule façon de vérifier que nous avons trouvé le chemin le plus court est de vérifier chaque permutation unique des villes. Il existe certains algorithmes utilisant le calcul dynamique qui peuvent théoriquement réduire le nombre de vérifications nécessaires (et le problème réel du chemin de Hamilton ne nécessite pas de vérifier chaque nœud d’un graphe), mais cela pourrait raser quelques millions d’années ; le problème sera toujours pratiquement impossible à calculer sur un ordinateur classique.

Comment le calcul de l’ADN résout ce problème

Hélice d'ADN
Source : NIH / Flickr

Ce qu’Adleman a pu démontrer, c’est que l’ADN peut être assemblé de telle manière qu’un tube à essai rempli de blocs d’ADN pourrait s’assembler pour coder tous les chemins possibles du problème du voyageur de commerce en même temps.

Dans l’ADN, le codage génétique est représenté par quatre molécules différentes, appelées A, T, C et G. Ces quatre « bits », lorsqu’ils sont enchaînés ensemble, peuvent contenir une quantité incroyable de données. Après tout, le génome humain est codé dans quelque chose qui peut être emballé dans un seul noyau d’une cellule.

En mélangeant ces quatre molécules dans un tube à essai, les molécules se sont naturellement assemblées en brins d’ADN. Si une certaine combinaison de ces molécules représente une ville et un chemin de vol, chaque brin d’ADN pourrait représenter un chemin de vol différent pour le vendeur, tous étant calculés en même temps dans la synthèse des brins d’ADN s’assemblant en parallèle.

Alors, il s’agirait simplement de filtrer les chemins les plus longs jusqu’à ce qu’il ne reste que le chemin le plus court. Dans son article, il a montré comment cela pouvait être fait avec 7 villes et la solution au problème serait codée dès la synthèse des brins d’ADN.

Calcul de l'ADN
Source :

La raison pour laquelle cela a suscité l’enthousiasme est que les structures d’ADN sont bon marché, relativement faciles à produire et évolutives. Il n’y a pas de limite à la puissance que l’informatique de l’ADN peut théoriquement avoir puisque sa puissance augmente avec le nombre de molécules que vous ajoutez à l’équation et contrairement aux transistors en silicium qui peuvent effectuer une seule opération logique à la fois, ces structures d’ADN peuvent théoriquement effectuer autant de calculs à la fois que nécessaire pour résoudre un problème et le faire en une seule fois.

Le problème cependant, c’est la vitesse. Même s’il n’a fallu que quelques instants pour que la solution d’Adleman au problème du voyageur de commerce soit encodée dans ses brins d’ADN dans l’éprouvette, il a fallu des jours de filtrage des mauvaises solutions pour trouver la solution optimale qu’il recherchait – après une préparation méticuleuse pour ce seul calcul.

Pour autant, le concept était solide et le potentiel de gains incroyables en matière de capacité de stockage et de vitesse de calcul était évident. Cela a donné le coup d’envoi de deux décennies de recherche sur la façon de créer l’informatique ADN pratique une réalité.

Quels sont les avantages de l’informatique ADN?

Hélice d'ADN
Source :

Comme l’a démontré l’article d’Adleman, le principal avantage du calcul de l’ADN par rapport au calcul classique – et même au calcul quantique dans une certaine mesure – est qu’il peut effectuer d’innombrables calculs en parallèle. Cette idée de calcul parallèle n’est pas nouvelle et a été imitée dans l’informatique classique depuis des décennies.

Lorsque vous exécutez deux applications sur un ordinateur en même temps, elles ne fonctionnent pas réellement en parallèle ; à tout moment, une seule instruction est exécutée. Ainsi, si vous écoutez de la musique et faites des achats en ligne à l’aide d’un navigateur, l’ordinateur utilise en fait quelque chose appelé commutation de contexte pour donner l’apparence de la simultanéité.

Il exécute une instruction pour un programme, sauvegarde l’état de ce programme après l’exécution de l’instruction, et supprime le programme de la mémoire active. Il charge ensuite l’état précédemment sauvegardé du second programme, exécute son instruction suivante, sauvegarde son nouvel état, puis le décharge de la mémoire active. Il recharge ensuite le premier programme pour exécuter son instruction suivante et ainsi de suite.

En effectuant des millions d’étapes incrémentales par seconde à travers différents programmes, on obtient l’apparence de la concurrence, mais rien n’est jamais réellement exécuté en parallèle. L’informatique ADN peut réellement effectuer ces millions d’opérations en même temps.

Plus de 10 trillions de molécules d’ADN peuvent être comprimées dans un seul centimètre cube. Ce centimètre cube de matériau pourrait théoriquement effectuer 10 trillions de calculs en même temps et contenir jusqu’à 10 téraoctets de données. À bien des égards, une grande partie de la presse essoufflée mais inexacte que reçoit l’informatique quantique est en fait possible avec l’informatique ADN.

L’informatique ADN alors est mieux considérée comme un complément de l’informatique quantique, de sorte que lorsqu’ils sont jumelés ensemble et pilotés par un ordinateur classique agissant comme un gestionnaire de style Singleton, les types d’augmentations spectaculaires de la puissance de calcul que les gens espèrent voir dans le futur deviennent réellement possibles de façon réaliste.

Combien de temps faudra-t-il pour que les ordinateurs à ADN arrivent

Nous avons parcouru un long chemin depuis 1994. Peu après la publication de l’article d’Adleman, des chercheurs ont pu construire des portes logiques à partir d’ADN – les parties d’un circuit construit à partir de transistors individuels qui peuvent construire des équations logiques compliquées de type vrai-faux à partir de courant électrique.

Ce mois-ci, des informaticiens de l’Université de Californie à Davis et de Caltech ont synthétisé des molécules d’ADN qui peuvent s’auto-assembler en structures en exécutant essentiellement leur propre programme à l’aide d’entrées de six bits.

Microsoft dispose même d’un langage de programmation pour l’informatique de l’ADN qui peut aider à rendre l’informatique de l’ADN pratique une fois que la technologie des bio-processeurs aura progressé au point de pouvoir exécuter des algorithmes plus sophistiqués. En fait, Microsoft prévoit d’introduire l’informatique ADN dans ses services cloud d’ici 2020 et développe activement un stockage de données ADN à intégrer dans ses services cloud.

Il est probable que ces progrès seront réalisés beaucoup plus rapidement que les progrès de l’informatique quantique. L’informatique quantique nécessite des machines sophistiquées, des supraconducteurs et des conditions extrêmement froides pour maintenir les qubits suffisamment stables pour effectuer toute tâche de calcul réellement utile, et à moins que nous ne développions un matériau pouvant agir comme un supraconducteur à température ambiante, ils ne feront pas leur chemin dans nos ordinateurs de sitôt.

L’informatique par ADN, quant à elle, utilise de l’ADN que nous sommes devenus experts à manipuler au point de remplacer un seul gène d’un brin d’ADN grâce à CRISPR. Les matériaux nécessaires à la synthèse des molécules d’ADN sont bon marché et facilement disponibles et restent stables à température ambiante et au-delà. Ce que l’informatique par l’ADN est potentiellement capable de réaliser compte tenu de la résilience et du parallélisme biologique de l’ADN représente une étape essentielle vers l’avenir de l’informatique.

Leave a Reply