Affichage des articles dont le libellé est Découverte de l'ADN et de l'ARN. Afficher tous les articles
Affichage des articles dont le libellé est Découverte de l'ADN et de l'ARN. Afficher tous les articles

Qui a découvert l’ADN et l’ARN ? Episode 4 —La double hélice !

 


Qui a découvert l’ADN et l’ARN ? Episode 4 —La double hélice !

Allez, c’est parti ! Tu vas enfin découvrir cette histoire de double-hélice. 

 

Petit résumé des étapes précédentes.

Je te rappelle qu'ADN, ça veut dire acide désoxyribonucléique. Je t’ai déjà expliqué pourquoi.  « Acide » parce qu’il a des propriétés acides et « désoxy » parce qu’il contient un sucre, le désoxyribose. L’ADN est constitué de quatre briques seulement, qu’on appelle des désoxyribonucléotides. Tu trouveras l'épisode précédent ici. Pour partir du bon pied sur cet épisode, d'ailleurs, je peux te redonner la liste des épisodes: l'épisode 1 c'est par ici, l'épisode 2 par  et l'épisode 3, c'est là-dedans.

Un type appelé Phoebus Levene avait déterminé entre 1909 et 1940 la structure de ces quatre briques (A, T, G et C) et la manière dont elles sont enchaînées entre elles pour former des polymères (assemblages) [1]. Ces briques sont reliées entre elles pour former des chaînes. Analogie: si les désoxyribonucléotides sont des perles, alors un brin d’ADN est un collier de perles dont la « séquence » est la suite de ces perles: par ex. ATGCCCGTTAA est un (petit) brin d’ADN.

 

Une histoire de proportions étranges

Levene pensait qu’il y avait, dans ces chaînes, des proportions égales de A, T, G et C, et donc que les acides nucléiques (y compris l’ARN) étaient des « molécules ennuyeuses » sans réel intérêt [1]. Personne ne se doutait que les gènes étaient constitués d’ADN [2-5]. Mais dans les années 1950, un autre biochimiste (autrichien) appelé Erwin Chargaff s’est aperçu que l’égalité des proportions de A, T, G et C mise en avant par Levene était fausse, mais qu’il y avait toujours autant de A que de T d’une part, et de G et de C d’autre part [5].

C’est ce qu’on a appelé les « règles de Chargaff »… que personne ne parvenait à expliquer. J’insiste, mais on pensait que l’ADN c’était une seule chaîne de désoxyribonucléotides. Personne n’avait jamais vu une double hélice, ni ne se doutait de son existence [2-5]. Et puis, dans les années 1950, un groupe de personnes s’est intéressé à l’ADN pour en déterminer la structure 3D [5]: Maurice Wilkins et Rosalind Franklin. La technique utilisée pour « voir » la structure d’une molécule, c’était la diffraction aux rayons X [6, 7]. C’est compliqué, mais je vais te résumer simplement.

[INFO] Tu peux aller voir cette super vidéo de Science Etonnante (@dlouapre) qui parle un peu de cristallographie dans le cas des protéines, mais le principe est le même pour toutes les molécules. https://www.youtube.com/watch?v=OGewxRMME8o


"Voir" une molécule par cristallisation et diffraction des rayons X.

La méthode consiste à purifier une molécule (en fait à séparer toutes les copies d’une molécule donnée du reste des composants d'une cellule) et de cristalliser toutes ces copies identiques. "Cristalliser" signifie "former un réseau 3D parfaitement ordonné" desdites molécules grâce à des conditions physico-chimiques appropriées [6]. En général, pour y parvenir, on place toutes cette collection de molécules dans un milieu liquide contenant des sels, ce qui favorise la formation de cristaux: elles vont spontanément s'organiser en réseau régulier, les unes à côté des autres et les unes au-dessus des autres. C'est une méthode empirique, assez fastidieuse. Parfois, il faut tester des centaines, voire des milliers de conditions physico-chimiques (concentration de notre molécule, celle des sels, le pH, la température, etc.) avant d'en trouver une qui convient. De plus, former un cristal n'est pas toujours synonyme de victoire, car il faut encore qu'il puisse être utilisé: il doit être suffisamment grand (mais pas trop), être assez stable pour pouvoir être transporté sans se dissoudre ou se rompre et, surtout, il faut que les molécules d'intérêt y soient bien ordonnées. Suffisamment bien pour que l'étape suivante soit réalisable et qu'elle fournisse des résultats utilisables.
 
En seconde étape, on sort le cristal de son milieu liquide à l'aide d'un petit lasso et on l'installe sur un montage spécialisé. Là, tu envoies un faisceau de rayons X sur ton cristal. Les rayons X, c'est de la lumière constituée de photons de haute énergie. Cela nécessite d'aller réaliser ton expérience dans un synchrotron, installation qui permet de produire ces rayonnements. Lorsqu'elle rencontre le cristal, cette lumière y est diffractée par les nuages électroniques entourant les atomes constituant tes molécules.
 

La diffraction, pour simplifier, c’est une histoire d’interférences, qui se mesure derrière ton cristal et se manifeste par un schéma de taches lumineuses. Ce schéma (pattern) de diffraction dépend de la manière dont tes molécules sont organisées dans le cristal, mais aussi de la position des nuages électroniques et —je te passe les détails mathématiques— tu peux finalement retrouver comment tout ça se positionnait [6]. Bref, tu détermines la manière dont les atomes s’organisent dans tes molécules. Wilkins et Franklin avaient des schémas de diffraction, mais ne parvenaient pas à les interpréter. Linus Pauling, autre grand scientifique, avait aussi des résultats similaires [5].
 

Et la double-hélice émergea des données 

Le problème, c’était de réussir à interpréter ce qu’ils voyaient. Y avait clairement une symétrie en hélice là-dessous à cause de la manière dont les rayons X étaient diffractés. Pauling a proposé une histoire de triple hélice avec des brins d’ADN agencés étrangement [5]. C’était faux. Ce sont Francis Crick (qui travaillait sur l’interprétation des données de diffraction aux rayons X sur des structures à symétrie hélicoïdale, justement) et James Watson qui sont finalement parvenus à comprendre de quoi il retournait avant les autres [5, 8, 9]. Et ils ont obtenu ça:



Et… tadam ! L’ADN est constitué de deux brins « complémentaires », c'est-à-dire enroulés l’un autour de l’autre, formant une double hélice. « Complémentaire », ça veut dire quelque chose qu’on va voir dans quelques instants. C’est la base de la base de la biologie moléculaire, en plus. Regarde plutôt cette animation.


Là, je te mets une autre animation. Attention, ici il n’y a aucun hydrogène représenté dans ces structures. Simplement parce qu’ils ne sont pas « visibles » avec la résolution obtenue après diffraction. Mais ça change rien à la forme générale.


 

Je te fais un résumé. Et en images, s'il te plaît!



Tous les désoxyribonnucléotides de l’ADN sont constitués de l’assemblage d’un désoxyribose, d’un phosphate et d’une base. Tu remarqueras donc que dans la chaîne, seules les bases changent et pas le reste. Les « sucres-phosphates » sont un échafaudage constant tout du long.




C’est pour ça que, lorsqu'on détermine la séquence de ces brins d’ADN, on ne donne que les lettres des bases (A, T, G, C) sans préciser les désoxyriboses et les phosphates qui sont sous-entendus, parce qu’on sait qu’ils sont toujours là. Ils sont la charpente du truc, quoi. Le 2e brin est complémentaire au 1er: les bases azotées interagissent face à face par des liaisons électrostatiques (des interactions entre charges opposées appelées liaisons « hydrogène » dans ce cas, car elles impliquent des hydrogènes portant des charges partielles positives). L’adénine (A) interagit avec la thymine (T) avec 2 liaisons hydrogène, et la guanine (G) peut interagir avec la cytosine (C) avec 3 liaisons hydrogènes.

Les autres combinaisons ne conduisent pas à des interactions stables. Tu ne vois donc que des paires A—T et G—C dans l’ADN. On appelle ça des paires de bases. Il se trouve aussi que l'espace (le volume) occupé par une paire d'interaction A-T et une paire d'interaction G-C est quasiment le même (ce qui ne serait pas le cas pour d'autres paires, comme G-G, C-C, A-A, T-T, G-T, etc.), ce qui a pour conséquence que la double-hélice d'ADN est une structure très régulière. Et tu vois que les bases se font face et que ces paires forment des « marches » d’escalier perpendiculaires à l’axe de la double hélice. Mais attention, ces interactions par "liaisons hydrogène" sont des liaisons dites faibles, beaucoup moins stables que celles entre deux atomes dans une molécule. Les deux brins peuvent donc être séparés — en chauffant, par exemple, ou par l’ARN polymérase lors de la transcription.


Tu remarqueras que connaître la séquence d’un brin d’ADN te donne automatiquement la séquence du second — puisque c'est toujours la séquence complémentaire. Et que, du coup, t’as pas besoin d’avoir les deux.



C’est de là que venaient les fameuses « règles de Chargaff ». Il y a nécessairement toujours autant de A que de T, puisqu'en face de chaque A, il y a toujours un T, et réciproquement. Même chose pour G et C. 

Ah oui! Petite précision... Quand on séquence l'ADN, on te donne une séquence finale avec les lettres A, T, G, C (comme je l’ai dit un peu plus haut). Comme par exemple: ATGGCGTAATGTAATTTAAGC. C'est toujours la séquence d'un seul des deux brins. La séquence du second se déduit aisément du premier et est donc inutile. Donc dans les films et séries, quand ils regardent des double-hélices qui tournent sur l’écran… bah ça sert à rien, et c'est compliqué pour rien. Purement visuel.

Pour finir, on peutreprésenter l’ADN avec différentes vues simplifiées, plus pratiques pour visualiser simplement les choses. Au lieu de représenter tous les atomes, on peut choisir de ne visualiser que la direction des phosphates sous la forme de rubans et les sucres et bases azotées par des formes géométriques.


J’espère que ça t’a été utile et je te dis à bientôt pour parler génome, chromatine, chromosomes et code génétique et te montrer à quel point ces mots sont mal utilisés dans les médias et films. Avec moi, tu vas gigoter sur le siège au cinoche à chaque dialogue scientifique


[1] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6378961/

[2] https://pubmed.ncbi.nlm.nih.gov/24456972/

[3] https://pubmed.ncbi.nlm.nih.gov/28006030/

[4] https://pubmed.ncbi.nlm.nih.gov/17139326/

[5] Cobb, M. (2015) Life’s greatest secret — the race to crack the genetic code, Basic Books, Perseus Books Group, New York 464 pages.

[6] https://www.sfpnet.fr/une-decouverte-qui-a-change-le-monde-la-diffraction-des-rayons-x

[7] Pour la cristallographie, tu peux aussi aller voir cette video de Science Etonnante qui est vraiment bien faite : https://www.youtube.com/watch?v=OGewxRMME8o

[8] https://pubmed.ncbi.nlm.nih.gov/28922352/

[9] https://pubmed.ncbi.nlm.nih.gov/23622233/

Qui a découvert l’ADN et l’ARN ? Episode 3 —Phoebus Levene entre en scène.

 


Qui a découvert l’ADN et l’ARN ? Episode 3 —Phoebus Levene entre en scène.

 

Friedrich Miescher, Felix Hoppe-Seyler, Richard Altmann et Albrech Kossel avaient admirablement bien bossé entre 1869 et 1906 et montré que l’« acide nucléique » (le nouveau nom de la nucléine) était présent dans tout un tas de types d’organismes et de tissus, et qu’il était toujours composé d’un sucre (de nature inconnue), de phosphates et, en général, de 5 bases (A, T, G, C et U). Du moins était-ce ce que leur permettait de conclure les analyses qu’ils étaient capables de faire à l’époque (voir ici).

    Miescher, rappelons-le, avait initié l’analyse de la substance en la soumettant à des traitements de choc qui la détruisaient, et il en déduisait ensuite la composition en atomes — carbone, hydrogène, azote, oxygène et beaucoup de phosphore. Dans les « débris » de la molécule, en plus de ces atomes-là, il avait décelé la présence de phosphate, c'est-à-dire un assemblage de phosphore, d’hydrogènes et d’oxygènes (H2PO4) qui devaient être présents, tels quels, dans la constitution de ladite nucléine. Plus tard, Kossel était parvenu à utiliser des méthodes moins drastiques de destruction, permettant de libérer des constituants de l’acide nucléique plus gros, mois altérés, dont l’analyse avait permis de comprendre la composition : le phosphate à nouveau, un sucre inconnu, et cinq molécules de formules brutes C5H5N5 (l’adénine, notée A), C5H5N5O (la guanine, G), C4H5N3O (la cytosine, C), C5H6N2O2 (la thymine, T) et C4H4N2O2 (l’uracile, U), dont les structures (les assemblages relatifs d’atomes) furent déterminées par le chimiste et prix Nobel Emil Fischer.

     Mais à ce stade de leurs travaux respectifs, personne n’avait la moindre idée de la manière dont ces constituants s’assemblaient entre eux — ou même s’ils s’assemblaient tout court pour former quelque chose de plus gros. Même si Albrecht Kossel était assez certain que l’acide nucléique pût être une entité chimique de grande taille[1][2], l’époque n’était pas très ouverte à l’idée que des molécules géantes pussent exister[3]. Même pour les protéines ou les sucres complexes, qui sont des molécules géantes — des macromolécules, dans le jargon — qui avaient été découvertes bien avant l’acide nucléique, on ne croyait pas réellement qu’elles pussent être géantes, mais qu’il s’agissait d’agrégats de molécules moyennes sous la forme de ce qu’on appelle des colloïdes. Pour les chimistes de l’époque, qui ne parvenaient à synthétiser que de petites molécules, ou des molécules de taille moyenne, de tels géants devaient nécessairement être instables et donc ne devaient pas exister. C’est Herman Staudinger (1881-1965), entre autres, qui défendit l’idée (par exemple là[4]) que les macromolécules sont une réalité, concept qui ne fut adopté que dans les années 1940, lorsqu’on parvint à démontrer formellement que les protéines appartiennent toutes à cette catégorie, et qu’elles n’étaient pas des colloïdes[5].

    Pour ne rien arranger à d’éventuelles recherches bibliographiques que tu voudrais entreprendre, chère lecteur, à cette époque (début du XXe siècle, donc), il n’existait pas encore de nomenclature des molécules biochimiques, et aucune pour l’acide nucléique. Chaque chercheur parlait de « son » acide nucléique avec un nom bien à lui. Chez la levure de bière (qu’on classait chez les plantes), on parlait d’acide nucléique de levure. Extrait du thymus d’animaux, c’était l’ « acide thymonucléique ». Bref, tu vois, y avait beaucoup de noms. Principalement parce qu’on ne savait pas encore si cette substance était présente dans toutes les cellules et dans tous les tissus, alors on se demandait s’il existait plusieurs types d’acides nucléiques, ou s’ils pouvaient être spécifiques de chaque type de cellule ou de chaque type d’organe. On avait tout de même constaté qu’il semblait être constitué des mêmes composants partout: phosphate, sucre et bases azotées. On avait même remarqué que dans l’ « acide thymonucléique », y avait seulement les bases A, G, C et T et que chez la levure, il n’y avait pas ou peu de T, mais beaucoup de U.

    De ce fait, on pensait que la présence des bases azotées T ou U dépendait un peu des organismes d’où on les extrayait. En réalité, ils extrayaient deux choses différentes : de l’ADN chez les animaux et de l’ARN chez la levure et les plantes —l’ADN leur échappait chez ces derniers, pour des raisons techniques. Evidemment, eux, à cette époque, l’ignoraient complètement. Et pour cause : ils ne connaissaient pas la structure des acides nucléiques, et la différence entre ADN et ARN n’est visible qu’à cette échelle-là. Personne ne savait, donc, qu’il y avait deux types de molécules chez tous les organismes (ADN et ARN). Mais à partir de 1909, un nouveau personnage fait son entrée et c’est lui qui va se rendre compte de tout ça. Lentement. Très lentement.

     Ce personnage s’appelait Phoebus A. T. Levene (1869-1940), était originaire de Lituanie, et avait fait des études de médecine en Russie, ce qui l’amena finalement à New York (Rockefeller Institute of Medical Research). 

    Levene disposait de meilleures techniques d’analyse chimique qu’auparavant — il avait d’ailleurs côtoyé Emil Fischer et Albrecht Kossel (que nous avons rencontrés dans l’épisode 2) pendant sa formation, avec qui il avait appris pas mal de choses à propos de chimie. Et en plus, il mit au point une nouvelle technique pour extraire et purifier l’ « acide nucléique », mais aussi des méthodes pour « détruire » cette substance de manière « séquentielle », morceau par morceau, plutôt que de la démolir en une fois, comme on le faisait jusqu’à ce moment-là. En 1909, après moult expériences, il proposa que l’ « acide thymonucléique » se composât de « briques » assemblées en chaînes. Chaque brique était constituée d’un assemblage de phosphate, d’un sucre et d’une base azoée. Il appela ça un « mononucléotide ». Comme y avait 4 bases dans l’ « acide thymonucléique » (A, T, G et C), il y avait donc 4 mononucléotides possibles.

Remarque : Levene pensait que le sucre qui se trouvait dans l’acide nucléique était du xylose à cause de ses propriétés physico-chimiques proches de ce sucre déjà connu. Note aussi que tous les sucres finissent toujours par une terminaison en -ose.

    La manière dont il dégradait l’acide nucléique séquentiellement, et les techniques d’analyse qu’il utilisait lui ont permis (on n’entrera pas dans les détails) de proposer que ces « mononucléotides » (sucre+phosphate+base azotée) pouvaient être reliés entre eux par des liaisons et former des chaînes. Des chaînes qu’il appela « polynucléotides ». Mais la manière dont il proposa alors d’assembler les chaînes, c’était proprement faux. Mais avec les méthodes utilisées, c’était déjà plutôt pas mal. L’année suivante, il fit la même chose sur l’ « acide nucléique de levure » et obtint le même genre de résultats. Mais, dans le cas de la levure, il découvrit que le sucre était très certainement du ribose — un sucre contenant 5 atomes de carbone (C5H10O5). Là, Phoebus inventa une nomenclature dont on va reparler un peu plus loin et qui initia l’utilisation des mots « nucléoTides », « nucléoSides », « polynucléotide », etc.

    Après d’autres travaux, tout le monde finit par se convaincre (1914) que le ribose était seulement présent dans l’acide nucléique des plantes (et donc les champignons, qu’on classait alors dans les plantes) et il les baptisa acides ribonucléiques (« qui contiennent du ribose), ou, en acronyme, ARN. Chez les animaux, par contre, on pensait à tort que le sucre des mononucléotides était un « hexose » c’est-à-dire un sucre à 6 atomes de carbone. Mais, en réalité, ils se plantaient en beauté. Oui, c’était encore très nébuleux! Et les analyses ne permettaient pas de trancher.

    La chose se débloqua à partir de 1923, quand Levene croisa la route d’un Prix Nobel russe soulagé de son portefeuille par des voleurs alors qu’il était en transit à New York: Ivan Pavlov. Oui, celui du « réflexe pavlovien ». Lui et Levene découvrirent des enzymes (des protéines) digestives de dégradation des acides nucléiques (des nucléases, dit-on), ce qui améliora considérablement la manière dont ils « dégradaient » de manière contrôlée et séquentielle les acides nucléiques… et qui facilitait considérablement leur analyse. Ces enzymes leur permirent de voir (vers 1928) que dans l’acide thymonucléique, le fameux sucre à 6 atomes de carbone proche du xyose était en réalité un sucre très proche de celui découvert dans l’acide nucléique de levure, mais un peu différent : le désoxyribose. On parla donc d’acide désoxyribonucléique (« qui contient du désoxyribose), ou ADN. J’espère que tu suis toujours!


     On se rendit alors soudainement compte qu’il existait deux types d’acides nucléiques: l’un (ADN) qui contient du désoxyribose et l’autre (ARN) qui contient du ribose. C’était la première fois que la distinction apparut. D’où la nécessite d’une nouvelle nomenclature permettant de décrire cette complexité.

    Ils s’attaquèrent ensuite au problème des « liens » entre les briques (nucléotides). Je te passe les détails, mais vers 1935, Levene proposa finalement la structure des « briques » et celle des « chaînes de briques » (polynucléotides) dans l’ADN.

    Levene inventa, au passage, toute une nomenclature des « désoxyribonucléotides » (briques de l’ADN) et des « ribonucléotides » (briques de l’ARN). C’est celle qu’on utilise toujours aujourd’hui et que je te mets là (mais t’es pas obligé.e de lire ça).

     Par contre, on ne savait toujours pas à quoi l’ADN ou l’ARN servaient dans la cellule. On finit par se rendre compte que les plantes aussi possédaient de l’ADN (et pas seulement de l’ARN) et que les animaux contiennent de l’ARN en plus de l’ADN. Tous les êtres vivants possédaient les deux types d’acides nucléiques, dont on ne savait quasiment rien. Pour l’ARN, bien que les « briques » (ribonucléotides) que Levene avait proposées aient été déterminées correctement, les « liens » entre les briques dans les chaînes, c’était plutôt n’importe quoi. Et ça, ça durera jusqu’en 1953.

     Levene ne le sut jamais, puisqu’il mourut en 1940. Il ne vécut pas non plus assez longtemps pour savoir que l’ADN est le support de l’information génétique, chose à laquelle il ne croyait pas, puisqu’il pensait que l’ADN était « une molécule ennuyeuse », car répétitive. Tu noteras qu’il n’est toujours pas question de double hélice. On croyait, et ça durera encore jusqu’en 1953, que l’ADN et l’ARN ne formaient que des chaînes uniques, et linéaires. Et que ça ne servait pas à grand-chose (jusqu’en 1944).

     On va s’arrêter là. La prochaine fois, si t’es toujours partant.e, on verra comment on s’est rendu compte que l’ADN est une double hélice (1953). Parce que là, tu vois, on ne parlait que d’un seul brin (polynucléotide), jamais de deux. Suspens !

     [INFO IMPORTANTE] Tu trouveras (presque) tout ce que j’ai raconté dans cette référence : Frixione, E, Ruiz-Zamarripa, L (2019) The "scientific catastrophe" in nucleic acids research that boosted molecular biology, J Biol Chem, 15;294(7):2249-2255.

 

REFERENCES

[1] Dahm, R. (2008) Discovering DNA : Friedrich Miescher and the early years of nucleic acids research, Hum Genet, 122, 565-581.

[2] Frixione, E, Ruiz-Zamarripa, L (2019) The "scientific catastrophe" in nucleic acids research that boosted molecular biology, J Biol Chem, 15;294(7):2249-2255.

[3] Olby, R. The macromolecular concept. Journal of Chemical Education. 1970, Vols. 47, 168–174

[4] Staudinger, H. Über Polymerisation. Ber. Dtsch. Chem. Ges. . 1920, Vols. 53 (6): 1073–1085. doi:10.1002/cber.19200530627.

[5] Mülhaupt, R. Hermann Staudinger and the Origin of Macromolecular Chemistry . Angew. Chem. Int. Ed. . 2004, Vols. 43(9): 1054–1063

SOMMAIRE

Information utile, tu peux me trouver sur BlueSky: @duxpacis.bsky.social   Intention du blog — De quoi va-t-on parler ? Comment ? Et qui su...