ENCODE, l’encyclopédie du génome humain

En 2003, après 13 ans de travaux, le Human Genome Project [1] prenait fin, délivrant la séquence quasi complète des 3 milliards de lettres codant l’ADN [2] humain. Afin de poursuivre l’étude du génome [3] humain et de mieux comprendre son fonctionnement, le projet ENCODE, ENCyclopedia Of DNA Elements, est alors initié. Le 6 septembre 2012, 30 publications sont parues simultanément afin de présenter les résultats obtenus à travers ce projet international.

Les origines

Le Human Genome Project, projet international initié aux Etats-Unis par le NHGRI (National Human Genome Research Institute) a permis d’établir la séquence complète du génome humain en 2003. L’identification des 20.000 - 30.000 gènes humains a permis de réaliser que seul 2% de notre ADN code pour des protéines. Les scientifiques ne savaient alors pas à quoi servaient les 98% restant, certains ayant même proposé qu’ils étaient inutiles et les ayant surnommé ADN poubelle (’junk DNA’). L’initiation du projet ENCODE en 2003 fait suite à ce travail, afin de continuer l’étude précise du génome humain en analysant le rôle de cet ADN non codant.

Durant les 4 premières années du projet, le principal objectif des scientifiques a été de développer les stratégies et les méthodes nécessaires à la production des résultats en se concentrant uniquement sur 1% du génome [4]. En 2007, le NHGRI a estimé que les technologies avaient suffisamment évoluées et a lancé le véritable projet ENCODE sur la globalité du génome humain.

Les objectifs

L’objectif était de cataloguer les différentes séquences d’ADN ’fonctionnelles’ et d’étudier quand et où ces séquences sont actives ainsi que leur effet sur l’organisation du génome, sa régulation et sa lecture. Ce projet a nécessité la participation de 32 groupes de recherche au Royaume-Uni, aux Etats-Unis, en Espagne, en Suisse, à Singapour et au Japon, soit plus de 440 chercheurs. Tous ces scientifiques se sont concentrés sur 24 expériences différentes, sur 147 lignées cellulaires [5] différentes (les protocoles et les réactifs utilisés étant exactement les mêmes dans toutes les équipes).

Les différentes cibles expérimentales étaient [6] :
- la méthylation de l’ADN : étude des régions couvertes par des groupes chimiques (méthyl) qui régulent l’expression des gènes ;
- l’ouverture de la chromatine : étude des régions dans lesquelles la chromatine [7] est accessible à des protéines régulatrices ;
- séquences d’ARN [8] : études des régions transcrites en ARN ;
- ChIP-Seq : technique permettant l’étude des sites de liaison des protéines à l’ADN ;
- modification des histones [9] : étude des protéines histones, qui permettent d’emballer l’ADN dans les chromosomes, et qui peuvent être modifiées par des marqueurs chimiques ;
- facteurs de transcription : étude des protéines se liant à l’ADN et régulant la transcription [10].

Les résultats

Ces expériences ont produit 1640 séries de données, soit 15 térabytes (15 millions de millions de bytes, 10^12) de données brutes. L’ensemble de ces données est maintenant accessible librement sur des plateformes telles que celle de l’université de Santa Cruz, CA [11].

Les résultats du projet ont été publiés sous la forme de 30 articles dans 3 revues scientifiques : Nature, Genome Biology et Genome Research [12] et ont permis de dresser une carte détaillée des fonctions du génome en identifiant plus de 4 millions d’ "interrupteurs" génétiques. En effet, contrairement à l’idée initiale d’ADN poubelle, le projet ENCODE a démontré que 80,4% du génome a une fonction active dans la régulation de la production des protéines [13]. Cet ADN, majoritaire, ne code pas directement pour des protéines mais est responsable de toute la complexité du génome, activant ou inhibant la production d’une protéine à un instant et à un endroit donné. Cette nouvelle carte génomique va aussi permettre de comprendre de nombreuses maladies, résultats de mutations génétiques dans des zones ne codant pas pour des gènes.

Tous les résultats de ce projet ont été obtenus par l’analyse de nombreuses lignées cellulaires mais aucune de ces lignées ne provient directement d’une personne. Ce projet n’est donc pas totalement fini. Les scientifiques vont continuer à remplir les cases manquantes, toutes les expériences n’ayant pas été réalisées dans tous les types cellulaires [14]. Ils vont aussi continuer à développer de nouvelles techniques, permettant l’analyse du génome provenant de cellules de personnes et non de lignées de laboratoire ou permettant de répondre à de nouvelles questions telles que la régulation de l’organisation du génome en 3 dimensions. Le NHGRI, qui a déjà dépensé 185 millions de dollars dans ce projet, continuera à soutenir la phase suivante à hauteur de 123 millions de dollars [6].

— 

[2] ADN : Acide désoxyribonucléique, c’est la molécule support de l’information génétique.

[3] génome : ensemble de l’information génétique portée par l’ADN.

[5] lignée cellulaire : population homogène de cellules ayant une capacité illimitée de division.

[7] chromatine : substance de base des chromosomes, correspondant à l’association de l’ADN et des protéines histones.

[8] ARN : Acide Ribonucléique

[9] protéines histones : protéines s’associant à l’ADN pour former la structure de base de la chromatine. Elles jouent un rôle important dans l’empaquetage et le repliement de l’ADN.

[10] transcription : processus permettant la copie d’ADN en ARN. C’est la première étape permettant de passer de l’ADN à la protéine.

Pour en savoir plus, contacts :

- [1] Human Genome Project, http://redirectix.bulletins-electroniques.com/XzY6n
- [4] Genomics : ENCODE explained. Ecker JR, Bickmore WA, Barroso I, Pritchard JK, Gilad Y, Segal E. Nature. 2012 Sep 6 ;489(7414):52-5.
- [11] University of California, Santa Cruz genome browser, http://genome.ucsc.edu/ENCODE/
- [12] Nature ENCODE Explorer, http://www.nature.com/encode/
- [14] http://genome.ucsc.edu/ENCODE/

Sources :

- [6] ENCODE : The human encyclopaedia. Maher B. Nature. 2012 Sep 6 ;489(7414):46-8.
- [13] An integrated encyclopedia of DNA elements in the human genome. ENCODE Project Consortium. Nature. 2012 Sep 6 ;489(7414):57-74.

Rédacteurs :

Juliane Halftermeyer, deputy-sdv.at@ambascience-usa.org ;
Retrouvez toutes nos activités sur http://france-science.org.

Origine :
BE Etats-Unis numéro 302 (14/09/2012) - Ambassade de France aux Etats-Unis / ADIT - http://www.bulletins-electroniques.com/actualites/70954.htm

Dernière modification : 14/09/2012

Haut de page