Document

La transcription chez les eucaryotes

Auteurs : Françoise Ibarrondo, Gilles Camus
Document publié le : 12 décembre 2006

Sommaire
  1. Introduction
  2. La formation de l'ARN prémessager
  3. La formation d'un ou plusieurs ARN messager(s)
  4. Conclusion
  5. Bibliographie

I- Introduction

La transcription est le processus de copie du matériel génétique (ADN ou ARN) en ARN. Chez les procaryotes une seule ARN polymérase-ADN dépendante effectue la transcription pour tous les types d'ARN, tandis que chez les eucaryotes, trois ARN polymérases (ARNpol) interviennent : l'ARNpol I ou A pour les ARN ribosomiques transcrits dans le nucléole (28S, 18S et 5,8S), l'ARNpol II ou B pour les ARNm, et l'ARNpol III ou C pour les petits ARN (ARNt, ARNr 5S, ARNsn). Pour certains virus à ARN enfin, l'ARN est transcrit par une ARNpol-ARN dépendante appelée aussi réplicase.

Intéressons-nous plus particulièrement à la transcription des gènes codant pour les chaînes polypeptidiques chez les eucaryotes. Leur transcription se déroule en deux étapes : formation d'un ARN prémessager puis maturation de cet ARNprémessager pour former un ou plusieurs ARN messagers.

II- La formation d'un ARN prémessager

A- L'initiation de la transcription

Tout l'ADN n'est pas transcrit, seules les régions correspondant à des gènes le sont. Et encore, cette expression peut être régulée selon le stade de développement, le type cellulaire, l'environnement, etc... Dès lors, un acteur doit intervenir pour déterminer à quel endroit une région d'ADN doit commencer à être transcrite : c'est le rôle du promoteur.

1- Le promoteur

Le promoteur correspond à une région non transcrite de l'ADN, généralement juste en amont du début de la région transcrite, dont la séquence permet le recrutement de l'ARNpol II. Certaines séquences du promoteur (surnommées "boites") ont une importance particulière dans ce processus, essentiellement parce que ces séquences sont reconnues spécifiquement par différentes protéines appartenant au complexe d'initiation (voir paragraphe suivant) :

Signalons que si ces séquences sont souvent bien conservées, une variabilité non négligeable peut également être observée. Ainsi, il existe des promoteurs sans "boîte TATA" (voir ref. 2).

2- Le complexe d'initiation

Contrairement à ce qui se passe chez les procaryotes, l'ARNpol II des eucaryotes ne reconnaît pas seule le promoteur proximal. Elle effectue ce travail en compagnie de nombreux co-facteurs protéiques qui se recrutent les uns les autres et qui forment avec elle un complexe d'initiation. Ces facteurs sont notés TFIIA, TFIIB, etc... pour Transcription Factor for RNA polymerase II. Ils correspondent aux facteurs généraux de la transcription car ils s'assemblent sur tous les promoteurs utilisés par l'ARNpol II. La séquence d'assemblage du complexe d'initiation est décrite sur la fig. 1. Voir également la réf.1.

Figure 1 : Mise en place du complexe d'initiation.

La TBP est la première protéine qui reconnait une séquence spécifique de l'ADN initiatrice de la transcription (la boite TATA).

Le facteur TFIIB semble impliqué dans la sélection précise du site d'initiation (nucléotide à partir duquel se déroule la transcription).

Le facteurs TFIIH comporte plusieurs activités enzymatiques dont une activité hélicase permettant l'ouverture de la double hélice d'ADN au niveau du promoteur, et une activité kinase responsable de la phosphorylation de la queue C-terminale de l'ARNpolymérase II. Cette phosphorylation entraîne une modification de la structure tridimentionnelle de l'ARNpolymérase entraînant la dissociation du complexe d'initiation et le début de la transcription.

TFII = Transcription Factor for RNApolymerase II (Facteurs généraux de la transcription pour l'ARN polymérase II);

TBP = TATA box-Binding Protein (Protéine de liaison à la boite TATA).

La liaison du complexe de transcription au promoteur proximal provoque l'ouverture et le déroulement des deux brins de son ADN, tout en indiquant le brin qui va être transcrit.

3- Intervention de facteurs spécifiques de la transcription

Le complexe d'initiation composé de l'ARNpol II et des différents TFII est suffisant pour obtenir une activité transcriptionnelle in vitro mais à très faible taux. L'augmentation de cette activité basale (ou sa répression) est sous la dépendance de facteurs spécifiques qui vont interagir avec le complexe d'initiation. Ces protéines activatrices ou inhibitrices se lient à des promoteurs distaux, séquences spécifiques de l'ADN, appelées enhancer lorsqu'ils recrute des cofacteurs activateurs, ou silencer lorsqu'ils recrutent des cofacteurs inhibiteurs. Ces promoteurs distaux peuvent être situés à des milliers de nucléotides du promoteur proximal et agissent sur le promoteur proximal par le jeu de courbures de l'ADN (voir fig. 2).

Mais d'autres participants existent encore. On trouve ainsi des promoteurs proximaux alternatifs et des promoteurs distaux, situés à des milliers de nucléotides du promoteur proximal. Malgré la distance qui sépare les promoteurs proximaux des promoteurs distaux, ces derniers agissent sur le promoteur proximal comme activateurs (enhancers; voir fig. 3) ou represseurs (silencers) par le jeu de courbures de l'ADN, des facteurs de transcription et du médiateur qui maintient liés tous ces acteurs.

Figure 2 : La régulation spécifique de la réplication.
Les enhancers (activateurs) sont des séquences situées parfois à plusieurs milliers de nucléotides d'un promoteur qui activent ce dernier par un jeu d'interactions protéiques qui stabilisent le complexe d'initiation. Ces interactions sont rendues possibles par la courbure de l'ADN qui rapproche des éléments situés à de grandes distances les uns de autres.Cette activation est spécifique du gène et utilise une multitude de facteurs de transcriptions spécifiques (les protéines activatrices) qui agissent généralement sous forme dimérique).
Une répression spécifique peut agir selon le même type de modalité.

B- L'élongation

L'ARN pol II est équipée de facteurs protéiques d'élongation qui facilitent sa progression au travers d'une chromatine dont ils relâchent la structure (c'est l'un d'entre eux qui est mis hors d'état d'agir par le poison de l'amanite phalloïde...). Un ARNpré-messager complémentaire du brin matrice de l'ADN (brin antisens), donc identique au brin codant de l'ADN (brin sens) aux riboses et uraciles près, commence à être synthétisé selon la direction 5'-3' (voir fig. 3).

Figure 3 : La phase d'élongation de la transcription.
L'ARN polymérase lit le brin patron (ou brin antisens) qui est complémentaire du brin codant (ou brin sens) depuis son extrémité 3' vers son extrémité 5'. Le brin d'ARN néosynthétisé est donc identique au brin codant d'ADN, aux uraciles et riboses près.

C- La terminaison

L'ARN pol II est également équipée de facteurs protéiques de terminaison, et reconnaît ainsi un ou plusieurs signaux de terminaison portés par le brin progressivement parcouru et qui annoncent la fin de la transcription sur le brin d'ADN matrice (TTATTT par exemple, parfois aussi plus en aval ATACAAC...). Elle arrête bientôt son travail de transcription et libère l'ARNpm qu'elle vient d'assembler.

III- La formation d'un ou plusieurs ARNmessager(s)

Le transcrit primaire n'est pas utilisé tel quel pour la synthèse protéique (la traduction). Il doit subir des modifications qui répondent à plusieurs impératifs (augmentation de la demi-vie, modification de la séquence). Toutes ces modification sont réalisées au fur et à mesure de la progression de la synthèse du préARNm dans le nucléoplasme. Il existe trois grands types de modifications, catalysées chacune par des enzymes de nature protéique ou ribonucléique.

A- L'addition d'une coiffe en 5'

Elle a lieu dès le début de la transcription avant que la chaîne ne compte plus de 30 nucléotides. Elle consiste en l'ajout d'un nucléotide à guanine sur l'extrémité 5' de l'ARN suivi de sa méthylation sur l'azote 7 de la base, ainsi que de la méthylation en 2' du ribose des un ou deux premiers nucléotides du transcrit primaire. La particularité de cet ajout consiste dans le type de liaison mis en jeu (voir fig. 4). Il en résulte que l'extrémité 5' de l'ARNm n'est pas porteuse des trois acides phosphoriques libres habituels, mais d'un GMP, ce qui limite la réactivité de cette extrémité et sa reconnaissance par les exonucléase (protection contre la dégradation). Cet ensemble sert de coiffe protectrice à l'extrémité 5' de l'ARNm. Elle est également nécessaire à l'exportation de l'ARNm vers le cytoplasme et à la liaison de ce dernier avec la petite sous-unité du ribosome lors de l'étape d'initiation de la traduction.

Figure 4 : Structure de la coiffe d'un ARN.

La coiffe se caractérise par l'ajout d'un nucléotide à guanine à l'extrémité 5' du brin d'ARN. Ce nucléotide à guanine est relié à la chaîne nucléotidique par une liaison inhabituelle : au lieu d'être reliés par une liaison ester-phosphorique entre le groupement OH porté par le carbone 3' du ribose du nucléotide à guanine et l'acide phosphorique alpha du premier nucléotide de l'ARN natif, les deux nucléotides sont reliés par une liaison anhydride d'acide entre les acides phosphoriques des deux nucléotides.

Par la suite, le cycle imidazole de la guanine terminale est méthylé sur son azote 7.

Par ailleurs, le ribose du premier nucléotide de l'ARN natif est méthylé sur l'oxygène porté par le carbone 2'. Ce peut également être le cas du nucléotide suivant.

B- L'excision-épissage

Chez les eucaryotes, les archéobactéries et les cyanobactéries, les gènes sont morcelés : constitués d'une alternance d'exons (parties codantes du gène) et d'introns (parties non codantes, bornées par des séquences de bases spécifiques : 5'GU et 3'AG), ils sont d'abord intégralement recopiés dans l'ARNpm, puis subissent une opération d'excision des introns (ainsi que celle parfois de petits morceaux d'exons) suivi d'un épissage (splicing), c'est à dire la réunion bout à bout des exons restants qui constituent l'ARNm. Ce remaniement se déroule au fur et à mesure de la progression de la transcription.

L'excision des introns s'opère par l'entremise d'une formation dite "en lasso" (voir fig. 5).

Figure 5A : Excision de l'intron par formation d'un lasso : vue d'ensemble du mécanisme. L'excision-épissage est réalisée par réaction d'un nucléotide à adénine (A) situé dans l'intron avec un nucléotide à guanine situé en 5' de l'intron. Cela entraîne la séparation de l'intron d'avec l'exon 1 (situé en amont) et la formation d'une structure en lasso interne à l'intron. Ensuite, l'extrémité 3' de l'exon 1 réagit avec l'extrémité 5' de l'exon 2 permettant l'épissage des deux exons et la libération du lasso qui sera dégradé par des ribonucléases. Figure 5B : Excision de l'intron par formation d'un lasso : le splicéosome. Le splicéosome fait appel à des facteurs spécifiques : ribonucléoprotéines contenant des petits ARN(snRNP), ribozymes (ARN ayant des propriétés catalytiques), des enzymes spécifiques (maturases)... La structure secondaire du transcrit I met en contact trois séquences de l'intron : la séquence du début de l'intron (extrémité 5'-GU ou site donneur), la séquence de la fin de l'intron (extrémité 3'-AG ou site accepteur) et un nucléotide à adénine (A du branchement) 40 nucléotides avant le site receveur.

Mais l'épissage n'est pas seulement constitutif: il existe également des épissages alternatifs, dans lesquels l'élimination des introns (ou des portions d'exons) peut faire se lier entre eux des exons différents. C'est ce mécanisme qui démultiplie les capacités codantes d'un gène (voir un exemple d'épissage altérnatif dans la fig. 6).

Figure 6 : Exemple d'épissage alternatif. A partir du même préARNm peuvent être obtenus deux ARNm matures différents codant pour deux isoformes de la troponine, une molécule impliquée dans la structure des myofibrilles (voir l'article "La contraction musculaire").

C- L'addition d'une queue polyA en 3'

Le site de polyadénylation est codé au niveau du gène. Le site de clivage déterminé par le dinucléotide CA est entouré par une séquence AAUAAA très conservée située 10 à 30 nucléotides en amont du site de clivage, et par une séquence DSE (DownStream Element) riche en U ou en GU situé une trentaine de nucléotides en aval du site de clivage. La séquence AAUAAA est reconnue spécifiquement par un complexe protéique appelé CPSF (Cleavage and Polyadenylation Specific Factor), et la séquence DSE par un complexe CstF (Cleavage Stimulation Factor). Ces deux complexes et d'autres composants, comme l'ARN polymérase II et la poly(A) polymérase (PAP), vont interagit en formant le complexe de clivage qui va cliver la molécule de préARN au niveau du site de clivage (voir fig. 7).

Figure 7 : Le complexe de clivage impliqué dans la maturation en 3' du préARNm.
CPSF = Cleveage and Polyadenylation Specific Factor.
CstF = Cleavage Stimulation Factor.
PAP = Poly(A) Polymerase.
CF = Cleveage Factor
DSE = Downstrem Element.

La PAP va alors ajouter environ 200 nucléotides, une poly(A) binding protein II (PABP2) qui interagit avec la PAP se chargeant d'activer l'enzyme et de contrôler la longueur de cette queue poly(A). Il est intéressant de noter que cette polymérase n'utilise pas de matrice ADN pour créer cette séquence poly(A). La queue Poly(A) n'est donc pas codée par le génome. Notons que ce n'est pas un exemple isolé, d'autres mécanismes comme l'éditing ou la modification enzymatique de certaines bases (cytosine en uracile par exemple) étant encore beaucoup plus intrigants. Cette queue poly(A) confère de la stabilité au futur ARNm et se perd au fur et à mesure qu'il est traduit.

IV- Conclusion

La formation de l'ARNpm puis de l'ARNm a été élucidée dans ses grandes lignes au prix d'un formidable travail dont Joseph Goldstein a rendu compte de façon très amusée, en 2003, lors de l'attribution du prix Lasker à l'un de ses contributeurs, Robert Roeder (ref. 4).

Son mécanisme dépend à la fois d'une foule de protéines et de ribonucléoprotéines, elles-mêmes codées par une foule de gènes, et des séquences d'ADN avec lesquelles elles interagissent. On devine, à cette présentation générale résumée, à quel point la moindre mutation se produisant à l'un ou l'autre de ces niveaux peut avoir des conséquences majeures sur la transcription.

V- Bibliographie

Références :

  1. Housset C. et Raisonnier A. Cours (2006-2007) de biologie moléculaire du CHU Pitié Salpêtrière.
  2. Sabine Caussanel. (2003) Contribution à l'étude du rôle de CKIP-1 dans la différenciation musculaire régulée par PI3-K - Identification des ARN messagers correspondant aux formes de la protéine CKIP-1 Mémoire de l’Ecole Pratique des Hautes Etudes.
  3. Gottlieb S. (2003) The splice of life Nature Horizon.
  4. Discours de Joseph Goldstein présentant le Prix Lasker de Robert Roeder. (2003) Fondation Lasker.

Quelques livres généraux :

Contact :

Professeur Lafleur

Remerciements

Merci aux membres du Service Biomédia pour leur relecture attentive.