http://www.businesspundit.com/wp-content/uploads/2009/10/zzzzhome.png

Cours de Génétique

 

cours rédigé par M. Silar

 

Chapitre1: rappels

Chapitre2 : un peu d'histoire

Chapitre3 : la variation

Chapitre4 : quelques notions de Génomique

Chapitre5 : la mutagenèse

Chapitre6 : la complémentation

Chapitre7 : la recombinaison et l'établissement de cartes génétiques

Annexes : la ségrégation des gènes au cours des générations dans les différents organismes

Cours rédigé par Mme Gonzy

Chapitre 8 :les mécanismes de recombinaison

 

Chapitre9 : la réparation des dommages à l'ADN

 

Chapitre10 : les éléments mobiles

 

Chapitre 11: la réalisation du phénotype

 

Chapitre 12 : Les interactions géniques

 

 

LES ELEMENTS MOBILES

CARACTERISTIQUES GENERALES DES

ELEMENTS TRANSPOSABLES


Définition
Les éléments mobiles, sont des fragments d’ADN qui sont insérés dans le génome d’un organisme hôte et qui ont la propriété remarquable de se déplacer d’un point à un autre du génome, on dit « de transposer », à l’intérieur de la même cellule. On peut les classer en deux grands groupes: les transposons d'une part et les rétrovirus et phages lysogènes d'autre part. Les transposons ne peuvent quitter leur cellule hôte et ne peuvent se transmettre que par division (mitose, méiose) ou fusion (fécondation) de celle-ci. En ceci ils diffèrent des rétrovirus ou des phages, qui sont eux aussi capables de s’insérer dans l’ADN de l’hôte mais, qui sont en plus capables de passer d’une cellule à l’autre ou d’un organisme à l’autre, grâce à leur forme infectieuse encapsidée. Nous nous intéressons ici aux transposons, mais comme certains transposons ont des parentés de structure avec les rétrovirus, nous décrirons très succintement ces derniers.


Des transposons ont été mis en évidence chez toutes les espèces où on les a cherché, depuis les bactéries (séquences IS, transposons de la série T) jusqu’aux mammifères (rétroéléments, éléments LINE et SINE), en passant par la levure (transposon Ty), les végétaux (Ac,Ds du maïs, série Tam chez la gueule-de-loup), les insectes (copia, éléments P chez la drosophile), les nématodes (Tc1), etc. Chez une espèce donnée il existe plusieurs sortes de transposons différents. Par exemple, chez la drosophile on connaît une centaine de transposons différents.
Depuis qu’on possède des séquences génomiques complètes de plusieurs espèces on se rend compte que les séquences mobiles constituent une fraction importante des génomes :

  • 17% du génome de Arabidopsis thaliana,
  • 18% du génome de Drosophila melanogaster
  • 42% du génome de Homo sapiens
  • plus de 50% du génome de Zea maïs


Enfin ils sont la cause de nombreuses mutations : par exemple on estime que chez la drosophile, 50% des mutations spontanées sont dues à des transposons.

Mise en évidence

C’est Barbara Mc Clintock la pionnière: elle met en évidence chez le maïs des phénomèmes d’instabilité génétique qu’elle attribue à un élément mobile Ds (pour dissociation ) et à son compagnon l’élément Ac (pour activateur). Après plusieurs décennies d’études génétiques et moléculaires (travail commencé en 1940 jusqu’à sa mort en 1992) elle a pu montrer en détail comment fonctionnait les éléments Ds et Ac, comment ils transposaient et comment ils altéraient l’expression des gènes voisins.
Ce travail a révolutionné les idées précédemment admises sur la stabilité du génôme et ouvert la voie aux conceptions modernes sur la fluidité, la variabilité, la constante réorganisation du génome.


Chez la larve de drosophile certains tissus sont dits polytènes : ceci signifie que la réplication des chromosomes a lieu de nombreuses fois sans que les noyaux ni les cellules ne se divisent. C’est le cas par exemple des glandes salivaires : les cellules sont géantes, les noyaux aussi et les chromosomes homologues et les copies de chaque chromosome (1000 à 2000) restent accolés les uns aux autres donnant des chromosomes très épais qui sont visibles au microscope. Par simple écrasement du tissu et fixation à l’acide acétique on peut observer les 4 chromosomes (n=4) et les identifier par leur profil de bandes claires et sombres alternées.
Ensuite par hybridation in situ avec une sonde d’ADN marquée (radioactivement au tritium ou chimiquement à la digoxygénine) provenant d’un gène de drosophile on peut observer une bande de marquage en un point précis d’un chromosome qui correspond à la position du gène dans le génome. Par exemple une sonde provenant du gène « white » s’hybridera sur le chromosome X dans la région « 3C2 » assez proche du télomère.
Si on fait la même expérience d’hybridation in situ, à partir des chromosomes polytènes d’une souche prélevée dans la nature, en utilisant une sonde provenant du transposon copia, on observe non pas une, mais une quarantaine de bandes de marquage dispersées sur tous les chromosomes. De plus les points d’insertion de copia sont variables d’une souche de drosophile à l’autre.

Généralisation: très souvent on trouve dans le génome d'un organisme donné, de multiples copies d'un transposon particulier; le fait remarquable c'est que la plupart de ces copies sont incomplètes, on dit "défectives", par suite de délétions internes qui les rendent incapables de transposer. Ainsi, chez la drosophile , organisme chez lequel les éléments transposables sont particulièrement bien étudié, on montre que plus de la moitié des copies, toutes espèces de transposons confondues, ne conservent que 10% environ des séquences de leur transposon d'origine.


Exemples de mutations créées par des transposons:

  • Chez la levure: insertion de Ty en amont du gène ADH2 (normalement induit par l’éthanol et réprimé par le glucose) rend la synthèse de l’alcool déhydrogénase constitutive.
  • Chez la drosophile: insertion de copia dans le 2ème intron du gène white perturbe la transcription et provoque l’apparition d’yeux orange au lieu de rouge brique (cf exercice TD);
  • Chez la souris: l'insertion d'un rétroélément IAP (intracisternal-A particle) dans un exon non codant, en 5' du gène Agouti dérégule l'expression de la protéine ce qui conduit à des souris à poil jaune (mutation dominante).
  • Chez l'humain: insertion de LINE1 dans le gène codant pour le facteur VIII (situé sur l’X), essentiel pour la coagulation du sang, rend le fils hémophile alors que sa mère est homozygote sauvage pour ce gène.


Classification des éléments mobiles
Deux grands types de transposons :

  • les transposons à ADN, dits aussi « bactériens », bordés de séquences inversées répétées appelées IR; exemples: Tn, Tc1, élément P, Ac/Ds;
  • les rétrotransposons de classe I qui transposent par l'intermédiaire d'un ARN; ils sont bordés de deux "long terminal repeats" appelées LTR, en répétition directe; exemples: Ty, copia, IAP (intracisternal-A particle);
  • ll existe des formes dérivées des rétroéléments comme les éléments Line et Sine qu'on nomme rétrotransposons de classe II. Les pseudogènes constituent une classe à part.

Enfin bien que les rétrovirus ne fassent pas partie des transposons puisqu'ils ont une forme infectieuse, ils sont inclus ici à cause de leurs parentés de structure avec les rétrotransposons.

 

Type de transposon

Exemples

Stucture de l'acide nucléique

Mode de transposition

bactérien

Séquences IS, Série des Tn de E.coli;

Elément P chez la drosophile;

Elements Ac,Ds du maïs

ADN double brin codant pour une transposase, bordé de 2 séquences inversées répétées (IR)

transposition réplicative, entrainant la duplication du transposon, ou conservative: excision d'un site et insertion dans un autre

rétrotransposon de classe I

Ty de la levure,

copia de la drosophile,

IAP de la souris

dans le génome de l'hôte: ADN double brin codant pour une réverse transcriptase, bordé de deux séquences répétées directes (LTR); dans les particules cytoplasmiques: ARN.

par l'intermédiaire d'un ARN transcrit par l'ARNpol de l'hôte et copié en ADN par la réverse transcriptase; cet ADN peut s'insérer dans le génome de l'hôte;

rétrotransposon de classe II

Eléments F et I de la drosophile; éléments Line chez les mammifères; séquences Alu chez l'humain

ADN double brin codant probablement pour une réverse transcriptase, pas de LTRs.

intermédiaire ARN probable

pseudogènes

a-tubuline du rat,

copies plus ou moins mutées d'un gène cellulaire

 

Rétrovirus

existence d'une forme infectieuse

HIV

virus oncogènes

gypsy de drosophile

virus à ARN sous forme particules infectieuses libres

provirus inséré dans le génome de l'hôte: ADN double brin codant pour gag pol (réverse transcriptase ) et env et bordé de 2 LTR.

Cycle de reproduction: provirus transcrit, traduction et formation des particules virales et dissémination

ARN réverse transcrit et insertion de l'ADN double brin dans le génôme.



Fréquence de transposition

Transposon de type bactérien
Dans un génôme stabilisé, la fréquence de transposition est égale à la fréquence de mutation spontanée: environ 10-6.
La fréquence de réversion, correspondant à l’excision d'un transposon qui causait une mutation, et qui entraîne donc retour au phénotype sauvage, est de l'ordre de 10-6 par génération (mesurée chez E. coli avec les séquences IS).
Dans un génôme en voie d'envahissement par un transposon, la fréquence de tranposition est beaucoup plus élevée : 10-3 à 10-4. Par ex, quand on croise des drosophiles vides d’éléments P avec des mouches qui en contiennent on reconstitue l'envahissement, et les éléments P qui transposent provoquent un taux de mutations 1000 fois supérieur au taux de mutation spontané. Dans certaines conditions, en laboratoire, la fréquence d'excision et de transposition de P peut aller jusqu'à qq%.
Chez les plantes, certains transposons sont exceptionnellement mobiles : c’est le cas de Tam4 chez Antirrhinum majus (gueule-de-loup) ou la fréquence de transposition ou d’excision atteint qq % ; de plus il y a des transpositions dans les cellules somatiques, ce qui peut se voir phénotypiquement, par ex par des fleurs tachetées (voir exercice de TD).

Transposon de type rétroviral
Chez Ty de la levure, on estime la fréquence de transposition à un événement de transposition toutes les 20 générations, soit 1/220 soit environ 10-6. La fréquence d'excision est légèrement plus forte 10-5 à 10-6.


Insertion du transposon dans le génome.

Non spécificité de la cible
En première approximation les transposons s’insèrent au hasard dans les génomes: dans la plupart des cas l’alignement des séquences-cibles ne montre pas de séquence consensus particulière. Mais... on observe parfois des points chauds d’insertion ou des préférences spécifiques pour certains endroits du génome. Ces particularités sont pour l’instant mal expliquées.

L’insertion d’un transposon entraîne la duplication de la séquence-cible génomique.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/DUPLIC.JPG


Types de mutations causées par les transposons

Insertions
1- dans une phase codante : interruption de la phase, polypeptide tronqué.
2- dans un intron, plusieurs possibilités :

  • aucun effet,
  • ou arrêt de la transcription dans le transposon : polypeptide incomplet;
  • ou épissage incorrect ou plus ou moins inhibé : polypeptide tronqué, ou protéine-chimère ou protéine correcte moins abondante.

3- en amont d'un gène dans une zone régulatrice : dérégulation

  • soit transcription inhibée (éloignement entre promoteur et séquences activatrices ou destruction de ces dernières,
  • soit transcription activée (promoteur propre faible, remplacé par un promoteur fort présent à l'intérieur du transposon); ceci peut conduire à l'induction ectopique (ectopique = autre lieu) de la transcription (dérégulation spatio-temporelle).

Inversions ou délétions
Ceci affecte les portions de génome situées entre deux éléments transposables :

  • dans la même orientation : délétion

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/transposondeletion.JPG

Notons que la réaction inverse est possible : l' intégration du facteur F dans le chromosome de coli par exemple se fait par recombinaison sur les séquences IS.

  • en orientation opposée : inversion

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/transposoninversion.JPG



Excision de l’élement transposable

  • parfaite : par recombinaison entre les séquences cibles (qui sont en orientation directe), restauration de la séquence sauvage, avec une seule séquence cible.
  • imparfaite : par recombinaison sur les LTRs (ex: Ty), une LTR reste au site d'insertion entre deux séquences cibles qu'on appelle LTR solo.
  • imparfaite : par cassure double brin et réparation imparfaite (ex: élément P), délétion de matériel génomique de part et d'autre du point d'insertion
  • réarrangement : addition de matériel génomique inconnu


Recombinaison

  • entre 2 éléments situés sur des chromosomes non homologues : translocation

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/transposontransloc.JPG

  • entre 2 éléments non alléliques mais situés sur des chromosomes homologues : translocation.


Conversion génique
Modification de la séquence d'un élément transposable par copie de la séquence d'un autre élément transposable du même type situé ailleurs dans le génome.


Modes de transposition

  • Par l’intermédiaire d’une coupure double brin, de chaque côté du transposon (élément P, Tc1). Celui-ci est libéré. C’est le même enzyme, la transposase, qui reconnait les pieds de l’élément, coupe les deux brins de chaque côté et qui ouvre la séquence-cible. Après excision le site génomique doit être réparé (cf la réparation après excision de l’élément P).
  • par l’intermédiaire d’une coupure simple brin (transposon procaryotes: Mu, Tn3). Les extrémités 3’OH libérées peuvent servir d’amorce à la réplication. Une réplication semi-conservative a lieu pendant la transposition (cf l’exemple de Tn3).
  • par l’intermédiaire d’un ARN (rétroéléments: Ty, retrovirus : HIV, Moloney murine leukemia virus, virus du sarcome de Rous). L’ARN est copié en ADN double brin qui s’insère dans l’ADN cible après coupure par l’intégrase.

Intérêts des transposons

Les transposons jouent un rôle important dans la dynamique des génomes.
Rôles :

  • Création de mutations nouvelles, de recombinaisons, de réarrangements des génomes. Ils contribuent au polymorphisme.
  • Création de nouvelles combinaison d’introns-exons,
  • Apparition de nouvelles fonctions cellulaires : constitution des centromères, système de réponse aux interférons, réparation des coupures double brin. Chez la drosophile les télomères sont des transposons .
  • On observe des cas de co-évolution du génôme de l'hôte et du transposon (ex de Ty).
  • En génétique moléculaire appliquée, nombreux usages:

·        Mutagénèse et sélection de mutants,

·        Clonage de gènes (voir Tn917lac et élément P),

·        Vecteurs pour transfert de gènes.

 

 

LES TRANSPOSONS PROCARYOTIQUES



Historique
Chez les bactéries, découverte des éléments génétiques mobiles comme les plasmides, épisomes et phages, en particulier le phage Mu, au cours des années 1955-65. Découverte des séquences IS (insertion séquences) en 1968 dans l’opéron gal de E. coli et d’un transposon porteur de résistance à l’ampicilline chez Pseudomonas aeroginosa en 1971.



Les séquences IS


Mise en évidence
Découverte des séquences IS1 par Jordan et al. : mise en évidence de mutations polaires dans l’opéron galETK. Celui-ci est composé de trois gènes codant pour une épimérase, une transférase, une galactokinase ; lorsqu’il est induit cela permet à la bactérie de croître sur galactose comme source de carbone. Les mutations polaires isolées abolissent l’expression des gènes de l’opéron situés en aval.
1- Caractéristiques des mutations polaires:

  • Abolition complète de l’expression, au contraire des mutations polaires classiques dues à l’apparition d’un codon non sens (cf cours sur l’opéron lac).
  • Réversion spontanée vers le phénotype sauvage (donc il ne s’agit pas d’une délétion), mais le taux de réversion n’est pas augmenté en présence de mutagènes chimiques ou rayonnements (donc il ne s’agit pas d’une mutation ponctuelle, comme non sens, faux sens, décalage du cadre de lecture).


2- Analyse génétique et moléculaire :
Quand le phage l s’insère près de l’opéron gal (par déplacement du site attl) il peut encapsider la région gal, donnant naissance à un phage recombinant ldgal. Lorsque ce phage infecte une souche gal- , incapable de métaboliser le galactose il lui confère la capacité de pousser sur galactose. A partir d’une souche de coli contenant une mutation polaire décrite ci-dessus on obtient des phages ldgal* qui sont gal-. Analysés en gradient de densité en chlorure de césium on observe que ces phages sont plus lourds que les phages ldgal issus d’une souche sauvage. D’ou l’idée que l’ADN du phage ldgal* contient une séquence supplémentaire insérée dans la région gal. Si on dénature les 2 ADN phagiques ldgal et ldgal* , et qu’on les mélange dans des conditions ou ils peuvent se réhybrider, on observe des molécules hétéroduplexes contenant une boucle non hybridée, simple brin, dont on peut estimer la longueur à environ 800nt.
L'analyse de nombreuses mutations polaires de ce type par hétéroduplexes, montre que la plupart sont causées par deux séquences distinctes, IS1 et IS2 (1300bp env), insérées dans l’opéron gal.

Distribution des séquences IS :

1- Chromosome :

Ex : Le nombre de copies de IS1 par chromosome de E. coli K12 varie de 5 à 10 suivant les souches analysées. On en trouve 40 copies par chromosome chez Salmonella mais aucune chez Shigella. En général 1 copie de IS4 chez coli toujours située au même site.

2- Facteur F:

Présence d’une copie d’IS2 (ou IS3) sur le facteur F, insérée dans une région qui n’a aucune fonction dans la réplication ou la conjugaison. Les séquences IS2 (ou IS3) sont indispensables au processus d’intégration du facteur F dans le chromosome qui conduit aux bactéries Hfr : on en retrouve deux exemplaires, dans la même orientation, aux jonctions entre le chromosome et F. On a donc affaire à un processus d’intégration par recombinaison au niveau de deux séquences IS2 (ou IS3) l’une étant présente sur F et l’autre dans le chromosome. La capacité de transposition des IS permet donc l’intégration de F à de nombreux sites différents, conduisant à autant de bactéries Hfr différentes suivant les sites d’intégration des IS2 chromosomiques.

3- Plasmides :

On retrouve des IS sur des plasmides du type R, porteurs de résistance à un antibiotique, chez Salmonella et Proteus mirabilis : deux copies de IS1 aux jonctions entre déterminant de résistance et facteur de transfert RTF et dans la même orientation, ce qui peut conduire à la dissociation des 2 éléments par recombinaison et qui suggère qu’à l’inverse, ce plasmide R a été formé par insertion d’un transposon composé de 2 IS encadrant un gène de résistance (cf ci-dessous l’exemple de Tn10).


Exemples de séquences d’insertion IS :

Séquence IS

Occurence

longueur bp

IR bp*

Sequence cible bp

IS1

Chromosome d’E. coli (5 à 8 copies) de Salmonella (40 copies), nbx plasmides, phage P1, Tn951

768

18/23

9

IS2

Chr d’E.coli (5 copies), facteur F (1 copie), nbx plasmides

1327

32/41

5

IS50

constituant de Tn5

1534

8/9

9

IS101

plasmide pSC101 de E. coli

1209

30/36

5


*
le 1er nombre représente le degré de perfection du palindrome, le 2ème sa longueur.

Structure moléculaire
Longueur variable entre 700 et 5700bp en moyenne. Flanquées de 2 séquences inversées répétées plus ou moins parfaites (appelées IR), indispensables pour la transposition et probablement affines de facteurs de transposition. La longueur de la séquence cible génomique est variable d’une IS à l’autre, pas de séquence consensus. La partie centrale code vraisemblablement pour une activité transposase, c’est-à-dire endonucléase spécifique + intégrase, ce qui a été démontré pour IS50 qui flanque Tn5.



Transposons Tn


Historique
Découverte par Naomi Datta en 1971 :
A partir des années 50 on découvre chez certaines bactéries pathogènes des résistances, parfois multiples, à des antibiotiques. Il s’avère que celles-ci sont portées par des éléments génétiques capables de réplication et de transfert d’une bactérie à une autre. On les appelle facteurs R (pour résistance) et ils sont le cauchemar des hôpitaux. En langage " moderne " ce sont des plasmides ayant une origine de réplication et codant pour un ou plusieurs gènes de résistance. Ainsi, chez Pseudomonas il existe un plasmide, RP4, qui porte un gène (bla) codant pour la b-lactamase, qui confère la résistance à l’ampicilline. On observe que ce gène est capable de se transposer sur un autre plasmide non apparenté, R64. En 1972 Richmond et al. observent que le gène bla du plasmide RP1 (voisin de RP4 et collecté au cours de la même épidémie) peut s’intégrer dans le chromosome de E. coli puis sur deux autres plasmides n’ayant aucune homologie avec RP1. Ces auteurs nomment transposon ce nouveau type de gène sauteur, et font le rapprochement avec les séquences d’insertion IS. Dans les années suivantes les exemples se multiplient de transpositions affectant des gènes de résistance aux antibiotiques chez un grand nombre de bactéries aussi bien gram+ que gram-. On découvre aussi des transposons capables de conférer la résistance aux sels de métaux lourds (Tn501) ou la capacité d’utiliser une source de carbone (Tn951 lac).


Structure des Tn
Du point de vue de leur structure comme de leurs propriétés les Tn sont des séquences IS capables de transposer de façon autonome, et portant des gènes codant pour des fonctions variées, pouvant apporter un avantage sélectif à la bactérie qui les héberge, ceci compensant le coût de transposition qui apporte des mutations délétères.

Expérience:

Le plasmide R6 conférant la résistance à la tétracycline, est hémicoupé, dénaturé puis renaturé. On observe entre autres des structures en boucle-et-tige. La tige est double brin et longue de 1400bp et la boucle simple brin et longue de 6400bp: c’est donc que la séquence de la tige est présente deux fois dans le plasmide en position inverse : ce sont les séquences IR du transposon.
D’un type de plasmide à l’autre la longueur de cette tige est variable de quelques dizaines à 1500bp. Dans le variant R6-5, mutant de R6 qui ne confère plus la résistance à la tétracycline, la tige est inchangée mais la boucle simple brin est plus courte, ce qui permet de situer le gène de résistance tet dans la boucle.

Cette structure : 2 séquences IS encadrant 6,4kb contenant tet est celle du transposon Tn10.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/Tn3,9,10.JPG



Exemples de transposons de la série Tn :

Transposon

Marqueur*

Origine

longueur

IR bp

Séquence cible bp

Tn1

ampicilline

plasmide RP4 Pseudomonas aeroginosa

5kb

38

 

Tn3

ampicilline

plasmide R1 de Salmonella typhimurium

4957bp

38

5

Tn4

ampicilline, streptomycine, sulfonamide

plasmide R1 de Salmonella typhimurium

20,5kb

 

 

Tn5

kanamycine

plasmide JR67 de Klebsiella

5,7kb

1450 (IS50)

9

Tn9

chloramphénicol

plasmide pSM14 de Shigella

2638bp

23 (IS1)

9

Tn10

tétracyclines

plasmide pR100 de Shigella

9,3kb

1400 (IS10)

9

Tn501

sels de mercure

plasmide pVS1 Pseudomonas

5,2kb

38

5

Tn551

erythromycine

p1258 de Staphylococcus aureus (gram+)

5,3kb

37/40

5

Tn951

opéron lac

plasmide pGC1 de Yersinia enterolytica

16,6kb

41

 

Tn1696

gentamycine, streptomycine sulfamidés, chloramphénicol, ions mercuriques

plasmide R1033 de Pseudomonas

13,6kb

 

 


*
marqueur de résistance à un antibiotique ou autre


Structure d’un plasmide multirésistant

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/multiresistance.JPG



Applications. Exemple de Tn917lac.


Tn917-lac est un transposon modifié, dérivé de Tn917, qui permet de faire des fusions transcriptionnelles chez B. subtilis. L'objectif est de générer et sélectionner de nouveaux mutants chez B. subtilis et de les caractériser moléculairement.
Le transposon de départ, Tn917, est un transposon de B. subtilis, il est inséré dans un plasmide, il porte le gène de résistance à l’erythromycine, eryR.

Construction du dérivé Tn917lac:

On commence par construire un transposon modifié en se servant des outils mis au point chez E. coli et en les adaptant à B. subtilis.
On introduit in vitro dans Tn917 le gène lacZ amputé des 15 premiers codons et précédé des signaux de départ de traduction de spoVG , un gène de B. subtilis, et de ses 11 premiers codons, en phase avec lacZ. Ceci est nécessaire pour que lacZ soit traduit dans B. subtilis car les signaux d'initiation de traduction sont différents chez coli et subtilis (voir cours sur la traduction).

Mutagénèse et sélection de mutants:

On transforme des bactéries B. subtilis à l'aide de cet ADN. Dans certaines cellules Tn917-lac transpose dans le chromosome. On sélectionne des clones mutants qui sont résistants à l'erythromycine et bleus en présence de Xgal ce qui signifie que le transposon s'est inséré en aval du promoteur d'un gène de l'hôte: ce promoteur gouverne maintenant l'expression de lacZ.

Cette insertion dans le gène de l'hôte interrompt celui-ci et crée une mutation qui peut être repérée par un phénotype: on sélectionne donc parmi les clones eryR et bleus ceux qui ont un phénotype mutant intéressant.

Clonage du gène cible:
Ensuite on clone le gène interrompu par le transposon. Pour cela on transforme les bactéries mutantes avec le plasmide pTV21D2 linéarisé. Celui-ci possède le début de la séquence du gène eryR et la fin de la séquence de Tn. La recombinaison entre les séquences homologues a lieu in vivo et permet d’introduire à la fois:
- une cartouche de résistance au chloramphénicol (gène cat) qui servira pour la sélection dans B.subtilis,
- le gène de résistance à l'ampicilline (ampR) et une origine de réplication, pour la sélection et l’amplification dans E. coli.
Après sélection des clones résistants au chloramphénicol (et sensibles à l'érythromycine) on va pouvoir récupérer la portion 5' du gène cible par "sauvetage de plasmide" . Pour cela on digère l'ADN chromosomique de chaque clone CmR, eryS par l'enzyme HindIII puis on fait agir la ligase. Parmi les multiples réactions catalysées par celle-ci il y a un plasmide (cercle refermé sur lui-même portant une origine de réplication autonome et le gène de résistance à l'ampicilline) portant le début du gène cible. Par transformation de E. coli avec le milieu de ligation et étalement sur milieu contenant de l'ampicilline on sélectionne les cellules qui ont intégré le plasmide. Par analyse de restriction et séquençage on repère la portion de gène X clonée.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/Tn917noirblanc.JPG



La transposition


Spécificité d’insertion :
Les transposons bactériens comme ceux d’eucaryotes semblent s’insérer au hasard. Cependant on note la présence de points chauds (les insertions de Tn10 dans l’opéron his de Salmonella se font pour 40% en un point les autres étant distribuées entre 21 points différents), voire de spécificité parfaite au nucléotide près (IS4 dans galT). On ne peut donc parler de séquence cible consensus bien qu’on relève parfois des régularités (23 sur 28 des insertions de Tn9 séquencées dans lacZ ont un GC à chaque bout de la séquence cible de 9bp).
L’insertion est indépendante de recA (voir cours sur la recombinaison).

Caractère mutagène :
Les mutations causées par l’insertion sont souvent polaires : pour IS1, IS4 et Tn10 dans les deux orientations, pour IS2 et Tn3 dans une seule. La présence de transposons provoque facilement des inversions, fusions, délétions chaque fois qu’il y a deux copies du transposon.

Fréquence :
Fréquence moyenne 10-4. On observe une phase d’envahissement puis une stabilisation qui suggère que la transposition est régulée : trop de transposons causant des mutations délétères conduirait à l’éradication de l’espèce hôte donc du transposon.

Mécanisme

  • conservatif (simple saut): Tn5, Tn7, Tn10, Tn916, phage Mu en intégration initiale . Se fait par l’intermédiaire d’une coupure double brin de part et d’autre du transposon
  • réplicatif (cointégrat et gain net d’une copie du transposon après résolution): Tn3, Tn9, IS1. Transposition préférentielle sur les plasmides. Se fait par l’intermédiaire d’une coupure simple brin de part et d’autre du transposon.


http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/transporeplic.JPG


http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/multi%20transposon.JPG



Enzymes impliqués dans la transposition : exemple de Tn3.


Par étude de l’expression en minicellules du plasmide contenant le Tn3 sauvage, on obtient 3 protéines : la b-lactamase (29kD) , une protéine de 19kD et une autre de 120kD. Tn3 coderait donc pour trois gènes : en déduisant la taille des trois gènes et en additionnant on tombe effectivement sur la longueur de Tn3.

Une première série de mutants de Tn3 ont été construits in vitro, à partir d’un plasmide contenant le transposon Tn3 sauvage, par insertion au hasard d’un octanucléotide contenant un site de restriction pour EcoRI, (méthode: action ménagée de la DNAseI en présence d'ions Mn2+ et ligation en présence de l'octanucléotide). La position de l’octanucléotide dans les plasmides résultants est ensuite analysée par digestion par EcoRI. Les mutants de Tn3 ainsi obtenus ont été analysés pour leur capacité à transposer.

  • Un premier groupe ne transpose plus mais est complémentable en trans par une copie bla- de Tn3. Chez ces mutants la b-lactamase et la protéine de 19kD sont présentes.
  • Un second groupe transpose à très haute fréquence. Chez eux, la b-lactamase est présente ainsi que la protéine de 120kD.

Le gène qui est muté dans le premier groupe coderait donc pour une transposase de 120kD (tnpA),. Le gène muté dans le second groupe coderait pour un répresseur de transposition de 19kD (tnpR).

Une 2ème collection de mutants de Tn3, incapables de transposer, a été obtenue par des délétions de longueurs variables.

  • Chez un premier groupe, délétés dans la partie centrale du transposon, l’expression en minicellules montre que la b-lactamase est normale, et que la protéine de 120kD est absente. Ces mutants peuvent être complémentés en trans par une copie sauvage de Tn3. Parmi ceux-ci certains sont bloqués sous forme de cointégrat. Ceci montre que la transposition est réplicative. Il semble donc qu’il manque chez ces mutants "quelque chose" pour que la résolution se fasse, qui est codé par la région à gauche de bla. Cette région a été nommée " site interne de résolution , ou SIR ".
  • Un second groupe, délétés des IR, ne sont pas complémentables en trans par une copie sauvage de Tn3.

La transposition nécessiterait donc trois sites en cis : les deux IR et le SIR. Le site SIR, est long de 19bp et est situé entre les gènes tnpA et tnpR, c'est le point de résolution du cointégrat, là où se fait le crossing-over.
Chez certains mutants on observe que la protéine de 19kD est présente mais tronquée et dans ce cas elle est plus fortement exprimée que chez le sauvage. Ceci suggère que la synthèse du répresseur est autoréprimée.
Le répresseur a également une fonction de résolvase des cointégrats.

 

 

 

L'ELEMENT P CHEZ DROSOPHILA melanogaster

Dysgénèse des hybrides de type P-M


On classe les drosophiles en deux catégories: souches P ou souches M. Selon le sens du croisement la progéniture pourra présenter un taux anormalement élevé de phénotypes mutants spontanés, on dit qu'il y a "dysgénèse" :

 

Femelle M

Femelle P

Mâle M

progéniture normale

progéniture normale

Mâle P

progéniture dysgénique

progéniture normale

 

Croisement dysgénique

Croisement non dysgénique

femelle souche M X mâle souche P

femelle souche P X mâle souche M

Progéniture en F1
normale à 21°C, stérile à 29°C par
atrophie des gonades

Progéniture en F1 normale
à toute température

Croisements des F1 entre eux

Progéniture en F2 présente un haut
taux de mutations (10-3 ou plus)

Croisements des F1 entre eux

Progéniture en F2 normale,




Conclusions
Les phénomènes dysgéniques sont spécifiques de la lignée germinale.
Chez les mâles P la capacité à provoquer l'apparition de mutations par croisement avec des femelles M s'appelle l'activité P.
Chez les femelles P la capacité de contrecarrer l'activité P s'appelle le cytotype P.

Mise en évidence de l’élément P : analyse génétique de la mutation singed weak .

Cette mutation, à l’état homozygote, donne des soies du thorax faiblement ondulées au lieu d’être droites. Le locus singed (sn) est situé sur le chromosome X.

Expérience:

Croisement d’une femelle portant la mutation singed weak homozygote avec un mâle sauvage d'une souche P. Puis croisement des mouches de la F1 entre elles.
A la génération F2 on obtient un nombre anormalement grand (1 sur 1000 c’est-à-dire taux 1000 fois supérieur au taux de mutation spontané) de mouches ayant des phénotypes différents de ceux des parents:

·        singed plus accentué (soies très frisées)

·        réversion vers le phénotype sauvage

·        autres phénotypes différents de singed apparaissant chez les mâles.

En d'autres termes dans ce croisement, d’une part le locus singed mute à une fréquence très élevée, d’autre part on met en évidence des mutations sur le chromosome X ailleurs qu’au locus singed.


Analyse moléculaire de la mutation singed weak et de ses dérivées.
Southern sur l’ADN génomique des différents mutants coupé par des enzymes de restriction appropriés et sondés avec l'ADN du locus sninged sauvage. On trouve que, chez les révertants sn+ et les mutants ayant un phénotype singed plus fort, la structure du locus singed est modifiée par rapport à celle de l’allèle de départ singedweak.


Interprétation.
La mutation singed weak correspond à l'insertion dans le gène singed d'un élément transposable défectif c'est-à-dire immobile par lui-même. Le croisement avec le mâle P mobilise cet élément défectif qui peut alors s'exciser (créant ainsi une réversion) et transposer (créant ainsi de nouvelles mutations dans d’autres gènes) . Il peut aussi s’exciser imparfaitement avec délétion -de quelques bp à plusieurs kb- du génome flanquant, créant ainsi de nouvelles mutations au locus singed ayant un phénotype plus accentué.
Ce nouveau type d'élément transposable a été appelé élément P.
On trouve dans le génome (haploïde) des souches de drosophile de type P, 40 à 50 copies de l'élément P, dispersées au hasard. La localisation des éléments P varie d'une souche à l'autre, ce que l’on met en évidence par cytogénétique sur les chromosomes polytènes, ou par Southern de l'ADN génomique, grâce à une sonde contenant la séquence de l’élément P. Certaines insertions provoquent des phénotypes visibles, d’autres non (mutations silencieuses).

Historique de lenvahissement.


Avant 1940, les souches naturelles de drosophile collectées dans la nature et cultivées dans les laboratoires étaient toutes de type M c’est-à-dire dépourvues d’éléments P. Depuis 1960 les souches naturelles sont envahies d’élements P, sur toute la planète, même dans des endroits très reculés. L'élément P a envahi le génome de D. melanogaster à partir d'une autre espèce, D. willistoni, dans un foyer d'Amérique centrale où ces deux espèces cohabitent. Le mécanisme initial reste hypothétique, peut-être par l'intermédiaire d'un acarien piqueur qui vit dans la même région. Cependant le phénomène n'a pu être reproduit en laboratoire. L'envahissement s'est fait très rapidement car P transpose à forte fréquence et aussi à cause des migrations humaines qui aident les drosophiles à se disséminer.

 

Structure de l'élément P complet.


En 5’ et en 3’ on trouve une séquence de 31bp inversée répétée (IR) qu'on appelle aussi les "pieds" de l'élément P. Les 4 exons (ORF 0, 1, 2, 3) correspondent à 4 phases de lecture ouverte permettant la synthèse de 2 polypeptides dont un ayant une fonction de transposase.
La séquence cible dupliquée est de 8bp et n'est pas spécifique.
Certains P sont défectifs par suite de délétions internes plus ou moins longues mais les séquences IR de 31bp sont présentes. Dans ce cas la transposase n'est pas fonctionnelle et les P défectifs sont immobiles par eux-mêmes (donc les mutations provoquées par l’insertion de ces éléments sont stables, tant qu'il n'y a pas introduction d’une source de transposase fonctionnelle). Les éléments P défectifs représentent la majorité des 40 copies de P trouvées en moyenne par cellule.

La transposase ne s'exprime que dans la lignée germinale.

Des mutations de décalage du cadre de lecture dans les ORF 0,1,2,3 bloquent la transposition. Donc la transposase est le grand polypeptide. Or le grand transcrit est trouvé seulement dans les cellules sexuelles. L'analyse des transcrits dans le soma montre que les introns 1 et 2 sont épissés mais pas l'intron 3: ceci donne naissance à une protéine plus courte. Lorsqu'on réintroduit dans le génome, un transgène contenant l’élément P modifié dans lequel l'intron 3 a été délété, on détecte de fortes quantités du transcrit long dans toutes les cellules somatiques et on y met en évidence la transposase par détection immunologique.
On peut en conclure qu'il y a un épissage alternatif régulé de l'intron 3, aboutissant à une expression de la transposase restreinte à la lignée germinale.

 

Interprétation de la dysgénèse des hybrides


L'apparition de nombreuses mutations en F2 serait due à l'envahissement des chromosomes M (= vides de d’élements P) de la femelle par les transposons présents dans les chromosomes du mâle. On n'observe pas de mutations en F1: il faut donc que les transpositions n'aient lieu que dans la lignée germinale et ne seront donc visibles qu’à la génération suivante. Ceci est confirmé par le fait qu'on observe une malformation des gonades voire une stérilité des mouches de la F1 à 29°C.

ovule M (vide déléments P) X spermatozoïde P

Les zygotes se forment qui donnent naissance à des adultes "normaux" phénotypiquement. Chez ces adultes:

 

Lignée somatique

Lignée germinale

La transposase ne s’exprime pas. Eléments P immobiles.

La transposase s’exprime.
Transposition des éléments P qui s’insèrent dans les chromosomes maternels

Gamètes contenant de nouvelles mutations.

A la génération F2, par croisement des frères et soeurs on aura une expression somatique des mutations.

La transposition ne se produit pas dans le croisement réciproque:

femelle P X mâle M

Il faut donc supposer que les ovules P, qui contiennent beaucoup de cytoplasme contrairement aux spermatozoïdes, contiennent un inhibiteur de la transposition qui empêche les éléments P des chromosomes femelles d'envahir les chromosomes mâles. Cet héritage maternel est du à la présence des éléments P eux-mêmes. En effet en faisant plusieurs fois de suite le croisement: femelle P X mâle M,
en prenant à chaque fois les femelles de la F1 et en les recroisant avec des mâles M nouveaux, on finit par perdre le cytotype P, car on "dilue" les chromosomes d'origine P. Il s'ensuit que la concentration du répresseur de transposition diminue et que le taux de transposition augmente.


Quelle est la protéine répresseur de la transposition en cytotype P?
Le polypeptide court de 576aa joue un rôle mais le mécanisme est plus compliqué et fait intervenir des protéines de l’hôte.

 

Mécanisme d'excision-insertion.


L'excision se fait par une cassure double brin à chaque extrémité du transposon. Dans les 3/4 des cas les cassures se produisent après réplication, donc quand on a quatre chromatides. Ensuite il y a compétition entre l’élargissement de la brèche par les exonucléases cellulaires et la réparation. Celle-ci s’opère à partir des extrémités 3’ OH libres qui recherchent des séquences homologues qui serviront alors de matrice à l'ADN polymérase. Ces séquences homologues se trouvent soit sur la chromatide-soeur soit sur le chromosome homologue, mais peuvent être aussi des séquences homologues situées ectopiquement.

·        Réparation sur la chromatide-soeur: il y a reconstitution au site d’excision des séquences de l’élément P, donc pas de modification.

·        Réparation sur le chromosome homologue: si celui-ci est sauvage on a une réversion. S'il est muté recopie de la mutation.

·        Dans les deux cas la réparation peut-être imparfaite. Les exonucléases hydrolysent les extrémités libres, la recherche de séquences homologues pour la réparation ne se fait pas ou mal et la réparation se fait par ligature brutale des extrémités libres (fermeture de deux liaisons phospho-diester). On a alors délétion de séquences génomiques ce qui conduit à de nouvelles mutations. La ligature peut aussi avoir lieu alors que la réparation par homologie est en route, on a alors recopie imparfaite des séquences du P et création de P défectifs.

·        Dans tous les cas le P excisé peut s'insérer ailleurs: transposition, donc nouvelles mutations dans d'autres locus. La transposase de P coupe l’ADN génomique de façon décalée sur les deux brins à 8 nucléotides de distance.

 

Applications:

L'élément P vecteur de transformation germinale.


Débuts de la transgénèse chez la drosophile :
Spradling et Rubin 1982 .
Chez les procaryotes et la levure le transfert de gène d'une cellule à l'autre était déjà pratiqué depuis longtemps (conjugaison, transformation, recombinaison homologue, transduction par des phages). Chez les métazoaires la difficulté vient du manque de vecteurs appropriés. Il faut en effet que l'ADN cloné in vitro, "transgénique", se déplace du site extrachomosomique de construction (plasmide, virus) à un site intrachromosomique, dans une cellule germinale, pour que le transfert soit stable et se transmette de génération en génération.
Chez la drosophile ce vecteur est l'élément P, capable de transposer d'un vecteur plasmidique dans l'ADN chromosomique des noyaux des cellules germinales. Ses propriétés en font un vecteur de choix car il transpose à haute fréquence, dans des conditions bien contrôlables, il n'a besoin pour cela que de la transposase spécifique codée par l’élément P lui-même et des quelques dizaines de nucléotides présents à ses deux extremités (qu’on appelle les " pieds " de P).

La transformation


On injecte, à l’aide d’un micromanipulateur, dans un œuf de drosophile agé d’environ 1h à 1h30 après la ponte, deux plasmides différents en même temps. L’un porte le transgène, l’autre la source de transposase. A cet âge l'embryon est un syncitium.
Structure du plasmide portant le transgène :


Il porte au minimum la séquence à étudier et un marqueur de transgénèse (gène rosy, white , ou neo), placés entre les pieds de lélément P. On peut ajouter aussi des séquences plasmidiques (ori et ampR) qui permettront le clonage ultérieur des séquences génomiques flanquantes (voir ci-dessous).

Evènement recherché :
1- le plasmide portant le gène de la transposase pénêtre dans un noyau y est transcrit, et traduit dans le cytoplasme syncitial de l’embryon ;
2- la transposase entre dans un noyau d’une cellule souche germinale en même temps que le plasmide contenant le transgène; elle catalyse à la fois la coupure du plasmide vecteur contenant le transgène au niveau des "pieds de P" et de l'ADN chromosomique au hasard, et y insère le transgène.
Le transfert de gène est accompli avec une efficacité raisonnable. Le gène transféré est stable (non remanié); il se transmet de façon stable aux générations suivantes; il est exprimé et garde sa fonction normale. Par exemple, si le gène transféré est l’allèle sauvage d'un gène, il a la capacité de complémenter les allèles mutants et de corriger le défaut génétique.


Les problèmes étudiables par transgénèse

·        Après clonage d'un gène, vérifier que la copie clonée complémente tous les allèles mutants.

·        Introduire in vitro des mutations dirigées sur le gène sauvage cloné, transférer le gène muté dans le génome (dans un contexte génétique ou le gène en question est délété ou inactivé) et observer le phénotype.

·        Etudier l'expression d'un gène X au cours du développement, en fonction du temps et du type de tissu. Dans ce cas le transgène contient la zone régulatrice (enhancer) et le promoteur du gène à étudier, placés en amont de la phase codante d'un gène rapporteur, par exemple lacZ ou GFP (green fluorecent protein). Ceci permet de décortiquer des zones régulatrices et d’en déterminer les motifs essentiels.

·        Obtenir des lignées "détecteurs d'enhancers" ou "pièges à gènes". Un enhancer est une séquence d'ADN sur laquelle se fixent des protéines régulatrices, responsables de l'induction spatiotemporelle de la transcription d'un gène. On utilise un transgène contenant un gène rapporteur (par ex lacZ) précédé d'un promoteur minimum et dont l'expression sera induite par des séquences régulatrices situées dans le voisinage du point d'insertion du transgène. On sélectionnera les lignées qui expriment le gène rapporteur selon le profil d'expression recherché, dans un type cellulaire particulier et/ou à un moment donné du développement. La structure du transgène permet ensuite de cloner les régions génomiques adjacentes par "sauvetage de plasmide".

·        Etudier le phénotype produit par la surexpression d'un gène X ou par son expression ectopique (c'est-à-dire l'expression dans des territoires, et/ou à des stades du développement, inhabituels ). On utilise un transgène contenant le gène à étudier placé sous le contrôle d'un promoteur inductible, par exemple par un choc thermique (hsp70). De façon plus ciblée, on peut placer le gène X sous le contrôle des séquences dites UAS (pour upstream activating sequences) qui contiennent des motifs de reconnaisance pour le facteur de transcription de levure GAL4 ; en introduisant alors dans la lignée le gène GAL4 sous le contrôle d’un promoteur spécifique on pourra diriger spécifiquement l’expression du gène X dans un territoire donné ou à un moment donné.

·        Le système UAS-GAL4 permet également d’étudier le phénotype produit par la surexpression d’un gène : on peut mettre GAL4 sous le contrôle d’un promoteur fort, ce facteur de transcription sera alors fortement exprimé ce qui entraînera la surexpression du gène étudié.

Exemple :

Mutagénèse chez la drosophile par insertion létale sur le chromosome X, d'un transposon détecteur d'enhancer (enhancer-trap) de type PlacW.


Le but
: saturer le chromosome X en mutations létales.
Le séquence du génome de la drosophile a été entièrement déterminée en mars 2000. L’annotation de cette séquence, c’est-à-dire le repérage des unités de transcription (point de départ et de terminaison de la transcription, sites d’épissage) permet de prévoir l’existence d’environ 13600 gènes différents. Or seulement 2500 gènes ont été identifiés génétiquement par des mutations et moléculairement caractérisés au cours d’un siècle d’études par toute la communauté des drosophilistes, avant le projet de séquençage systématique. Des mutagénèses par insertion d’éléments P entreprises au cours des 10 dernières années ont permis d’identifier de nombreux gènes essentiels mais situés principalement sur les autosomes : les gènes du X qui représentent environ 1/6 des gènes totaux sont sous-représentés dans les collections actuelles de mutants. D’où l’entreprise ci-dessus.

Le transposon : c’est un élément P modifié qui permet:

1- de créer une mutation de par son insertion dans un gène ,
2- de détecter la proximité d’une région régulatrice (enhancer) par observation de l’expression de lacZ, repérée par la couleur bleue des tissus en présence de XGal; cela permet donc de savoir dans quels tissus et quand le gène interrompu s’exprime ;
2- de cloner les régions génomiques adjacentes au transposon et de les séquencer donc de savoir dans quel gène (identifié après séquençage total) le transposon est tombé.
Ce transposon s’insère préférentiellement dans les régions 5’ des gènes ou dans des introns (85% des cas) ; on ne sait pas pourquoi.



Le crible : élaboré pour sélectionner des femelles hétérozygotes, portant une insertion d’un transposon qui cause la létalité à l’état homozygote et donc aussi chez les mâles qui sont hémizygotes. Les marqueurs de sélection Bar, Cy et Dr sont dominants.
Le croisement 0 permet de construire une progéniture femelle portant à la fois un transposon P modifié, immobile par lui-même, et une source de transposase.
Dans la lignée germinale des femelles sélectionnées la transposase s’exprime et le transposon bouge, quittant sa position initiale sur le chrII pour une autre position. Ce faisant, il peut interrompre un nouveau gène et créer un phénotype mutant. Le croisement 2 permet de savoir, en regardant la progéniture mâle, si la nouvelle insertion est sur un autosome (lignées éliminées), sur le X mais viable (éliminées) ou létale (conservées) (voir figure ).





Les résultats :
279 lignées létales indépendantes ont été sélectionnées.
Par la séquence on a identifié 133 gènes touchés (donc pour certains il y a plusieurs allèles). On repère même un point chaud dans un gène : 13 insertions différentes.
Parmi ces 133 gènes essentiels, seuls 50 étaient déjà connus, c’est-à-dire qu’on possédait déjà des mutants pour ces gènes et le plus grand nombre avaient déjà été clonés. Ceci permet de valider le crible .
Donc 83 étaient inconnus. Pour certains, en examinant la séquence protéique déduite, on a pu prédire une fonction pour la protéine correspondante par homologie de séquence avec des motifs déjà connus ; pour d’autres la protéine déduite ne ressemblait à rien de connu, pourtant elle a probablement une fonction essentielle: tout est à étudier.





Exemples de coloration :
La b-galactosidase est précédée d’une séquence d’adressage nucléaire : on la retrouve donc dans les noyaux (gros dans les tissus polytènes, petits dans les autres comme les disques imaginaux).
Lignée PL15 : marquage dans la glande en anneau, lieu de synthèse des hormones de mue et de métamorphose (ecdysone). Gène amnesiac, code pour un précurseur de neuropeptide (hormone) impliqué dans l’apprentissage, la mémoire et l’olfaction. Mutants déjà connus.
Lignée PL38 : marquage dans le disque imaginal d’aile. Gène fascicline 2 ; protéine membranaire impliquée dans la différenciation des neurones ; mutants déjà connus.
Lignée PL28 : marquage dans les ovaires, en particulier marquage en gradient antérodorsal dans les cellules folliculaires. Gène nouveau, probable fonction de facteur de transcription, pas d'autres mutants connus.

Perspectives

L’élément P et la transgénèse ont permis des avancées considérables dans l’étude de la drosophile, de son métabolisme, du mode de réparation de son ADN, de son développement, de la structure de la chromatine, de l’étude de la morphogénèse des organes etc. Il permet maintenant d’utiliser la drosophile comme organisme-modèle pour étudier des gènes, des mutations et des maladies présentes chez l’humain.

Exemple :

Chez l’Humain, 10 maladies neurodégénératives (maladie de Hungtington, ataxie spinocérébelleuse de type I, etc...) sont causées par des expansions de triplets codant la glutamine. Par exemple, dans le gène codant pour l'ataxine dans le cas de la maladie nommée ataxie spinocérebelleuse: la protéine ainsi rallongée devient toxique. Pour mieux comprendre le mécanisme de dégénérescence nerveuse on se sert de la drosophile:

·        Première étape : On crée des lignées transgéniques portant le gène humain ataxine-1 normal ou muté et on cible son expression dans divers tissus grâce au système UAS-GAL4. On trouve ainsi que l’expression du gène sauvage ne cause aucun phénotype alors que celle du gène muté provoque la formation d’inclusions protéiques dans les noyaux des neurones, comme c’est le cas dans la maladie humaine, ceci entrainant la neurodégénérescence (par ex dans l’oeil et le système nerveux central). Le phénotype observé est d’autant plus fort que l’expansion des triplets Glu est plus forte. On trouve que les inclusions nucléaires contiennent outre l’ataxine, des protéases, de l’ubiquitine et des chaperonnes. On peut ainsi supposer que la voie de dégradation des protéines ubiquitine-dépendante (protéasome) est impliquée dans la formation des inclusions toxiques et l’étudier en détail.

A partir de ces résultats on peut se servir de la drosophile comme d’un organisme-modèle pour étudier le mécanisme de neurodégénérescence :

·        Deuxième étape: on peut faire une mutagénèse sur cette lignée transgénique pour sélectionner des mutants dans de nouveaux gènes sur la base de phénotypes modifiés. En effet si d’autres gènes sont impliqués dans la même voie soit comme activateurs soit comme répresseurs, on attend dans le premier cas un phénotype atténué (suppression) et dans le second un phénotype accentué (accentuation).

Troisième étape : une fois trouvés les gènes impliqués chez la drosophile, repérer les mêmes chez l'humain par homologie de séquence.

 

 

 

Caractéristiques de quelques rétrotransposons

Type

Famille

Sequence cible (bp)

nb copies/
genome
haploide

longueur
(kb)

Longueur
LTR (bp)

ORFs
homologues à

I

copia (D.m.)

5

30

5,1

276

gag, pol

I

412 (D.m.)

4

30

7

500

gag, pol, env?

I

Ty (S. c.)

5

35

5,9

330

gag, pol

 

 

 

 

 

polyadényla-
tion en 3'bp*

 

II

I (D.m.)

10 à 14

10

5,4

4 à 7 (TAA)

pol (RT)

II

Line 1 (H.s)

9 à 19

103 complets
105 tronqués

6

AATAAA

pol (RT)

* Pas de LTR chez les retrotransposons de classe II, mais présence d'une région riche en A.

D.m. = Drosophila melanogaster

S.c. = Saccharomyces cerevisiae

H.s. = Homo sapiens

 

 

LES RETROTRANSPOSONS: L'élément Ty de S. cerevisiae

Mise en évidence

  • Mutation : adh2 constitutive. L'ADH2, qui code pour une alcool déshydrogénase est normalement induite par l'éthanol, mais sa synthèse est réprimée en présence de glucose. On a obtenu des mutants constitutifs pour Adh2 en présence de glucose. L'analyse moléculaire du mutant montre une insertion de l'élément Ty en amont du gène adh2 et en sens inverse par rapport à la transcription de adh2. Ceci perturbe la régulation (par ex par éloignement des séquences qui fixent le répresseur), et l'ARN d'adh2 est exprimé constitutivement.
  • Mutation his4-. Insertion de Ty dans la région promotrice du gène HIS4, qui sépare le gène de son promoteur (Ty est inséré en sens inverse). Par excision partielle de Ty qui laisse une séquence LTR solo (séquence d) on obtient une réversion partielle au phénotype sauvage.
  • Analyse en Southern de l'ADN de 3 souches différentes de S. cerevisiae et sondage par la séquence de Ty. On obtient trois profils de répartition de bandes différentes. On obtient environ 35 bandes hybridées avec la sonde par génome haploide. Donc les insertions de Ty sont nombreuses (environ 1% du génome haploide ) et au hasard.
  • Une des trois souches précédentes est ensemencée dans trois flacons différents qui sont cultivés 30jours d'affilée en ré-ensemençant une aliquote dans du milieu neuf tous les jours. A la fin on analyse l'ADN des 3 cultures comme précédemment. L'une d'elle a varié : apparition d'une bande supplémentaire révélée par la sonde Ty. Donc Ty est capable de transposer. Cette expérience permet de calculer la fréquence de transposition de Ty: 10-7 à 10-8 (une fois toutes les 20 générations environ). La fréquence d'excision est plus élevée (=fréquence de réversion) : 10-5 à 10-6.


Il existe plusieurs familles apparentées de Ty. Ty1 est la plus fréquente et se rencontre à 35 copies environ/génome haploïde. Outre ces 35 copies de Ty on trouve dans le génome de la levure une centaine de séquences LTR solos. De plus les différentes copies de Ty ne sont pas identiques : on met en évidence un polymorphisme de restriction. La plupart sont des Ty défectifs, parfois réduits à une LTR solo.
On trouve des points chauds d’insertion de Ty au voisinage des gènes codant pour des tARN ce qui suggère que le transposon intéragit avec une des protéines de la machinerie de transcription par polIII (par ex TFIIIb). Par ex dans le chromosome 3 on trouve 17 insertions "naturelles" de Ty1 dans un fragment de 200kb. Parmi elles 16 sont dans des gènes codant pour des tARN. Lorsque Ty se trouve inséré dans un plasmide multicopie on trouve dans le cytoplasme de la cellule de levure des pseudo-particules composées de molécules d'ARN de Ty entourées de protéines (voir ci-dessous).


Structure et expression
Comme les rétrovirus Ty est borné en 5’ et en 3’ par une LTR. Les 2 LTR sont semblables et placées en répétition directe. La LTR amont joue le rôle de promoteur. La LTR aval, par son site de polyadénylation arrête la transcription. La levure haploïde contient beaucoup de transcrits spécifiques de Ty : environ 5 à 10% des ARNs polyadénylés.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/LTR.JPG


Un grand transcrit démarre dans la LTR amont (U3) et se termine dans la LTR aval (U5) et contient deux fois la région R. On trouve deux cadres de lecture différents, lus dans le même sens mais chevauchant de 13 codons et décalés de +1 base. Le premier ORF, TyA, code pour une protéine affine de l'ARN et homologue de la protéine gag des rétrovirus (protéines de nucléocapside qui empaquètent l'ARN viral). Le second ORF, TyB, code pour une protéine homologue de la protéine pol des rétrovirus et qui a des fonctions de réverse transcriptase (RT), protéase et intégrase. Des mutations dans l'ORF TyB de Ty1 entrainent l'impossibilité de transposer.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/ADNTy.JPG


Le cadre de lecture de TyA donne naissance à une protéine de 55kD : la traduction s'arrête normalement au codon stop. La protéine TyB est exprimée comme une portion d'une protéine de fusion gag-pol de 5400nt. TyA et TyB sont fusionnés par outrepassement du codon stop de TyA qui se produit dans un petit nombre de cas : 13 codons avant le codon stop il y a glissement du cadre de lecture en position +1, sur un heptanucléotide. Ensuite la protéine de fusion est clivée par la fonction autoprotéasique de TyB et donne une protéine de 90kD qui a une fonction réverse transcriptase (RT). La protéine de fusion représente 5% seulement des produits traduits totaux à partir de Ty. C'est donc une manière de répondre à une nécessité : il faut beaucoup plus de gag - protéines de structure nécessaires pour faire les pseudoparticules qui se multiplient à l'intérieur des cellules - que de pol, nécéssaire en quantité catalytique pour faire la réverse transcription et l'intégration dans le génome (cf ci-dessous).

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/Ty.JPG


En fait malgré 35 copies de Ty par cellule on ne détecte pas d'activité RT notable, il est vrai que beaucoup de copies sont défectives. On peut détecter une activité RT, seulement en présence d'un plasmide multicopie portant Ty complet.


Ty transpose par l'intermédiaire d'un ARN.

  • Expérience 1

Co-transformation d'une souche de levure his3- par deux plasmides :
- le premier contient la phase codante du gène sauvage HIS3, sans promoteur;
- l'autre contient l'élément Ty modifié : 243bp de la LTR amont sont enlevées et remplacées par le promoteur de GAL4 inductible par le galactose. D'autre part un intron est introduit dans la phase codante de Ty. (NB : Ty sauvage ne contient pas d'intron).
On fait croître la levure en présence de galactose : ceci induit la transcription de Ty plasmidique à un haut niveau.
On sélectionne les colonies capables de pousser sur milieu minimum donc his+.
et on analyse leur plasmide n°1 contenant le gène HIS3. On y trouve Ty, qui s’est inséré en amont de HIS3, sans trace d’intron. La séquence complète de la LTR amont a été reconstituée (absence du promoteur de GAL4). Ce sont les promoteurs contenus dans les LTR qui permettent la transcription non seulement de Ty mais aussi de HIS3, conduisant à un phénotype his+.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/TraspositionTy.JPG

·        Expérience 2

La seconde expérience permet d'écarter l'hypothèse qu'un Ty sauvage résident de la levure ait transposé dans le plasmide. C'est peu probable car on a spécifiquement induit la transcription du Ty plasmidique par le galactose et la fréquence de transposition spontanée de Ty est de 10-7. Neanmoins il faut écarter cette hypothèse.
Dans cette expérience non seulement l'intron, mais aussi les séquences flanquantes exoniques d'un autre gène de levure, sont introduites dans Ty.
On retrouve dans ce cas les séquences exoniques (mais pas l'intron) intégrées dans le Ty qui a transposé dans le plasmide.

Conclusion :
Il y a eu épissage de l'intron avant intégration. Donc la transposition s'est faite par l'intermédiaire de la transcription de Ty. En outre, le processus permet de reconstituer la LTR amont.



Mécanisme de réplication- transposition.


Une copie génomique (ou plasmidique dans le cas de l’expérience ci-dessus) de Ty1 est transcrite en ARNm, traduite en polyprotéines gag et pol. L’ARNm est utilisé comme matrice par la RT pour sa réplication en ADNc double brin. En effet c'est un double brin d'ADN qui s'intègre par transposition.
Les produits de gag s'assemblent en particules pseudovirales visibles dans le cytoplasme. Ces particules sont particulièrement abondantes quand la transcription de Ty est sous la dépendance du promoteur GAL4, en présence de galactose. On peut alors les séparer et étudier leur composition. On y trouve :

les produits de gag
les produits de pol
l'ARNm de Ty
un tARN cellulaire de levure, le tARNMet.

Ce tARN servira spécifiquement d'amorce pour la réverse transcription. Une séquence de 10nt du tARNMet (position 67-76) est complémentaire d'une région en aval de la région U5 de la LTR 5’. Le 3'OH du tARN est libre et sert d'amorce pour la réverse transcriptase de Ty, qui synthétise l'ADNc U5-R. Si on mute la séquence d'amorçage sur Ty1 la fréquence de transposition chute énormément. La fréquence normale est rétablie si on mute de façon complémentaire le gène de l'ARNtMet.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/mutetARN.JPG


La réplication en ADN double brin se fait par sauts successifs, c’est un mécanisme compliqué, en tout point semblable à la réplication des rétrovirus, qui ne sera pas détaillé ici (cf cours de maitrise).
La protéine pol qui, outre son activité RT possède une activité intégrase, coupe le génôme de l’hôte et y insère l’ADN double brin nouvellement synthétisé, matérialisant ainsi la transposition de Ty.

 

 

LES RETROTRANSPOSONS DE CLASSE II


Caractéristiques générales
Pas de LTRs. Côté 3' on trouve une portion finale riche en A ce qui suggère que, comme pour les rétrotransposons de classe I (Ty de levure par exemple), il y a eu intervention d'un ARNm.
Duplication de la séquence cible mais elle est de longueur variable pour un même élément dans un génome.
Présence d'une ou deux ORF qui présentent des homologies de séquence avec la réverse transcriptase (RT) des rétrovirus et des rétrotransposons de classe I.
Le mode de transposition est mal connu, probablement différent des transposons de classe I puisqu'il n'y a pas de LTR.

Eléments LINES (long interspersed sequences)

Très grande variabilité parmi les membres de la famille.
On trouve en moyenne pour Line1, 20 000 à 50 000 copies par génome de mammifère. Dans le génome humain par exemple, on trouve 103 copies complètes et 105 copies incomplètes. La plupart sont tronquées côté 5'.

Structure du prototype :
6,5kb de long. Il y a 2 ORFs, l'un de 1137bp, l'autre de 3900bp qui se chevauchent sur 14nt. La plupart des éléments Lines ne portent pas de gènes fonctionnels : les 2 ORFs sont parfois coupées par des codons stop ou parfois on trouve des décalages du cadre de lecture d'un élément Line à l'autre. Cependant l'ORF II conserve des homologies avec la RT des rétrovirus et dans un certain nombre de cas code pour une RT fonctionnelle.
Pas de LTR mais la région en 5’ des ORF contient un promoteur et la région en 3’ est riche en A.


Mécanisme de transposition

Il est mal connu : pas de LTR donc le mécanisme de réplication de l’ARN en ADN double brin suceptible de s’intégrer dans le génome de l’hôte est probablement différent de celui des rétrotransposons de classe I. Cependant on a pu observer que certains Line transposaient (cas de la mutation dans le facteur VIII de coagulation sanguine). Dans certains cas on a pu montrer que certains éléments Line étaient capables d'assurer non seulement la réplication (et donc la transposition) de l'élément Line lui-même mais aussi d’autres éléments Line défectifs ou d’éléments Sines (cf ci-dessous) ou de pseudogènes.

Eléments SINES (short interspersed sequences)

Elles sont appelées séquences Alu chez l'humain, parce que la séquence comporte un site AluI qui a servi à les caractériser. Les équivalents chez la souris s'appellent séquences B1 (50 000 copies/génome). On en trouve aussi chez le hamster et d’autres mammifères.
Ce sont des éléments de 300bp environ insérés en très grand nombre dans le génome des mammifères: chez l'humain de 300 000 à 900 000 copies dispersées partout; soit environ une séquence Alu tous des 6kb.

Structure du prototype :
Duplication en tandem d'une séquence de 130bp suivie d’une séquence de 31bp en aval du dimère et riche en A. Ces séquences de 130bp présentent une homologie avec le 7SLARN, un petit ARN composant de la particule de reconnaissance du peptide signal. Cet ARN est transcrit activement par la RNApolIII qui transcrit aussi les tARN, les petits ARN nucléaires et les ARN5S. Les séquences Alu sont flanquées de répétitions directes de longueur variable (5 à 35bp).

Transcription
Elles peuvent être transcrites à partir de promoteurs de gènes voisins ou même de façon autonome. En effet on trouve des ARN transcrits à partir de séquences Alu démarrant au ras de l'extrémité 5'. Certains membres de la famille Alu pourraient être transcrits par l’ARNpolIII, jusqu'à ce que l'enzyme trouve une séquence de terminaison riche en T dans le génome flanquant. Cet ARN serait ensuite capable de former à son extrémité 3' une épingle à cheveu par appariement entre la séquence polyU de terminaison et la séquence riche en A à l'extrémité 3' de la séquence Alu. Ceci permettrait le démarrage de la réverse transcription, probablement grâce à l’activité RT des éléments LINE, puis la réplication en ADN double brin, puis l'intégration de l'ADN dans le génome (transposition).
L'énorme expansion des séquences Alu chez les mammifères a eu lieu au cours des 65 derniers millions d'années d'évolution.

Exemple de mutation causée par l'insertion de séquences Alu:
Mutation dans le récepteur LDL (pour low density lipoprotein, transporteur de cholestérol) qui cause une hypercholestérolémie. La mutation provient d'une délétion entre 2 séquences Alu insérées à l’intérieur du gène dans la même orientation; l’une est située dans l’intron 15-16 et l’autre dans l’intron 18-19. L’insertion de ces deux séquences Alu ne provoque par elle-même aucun phénotype, mais la recombinaison entre elles entraîne la délétion de la portion de génome située entre elles, soit les exons 16, 17 et 18.

Les Pseudogènes.

Ils ont pour origine un ARN, maturé à partir d'un gène normal de l’hôte et réinséré sous forme d’ADN double brin en plusieurs copies dans le génome. Les pseudogènes ressemblent donc à l'ARNm de leur gène d'origine :

  • pas de séquence de contrôle transcriptionel,
  • pas d'introns,
  • une queue de polyA en 3',

et portent des mutations accumulées.
Ils sont insérés loin du site génomique d'origine et on trouve une séquence cible dupliquée de longueur variable, de part et d’autre. Pas de spécificité de séquence cible.


Exemples :

  • chez l'humain : métallothionéine et b-tubuline (10-15 copies par génome)
  • chez la souris : glycéraldéhyde 3 phosphate déshydrogénase (200 copies /génome)
  • chez le rat : a-tubuline (4 copies/génome).


Mode de transposition supposé :
D’abord transcription normale du gène par l’ARNpolII, polyadénylation, épissage des introns. Ensuite cet ARNm pourrait être répliqué en ADNc en utilisant une réverse transcriptase virale présente dans la lignée germinale ou l’œuf. Le problème de l'amorce n'est pas résolu; peut-être par épingle à cheveux comme pour les séquences Alu. Les pseudogènes pourraient s’insérer dans le génome comme "accidents" en utilisant la machinerie d'un rétrovirus (RT puis intégrase). Ensuite comme ils sont non fonctionnels ils peuvent accumuler des mutations, sans conséquence pour l'organisme.

 

 

Les rétroéléments dans le complexe majeur d'histocompatibilité humain (MHC).

Cet exemple donne une idée de l’importance, au moins numérique, et probablement aussi fonctionnelle des rétrotransposons dans le génome humain. Les protéines codées par le MHC interviennent dans la réponse immunitaire: en particulier sont codés là les familles de gènes I et II du système HLA (human leucocytes antigènes), c'est-à-dire les antigènes présentés à la surface des leucocytes et d'autres cellules et qui permettent d'être reconnus comme non-soi. De plus, le complexe comprend des gènes codant pour des protéines impliquées dans la maturation et le transport des protéines antigènes. En cas de transplantation cellulaire entre deux individus l'identité des types MHC est cruciale pour que la greffe prenne.
Le MHC s'étend sur 4000kb sur le bras court du chromosome 6. Divisé en trois régions principales: I, II et III. Il existe plusieurs allèles par gène (degré de polymorphisme élevé); on appelle haplotype une combinaison d'allèles de gènes du complexe MHC ; on en distingue 5 principaux.
On étudie ici la répartition des rétroéléments dans une fraction de la région II, longue de 400kb, qui code pour 2 chaines polypeptidiques a et b.
Les éléments répétés trouvés dans le MHC appartiennent à une vingtaine de familles différentes et constituent 20% environ de la longueur totale du complexe. Le MHC étant une région densément transcrite cela peut expliquer la forte concentration dans cette région d'éléments ayant besoin de transcription pour se multiplier.


Rétroéléments trouvés dans la région II (1000kb)

·        Herv = rétrovirus endogènes humains. Deux exemplaires, erv9 et Herv-DRB7, sont présents dans la région. Structure classique. L'intégration d'éléments rétroviraux dans le MHC est probablement assez ancienne, en tout cas la comparaison des localisations des rétroéléments chez des espèces voisines (grands singes) permet de comprendre l'évolution du MHC. L'intégration de multiples copies a du contribuer à la dynamique du génome de la région MHC durant l'évolution des primates. Les rétrovirus erv9 ont des LTR actives comme promoteurs dans différents types cellulaires.

·        Séquences Alu (127 copies): la densité des Alu dans la classe II du MHC est de 1 pour 3kb. La famille AluJ est la plus ancienne, AluY la plus récente, 40 AluY se trouvent dans la région II. Mutation: l'insertion d'un AluSx dans le gène DRB1 de l'haplotype DR4 provoque un épissage alternatif du mRNA de DRB1. On ne sait pas si un polypeptide fonctionnel est exprimé dans ce cas.

·        Eléments LINE1 de diverses sortes (MIM, L1HS, L1P, L1repeat) : 134 copies.


LTR solo, trace d'une ancienne insertion d'un élément à 2 LTR (13 copies).

Pseudogènes: comme DRB2, et DRB9

 

 

RETROVIRUS


Les rétrovirus ne font pas partie des transposons, cependant comme ils ont de nombreux points communs, de structure et de reproduction de leur génome, avec les les rétrotransposons, il est nécessaire d’en dire quelques mots (pour le reste voir cours de maitrise).
Des rétrovirus ont été isolé chez beaucoup d'espèces: oiseaux, souris, rat, reptiles chats, singes, porcs, bovins, humains, hamster... Les mieux connus sont ceux des oiseaux et des souris. La taille des rétrovirus est variable mais ils ont une communauté de structure d'un groupe à l'autre et des homologies de séquence.
Les plus longs (10kb) contiennent un jeu complet de gènes viraux; il existe des virus défectifs auquels il manque telle ou telle portion de séquence codante. Ces derniers sont dits non autonomes car ils ont besoin d'un autre rétrovirus complet surinfectant pour se répliquer.

Caractéristiques structurelles du génôme viral

Le génome viral peut se présenter sous deux formes:

  • L’une se trouve enfermée dans des particules virales, sous forme de deux brins + identiques d'ARN avec coiffe de guanylate en 5' et queue de polyA en 3'. Ce sont les caractéristiques d'ARNm. Les deux brins sont liés ensemble par des liaisons H à l'extrémité 5'. Le génome viral est " diploïde ". Les ARN viraux sont immédiatement traductibles en protéines.
  • L’autre forme est un ADN double brin intégré dans le génôme de l’hôte et qu’on appelle provirus.

L’ ARN viral est converti en double brin d'ADN linéaire dans la cellule infectée. Cet ADN peut entrer dans le noyau et s'intégrer dans le génome, au hasard. En général l'infection ne tue pas la cellule qui peut continuer à croître et à se diviser.
L'ADN intégré peut se transmettre à la progéniture via les cellules germinales (transmission verticale). Les virus matures peuvent aussi envahir peu à peu les cellules de l'hôte ou d'autres hôtes (transmission horizontale).

Cycle du virus

L'ARN viral sert à la fois pour la traduction des protéines virales, pour la réplication grâce à la réverse transcriptase et pour l'encapsidation dans les particules virales disséminables. L'intégration dans le génome de l'hôte est nécessaire pour la transcription.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/virus.JPG

Les particules virales sont composées :

  • Outre les deux brins d'ARN(m) du virus on y trouve plusieurs espèces d'ARN de petite taille appartenant à l'hôte en particulier un ARNt. Par exemple chez le virus du sarcome aviaire c'est l'ARNtTrp. Cette molécule peut s’hybrider à l'ARN viral à un site situé à environ 100nt de l'extrémité 5'. Chez le virus de la leucémie murine c'est l'ARNtPro qui joue ce rôle. Cet ARNt cellulaire sert d'amorce à la réverse transcriptase virale, pour l'initiation de la réplication du génome viral en ADNc.
  • Ces ARN sont entourés de protéines virales (protéines gag dites de nucléocapside) et d'enzymes : pol qui cumule les fonctions de réverse transcriptase, protéase et endonucléase.
  • Autour se trouvent les glycoprotéines d'enveloppe (gp85 et gp87) (dites env) liées par des ponts disulfure et qui dérivent probablement du même polypeptide précurseur. Ces glycoprotéines sont responsables de l'attachement des virions à la membrane des cellules hôtes. Les particules virales entrent et sortent de la cellule, par fusion et bourgeonnement respectivement, à partir de la membrane plasmique (leur propre bicouche lipidique est donc d'origine cellulaire).

Structure du génome viral complet (provirus)

L'ADN linéaire cytoplasmique est borné de chaque côté par une séquence longue de 250 à 1400bp environ qu’on appelle LTR (pour Long Terminal Repeat). Le provirus intégré dans le chromosome de l'hôte se termine par les deux LTR raccourcies de 2bp de chaque côté. Duplication d'une séquence cible génomique de 4 ou 6 bp de part et d'autre du provirus.

http://www.biochimiep7.jussieu.fr/transposonWeb/figtransposonjpeg/ADNviral.JPG


L'ARN se termine en 5' et 3' par les séquences R (qui font de 10 à 80nt) des deux LTR.

Entre les LTR se trouvent les séquences codantes pour : gag-pol-env ou gag-prt-pol-env
L'ARN est traduit et donne les polyprotéines gag, gag-pol et env qui sont ensuite clivées grâce à l’activité protéasique codée par prt.

gag-pol donne les protéines suivantes:

  • matrice 15-20kD localisée entre la nucléocapside et l'enveloppe
  • capside 24-30kD composant structural majeur de la capside
  • nucleocapside 10-15kD empaquète le dimère d'ARN
  • protéase 15kD clive gag-pol
  • réverse transcriptase 50-95kD synthétise le brin d'ADNc
  • intégrase 32-46kD insère le provirus dans le génome de l'hôte

env donne les protéines:

  • prot de surface 46-120kD forme des protrusions à la surface du virion, intéragit avec la membrane de l'hôte
  • prot transmembranaire, 15-37kD opère la fusion entre les membranes virale et hôte


Maturation du virion:
Les différents ARN sont empaquetés au sein du cytoplasme, puis l'enveloppe extérieure (protéines env + bicouche lipidique prélevée à la membrane plasmique) est appliquée au fur et à mesure que le coeur bourgeonne vers l'extérieur.

 

 

L'EVOLUTION DES TRANSPOSONS

Evolution des transposons à ADN ou " comment naît un transposon ? "

Comparaison des structures entre séquences IS, Tn, élément P : on trouve comme dénominateur commun : deux séquences IR de chaque côté d’un gène codant pour une transposase. De plus on observe dans les 3 cas une sorte de capacité d’autorégulation de la transposition pour éviter qu’une invasion trop importante ne tue l’espèce hôte.

Les Tn hébergent en plus un gène de résistance à un antibiotique et sont plus évolués que les IS ou l’élément P.

Une transposase comme celle de P ou des IS a essentiellement une fonction d’endonucléase.
D’où l’idée : le transposon d’origine ne serait rien d’autre qu’un gène cellulaire codant pour une endonucléase qui aurait acquis la capacité de reconnaître ses propres extrémités et de couper là (permettant l’excision) mais aussi ailleurs (permettant la transposition). Les activités normales de la cellule (réparation, polymérisation, ligation) assureraient les " à-côtés " indispensables au processus.

·        Phase I d'évolution constructive : apparition par mutations accumulées 1- de motifs reconnaissables par l’endonucléase de chaque côté de son gène (les IR) et 2- d’un site catalytique capable de les reconnaître.

·        Phase II d'évolution destructive: l’activité " régulatrice " apparaîtrait de façon concomitante par mutations dans la partie codante du gène (copie défective ayant encore les sites de coupure mais plus l’activité endonucléase) ce qui conférerait un avantage sélectif à l’organisme.

Ce modèle est en train d’être testé expérimentalement.


Evolution des rétroéléments

On a observé de grandes parentés de structure entre les rétroéléments et les rétrovirus.
Ceci pourrait donner à penser que les rétroéléments ont pour origine un rétrovirus complet qui aurait perdu successivement certaines séquences donnant à chaque fois naissance à une nouvelle classe de rétrotransposons dans un ordre de dégénérescence croissante.


En fait l’hypothèse inverse est tout aussi crédible : certains rétrotransposons pourraient être en train d’évoluer à partir d’un gène cellulaire normal par addition successives d’autres gènes apportant de nouvelles fonctions, la forme finale étant le rétrovirus complet, libre et disséminable.
Chez les vertébrés, des arguments expérimentaux viennent en fait appuyer les deux hypothèses et il pourrait y avoir cohabitation des deux processus évolutifs, certains rétrotransposons étant en train de dégénérer, d’autres en train de se construire.

LIED_Logo_4

 

logo_p7