Informations

Quel est le mécanisme d'intégration du transgène (du vecteur d'expression au génome hôte) ?

Quel est le mécanisme d'intégration du transgène (du vecteur d'expression au génome hôte) ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Comment un transgène (en vecteur) s'intègre-t-il au génome de l'hôte ? (par exemple dans la méthode des billes de verre, ni biolistique ni agrobactérie).

J'ai déjà coupé certaines parties (NdeI-PciI) du vecteur (pUC18) et je me demande si cela affecte la procédure d'intégration. Existe-t-il une procédure de type recombinaison identique à la passerelle ?


Quel est votre hébergeur dans ce cas ? Pour l'intégration dans le génome d'une bactérie, il faudrait utiliser un vecteur "d'intégration". La plupart des vecteurs commerciaux (tels que pUC18) seront maintenus sans s'intégrer dans le génome de l'hôte.

Voici une description d'un vecteur d'intégration du Bacillus Genetic Stock Center pour vous donner une idée de la façon dont l'ADN étranger serait intégré dans un génome de Bacillus :

Les vecteurs d'intégration sont des plasmides qui présentent une réplication conditionnelle couplée à un marqueur sélectionnable. Si le plasmide est transformé en un hôte approprié dans des conditions qui sélectionnent la présence du plasmide mais restreignent sa réplication, tous les transformants auront intégré le plasmide dans leur chromosome (ou un autre ADN résident capable de se répliquer dans les conditions sélectives). En pratique, le marqueur sélectionnable spécifie généralement la résistance aux antibiotiques. La réplication conditionnelle signifie généralement que le plasmide a des fonctions de réplication qui fonctionnent dans E. coli mais pas dans les bactéries gram-positives, telles que B. subtilis. Parfois, un phénotype de réplication sensible à la température est utilisé à la place. L'intégration est ciblée sur un locus particulier sur le chromosome en incluant des séquences identiques sur le plasmide. S'il n'y a qu'une seule séquence homologue, un seul croisement intégrera l'ensemble du chromosome dans le locus cible par un mécanisme de type Campbell. S'il y a deux séquences homologues et qu'elles sont relativement proches l'une de l'autre sur le chromosome, alors un double croisement se traduira par une cassette s'intégrant entre les cibles chromosomiques. (la source)

Pour la plupart des travaux de laboratoire de biologie moléculaire de routine, il n'est pas nécessaire d'intégrer des gènes dans le génome d'E. coli. L'intégration est généralement utilisée pour générer des lignées cellulaires « knock-out » pour étudier la fonction des gènes dans les bactéries d'intérêt.


Chapitre cinq - Expression soutenue à partir de vecteurs d'ADN

Les vecteurs d'ADN ont le potentiel de devenir de puissants outils médicaux pour le traitement des maladies humaines. Le corps humain a cependant développé une gamme de stratégies défensives pour détecter et faire taire l'ADN étranger ou égaré, qui est plus généralement rencontré lors d'une infection ou d'une lésion chromosomique. Un vecteur de thérapie génique humaine cliniquement pertinent doit surmonter ou éviter ces protections tout en délivrant des niveaux soutenus de produit génique thérapeutique sans compromettre la vitalité de l'hôte receveur. De nombreux vecteurs d'ADN non viraux déclenchent ces mécanismes de défense et sont ensuite détruits ou rendus silencieux. Ainsi, sans modification ou conception envisagée, l'utilité clinique d'un vecteur d'ADN typique est fondamentalement limitée en raison de la nature transitoire de son expression transgénique. Le développement de vecteurs d'ADN sûrs et à expression persistante est une condition préalable cruciale pour son application clinique réussie et reste donc l'une des principales tâches stratégiques de la recherche en thérapie génique non virale.

Dans ce chapitre, nous décrirons notre compréhension actuelle des mécanismes qui peuvent détruire ou réduire au silence les vecteurs d'ADN et discuter des stratégies, qui ont été utilisées pour améliorer leur subsistance et le niveau et la durée de leur expression transgénique.


Le clivage in vivo des donneurs de transgènes favorise l'intégration ciblée médiée par la nucléase †

Les auteurs souhaitent que l'on sache qu'à leur avis, les deux premiers auteurs doivent être considérés comme co-premiers auteurs.

Résumé

L'intégration d'ADN ciblée est couramment utilisée pour éliminer les effets de position sur l'expression du transgène. L'intégration peut être ciblée sur des sites spécifiques du génome via des processus à la fois basés sur l'homologie et indépendants de l'homologie. Les deux voies démarrent le processus d'intégration avec une rupture spécifique au site dans le chromosome, généralement à partir d'une nucléase à doigt de zinc (ZFN). Nous avons précédemment décrit une technique d'intégration ciblée indépendante de l'homologie qui capture de courts (<100 pb) morceaux d'ADN au niveau des cassures chromosomiques créées par les ZFN. Nous montrons ici que l'inclusion d'un site cible de nucléase sur le plasmide donneur suivi d'un clivage in vivo par la nucléase du donneur et du chromosome entraîne une intégration efficace de grandes molécules d'ADN de la taille d'un transgène dans la cassure chromosomique double brin. Une intégration ciblée réussie via la linéarisation des donneurs in vivo est démontrée à cinq loci distincts dans deux types de cellules de mammifères, soulignant la généralité de l'approche. Enfin, nous montrons que les cellules CHO, un type cellulaire récalcitrant à l'intégration basée sur l'homologie, sont capables de capturer des donneurs de transgènes linéarisés in vivo. De plus, nous démontrons le knock-out du hamster FUT8 gène via l'intégration simultanée à médiation par la nucléase ZFN ou TALE d'une cassette d'anticorps. Nos résultats permettent une addition efficace de transgènes ciblés aux cellules et aux organismes qui s'en sortent mal avec les approches traditionnelles axées sur l'homologie. Biotechnologie. Bioeng. 2013 110 : 871-880. © 2012 Wiley Periodicals, Inc.

Des informations complémentaires sont disponibles dans la version en ligne de cet article.

Nom de fichier La description
bit_24733_sm_SupplFig1.tif4,9 Mo Figure supplémentaire 1
bit_24733_sm_SupplFig2.tif418.5 Ko Figure supplémentaire 2
bit_24733_sm_SupplFig3.tif695.8 Ko Figure supplémentaire 3
bit_24733_sm_SupplTabs.doc94.5 Ko Tableaux supplémentaires
bit_24733_sm_SupplFigsLegend.doc20,5 Ko Légende des figures supplémentaires

Remarque : L'éditeur n'est pas responsable du contenu ou de la fonctionnalité des informations fournies par les auteurs. Toute question (autre que le contenu manquant) doit être adressée à l'auteur correspondant à l'article.


Résumé

Les cellules de mammifères recombinantes sont les hôtes principaux pour la production de protéines thérapeutiques. En plus d'une expression élevée du gène produit, un hyper-producteur doit également posséder des traits phénotypiques supérieurs liés au métabolisme, à la sécrétion de protéines et au contrôle de la croissance. L'introduction de gènes dotant les traits d'hyper-productivité pertinents est une stratégie fréquemment utilisée pour améliorer la productivité. La plupart de ces efforts d'ingénierie cellulaire ont été réalisés en utilisant des systèmes d'expression constitutifs. Cependant, les cellules répondent dynamiquement à divers signaux environnementaux et événements cellulaires en fonction des besoins cellulaires. L'utilisation de systèmes inductibles permet une expression dépendante du temps, mais nécessite une manipulation externe. Idéalement, l'expression d'un transgène devrait être synchrone avec le rythme propre de la cellule hôte et à des niveaux appropriés pour l'objectif. À cette fin, nous avons identifié des gènes avec différentes dynamiques d'expression et plages d'intensité à l'aide de données de transcriptome regroupées. Leurs promoteurs peuvent être utilisés pour conduire l'expression des transgènes suivant la dynamique souhaitée. Nous avons isolé le promoteur du gène de la protéine interagissant avec la thiorédoxine (Txnip) et démontré sa capacité à stimuler l'expression du transgène de concert avec la croissance cellulaire. Nous avons en outre utilisé ce promoteur de hamster chinois pour concevoir l'expression dynamique du transporteur de fructose GLUT5 de souris dans des cellules d'ovaire de hamster chinois (CHO), leur permettant d'utiliser le sucre en fonction des besoins cellulaires plutôt qu'en excès comme on le voit généralement en culture. Ainsi, moins de lactate a été produit, résultant en un meilleur taux de croissance, une durée de culture prolongée et un titre de produit plus élevé. Cette approche illustre un nouveau concept d'ingénierie métabolique qui peut potentiellement être utilisé pour obtenir un contrôle dynamique des comportements cellulaires pour des caractéristiques de processus améliorées.


Réclamations

1. Vecteur de gène adapté pour l'expression transitoire d'un transgène dans une cellule d'organe périphérique comprenant une séquence régulatrice liée de manière opérationnelle à un transgène, la séquence régulatrice empêchant ou réduisant l'expression dudit transgène dans les cellules de la lignée hématopoïétique.

2. Vecteur selon la revendication 1 dans lequel la séquence régulatrice comprend une ou plusieurs séquences cibles pour une séquence de miARN.

3. Vecteur selon la revendication 1, dans lequel le vecteur est un vecteur rétroviral à défaut d'intégration.

4. Vecteur selon la revendication 1, dans lequel le vecteur est un vecteur lentiviral à défaut d'intégration (vecteur IDLV).

5. Vecteur selon la revendication 4, dans lequel le vecteur IDLV est dérivé du VIH.

6. Vecteur selon la revendication 1, dans lequel chacune des une ou plusieurs séquences cibles est indépendamment sélectionnée parmi une séquence ciblée par miR-142, miR-155 et miR-223.

7. Vecteur selon la revendication 1 dans lequel la séquence cible est une séquence ciblée par miR-142.

8. Vecteur selon la revendication 1 dans lequel la séquence cible est une séquence ciblée par miR-155.

9. Vecteur selon la revendication 1 dans lequel la séquence cible est une séquence ciblée par miR-223.

10. Vecteur selon la revendication 7, dans lequel la séquence régulatrice comprend quatre copies de la séquence cible miR-142.

11. Vecteur selon l'une quelconque des revendications 1 à 11, dans lequel la séquence cible est totalement ou partiellement complémentaire de la séquence de miARN.

12. Vecteur selon la revendication 1, dans lequel le produit transgénique est une protéine thérapeutique.

13. Vecteur selon la revendication 1, dans lequel le produit du gène trans est un antigène.

14. Vecteur selon la revendication 13, dans lequel l'antigène est choisi dans le groupe constitué d'un antigène endogène, d'un antigène exogène, d'un alloantigène et d'un auto-antigène.

15. Vecteur selon la revendication 14 dans lequel l'antigène est un antigène exogène.

16. Vecteur selon la revendication 1, dans lequel le gène trans est lié de manière opérationnelle à un promoteur spécifique d'un tissu.

17. Vecteur selon la revendication 16, dans lequel le promoteur spécifique de tissu est un promoteur spécifique d'une cellule dans un organe périphérique.

18. Vecteur selon la revendication 17, dans lequel l'organe périphérique est choisi dans le groupe constitué par le foie, le muscle, le thymus, la rate et les ganglions lymphatiques.

19. Vecteur selon la revendication 16, dans lequel le promoteur tissu-spécifique est un promoteur hépatospécifique.

20. Vecteur selon la revendication 16, dans lequel le promoteur tissu-spécifique est un promoteur choisi dans le groupe constitué par le promoteur d'albumine, le promoteur de trans-thyrétine, le promoteur d'alpha1-antitrypsine, le promoteur synthétique d'apoE/alpha1-antitrypsine et le promoteur synthétique ET.

21. Vecteur selon la revendication 1, dans lequel le vecteur est sous la forme d'une particule de vecteur viral.

22. Ensemble de constructions d'ADN pour produire une particule de vecteur selon la revendication 21, comprenant un génome de vecteur packagable, gag, pol et env ou des substituts fonctionnels de ceux-ci.

23. Ensemble de constructions d'ADN selon la revendication 22, dans lequel lesdites constructions codent pour une intégrase défectueuse.

24. Ensemble de constructions d'ADN selon la revendication 22, dans lequel lesdites constructions comprennent des sites LTR modifiés, les sites LTR modifiés empêchant l'intégration du génome du vecteur lentiviral.

25. Composition pharmaceutique comprenant le vecteur ou particule selon la revendication 1.

26. Cellule infectée ou transduite avec le vecteur ou la particule selon la revendication 1.

27. Vecteur ou particule selon la revendication 1 pour une utilisation dans l'induction ou l'amélioration de la tolérance immunologique contre un antigène chez un sujet.

28. Vecteur ou particule selon la revendication 1, dans lequel l'antigène est un antigène exogène administré dans le cadre d'une thérapie de substitution protéique.

29. Vecteur ou particule selon la revendication 1 pour une utilisation dans le traitement ou la prévention d'une maladie choisie dans le groupe constitué des maladies auto-immunes, des maladies allergiques, des maladies à médiation immunitaire et de la maladie du greffon contre l'hôte.

30. Méthode d'induction de tolérance chez un sujet comprenant l'administration du vecteur ou de la particule selon la revendication 1 au sujet, dans laquelle la tolérance est au produit exprimé par le transgène.


Application de l'édition CRISPR/Cas9 GENE au développement de vaccins aviaires

Plusieurs approches ont été appliquées pour éditer des vecteurs viraux pour la construction de candidats vaccins recombinants contre les virus de la volaille (Baron et al., 2018). Les méthodes actuellement disponibles pour la modification des vaccins à vecteur viral sont inefficaces, longues et laborieuses, en particulier pour les procédures de purification (Zou et al., 2017). Ainsi, une technologie d'édition du génome plus efficace et plus fiable est nécessaire de toute urgence pour le développement de vaccins à vecteur viral. L'approche d'édition du génome CRISPR/Cas9 est le meilleur choix car elle offre non seulement une facilité et une approche simple par rapport aux approches traditionnelles, mais elle donne également la possibilité de générer des vaccins recombinants multivalents qui confèrent une protection simultanée contre les principales maladies aviaires.

À ce jour, CRISPR/Cas9 a été utilisé avec succès dans la mutagenèse ciblée de divers vecteurs viraux, notamment le virus de l'herpès de dinde (HVT) (Tang et al., 2018, 2020 Chang et al., 2019), le virus de la laryngotrachéite infectieuse (ILTV) (Atasoy et al., 2019) et le virus de l'entérite du canard (DEV) (Zou et al., 2017 Chang et al., 2018). Ces génomes de vecteurs viraux recombinants ont été édités pour héberger et exprimer des antigènes spécifiques en tant que vaccins vectoriels viraux potentiels contre de multiples maladies telles que NDV (Atasoy et al., 2019), AIV (Zou et al., 2017 Chang et al., 2019), MD (Tang et al., 2018, 2020) et ILTV (Tang et al., 2020). De même, le in vitro l'efficacité et la stabilité de ces vaccins recombinants ont été évaluées par des passages cellulaires multiples par rapport aux méthodes classiques dans lesquelles l'instabilité du transgène pourrait résulter de passages multiples (Zou et al., 2017 Tang et al., 2018, 2020 Atasoy et al., 2019 Chang et al. ., 2019). Pour déterminer la stabilité de ces constructions/cassettes pendant le passage continu des cellules pour les virus recombinants pendant au moins le 15e passage et la stabilité et l'expression des inserts ont été confirmées par immunoblot occidental, immunofluorescence et détection moléculaire (Tang et al., 2018, 2020 Atasoy et al., 2019 Chang et al., 2019). Par conséquent, ces études ont montré le potentiel de CRISPR/Cas9 en tant qu'outil efficace, rapide et simple pour le développement de vaccins aviaires. L'aperçu des applications CRISPR/Cas9 dans la construction de vaccins viraux aviaires est résumé dans le tableau 2 et spécifiquement discuté ci-dessous pour chaque virus.

Tableau 2. Aperçu des applications CRISPR/Cas9 dans la construction de vaccins viraux aviaires.

Virus de la maladie de Newcastle (NDV)

Le virus de la maladie de Newcastle (NDV) est l'un des agents pathogènes viraux aviaires les plus importants causant des pertes économiques majeures à l'échelle mondiale (Alexander, 2001 Zahid et al., 2020). La génétique et la biologie du NDV sont extrêmement complexes, avec plus de 20 génotypes phylogénétiquement distincts actuellement proposés sur la base de la classification taxonomique (Dimitrov et al., 2019). Malgré les efforts continus pour formuler un vaccin efficace contre la MN, des améliorations sont encore nécessaires. Dans ce pipeline, le système NHEJ-CRISPR/Cas9 ainsi que le système Cre/lox offrent une approche puissante pour améliorer et développer de nouveaux vaccins contre la MN. Nous avons démontré l'innocuité et l'efficacité du virus de la laryngotrachéite infectieuse (ILTV) en tant que vecteur vaccinal hébergeant le gène de fusion (F) du NDV vélogénique et présentons la polyvalence du système NHEJ-CRISPR/Cas9 et Cre/Lox (Atasoy et al., 2019 ). Dans ces expériences, nous avons supprimé la thymidine kinase (savoirs traditionnels) et court unique 4 (US4) du génome de l'ILTV et remplacés par le gène rapporteur GFP et le gène F du NDV, respectivement en utilisant le système NHEJ-CRISPR/Cas9 pour construire un candidat vaccin bivalent contre deux virus respiratoires aviaires majeurs (ILTV et NDV). Ainsi, nous avons conclu que l'insertion du transgène dans le génome de l'ILTV à l'aide de CRISPR/Cas9 et l'excision ultérieure des gènes marqueurs avec le système Cre&# x02013Lox est une approche efficace pour exprimer de manière stable les gènes sans causer d'effet néfaste pour la réplication du vecteur vaccinal viral (Atasoy et al ., 2019).

Virus de la grippe aviaire (AIV)

La distribution généralisée des virus de l'influenza aviaire hautement pathogènes (AIV) entraîne des pertes économiques substantielles dans l'industrie avicole tandis qu'un danger pandémique persistant est posé par la transmission occasionnelle de ces virus à l'homme (Peiris et al., 2007). Les stratégies de vaccination actuelles pour les AIV servent de mesure préventive contre l'infection virale chez les oiseaux, plutôt que d'éradication (Collett et al., 2020 Irshad et al., 2020). Cependant, malgré l'efficacité actuelle de ces stratégies de vaccination, les oiseaux sont sensibles aux virus de la grippe A (Collett et al., 2020). CRISPR/Cas9 a été utilisé dans le développement de vaccins à base de virus contre des sous-types spécifiques de virus de la grippe aviaire. Une étude précédente a démontré l'utilisation du système CRISPR/Cas9 comme un outil efficace et puissant pour l'ingénierie ciblée du génome du virus de l'entérite du canard (DEV) pour générer un vaccin candidat exprimant la protéine hémagglutinine (HA) du virus de la grippe aviaire hautement pathogène H5N1 (Zou et al ., 2017). De plus, ce vaccin DEV recombinant contient également deux autres gènes [protéines pré-membranaires (PrM) et gènes de glycoprotéine d'enveloppe (E)] du virus du tembusu du canard (DTMUV), générant un candidat vaccin trivalent contre les infections à H5N1, DEV et DTMUV chez canards.

Le Cas9 associé à CRISPR réalise une ingénierie du génome spécifique au site et peut introduire une cassure double brin (DSB) dans un emplacement chromosomique spécifié par l'ARN guide (Cong et al., 2013 Jinek et al., 2013 Mali et al., 2013a). Le DSB peut être réparé soit par une voie de jonction d'extrémité non homologue (NHEJ) ou par une voie de réparation dirigée par homologie (HDR). La voie HDR utilise des séquences d'ADN de donneur homologues provenant de chromatides sœurs ou d'ADN étranger pour la production d'insertions exactes, de simples substitutions entre les sites DSB ou deux DSB et d'autres modifications tandis que la voie NHEJ crée des délétions et des insertions correctes (Tang et al., 2019) . La voie NHEJ est un type majeur de mécanisme de réparation de l'ADN, divisé en voies classique et alternative qui ligature avec succès l'ADN brisé (Mao et al., 2008). La faible fidélité du NHEJ, qui est susceptible d'être sujette aux erreurs, peut entraîner une suppression ou une insertion de base (indel) après réparation, entraînant une mutation de décalage du cadre de lecture (Bernheim et al., 2017). Le NHEJ est la voie de réparation dominante basée sur le DSB et représente la plupart des réparations du DSB du cycle cellulaire (Arnoult et al., 2017).

Pendant ce temps, l'approche de réparation dirigée par homologie (HDR) sans erreur CRISPR/Cas9 a été utilisée pour générer un vaccin bivalent HVT-AIV et la sélection de HVT-HA recombinant a été effectuée grâce au développement d'un test d'adsorption érythrocytaire précis, facile et rapide. au lieu d'utiliser des approches traditionnelles (Chang et al., 2019). Ce processus a donné une précision approximative de ߦ% pour l'insertion de H7N9 HA, ce qui indique que le NHEJ a induit l'extinction de la majorité des virus HVT négatifs pour la GFP (Chang et al., 2019). Les DSB médiés par CRISPR/Cas9 peuvent passer par les voies NHEJ et HDR, mais dans la plupart des cas, NHEJ est favorisé (Frit et al., 2014), ainsi la possibilité d'un silence médié par NHEJ peut être justifiée.Bien que le HDR soit une voie fidèle et puisse stimuler un mécanisme de réparation sans erreur, il est nécessaire d'améliorer son efficacité.

Virus de la maladie de Marek (MDV)

Le virus de la maladie de Marek (MDV) est une maladie lymphoproliférative du poulet principalement contrôlée par la vaccination depuis 1969 (Okazaki et al., 1970). Les virus de l'herpès de Turquie (HVT), qui appartiennent à Herpèsvirus Meleagrid 1, ont été largement utilisés pendant plus de 40 ans comme vaccin contre la maladie de Marek (MD) (Okazaki et al., 1970). Récemment, HVT est utilisé comme vecteur viral pour fournir une immunité protectrice contre la MD et d'autres maladies virales en hébergeant et en exprimant des antigènes viraux étrangers d'autres maladies virales (Li et al., 2011 Vagnozzi et al., 2012 Esaki et al., 2013 Chang et al., 2019). La technologie CRISPR/Cas9 a révolutionné la construction du vaccin HVT et le potentiel du HVT en tant que vecteur de vaccins multivalents. Tang et al., ont réussi à générer un HVT recombinant avec des inserts de gène triple conduisant au développement d'un candidat vaccin viral recombinant qui peut potentiellement induire une protection contre trois maladies virales aviaires majeures (ILTV, IBDV, AIV, MDV Tableau 2 Tang et al., 2020). De même, Chang et al. ont utilisé HDR-CRISPR/Cas9 pour développer un candidat vaccin recombinant bivalent HVT exprimant l'antigène hémagglutinine (HA) du virus de la grippe A (Chang et al., 2019).

Virus de la laryngotrachéite infectieuse (ILTV)

Le virus de la laryngotrachéite infectieuse (ILTV) est une maladie respiratoire affectant l'industrie avicole et ayant un impact économique dans le monde entier (Gowthaman et al., 2020). Maladie de la laryngotrachéite infectieuse (ILT) causée par Type d'herpsvirus gallidé 1 (GaHV-1) et peut être transmis par des oiseaux infectés et des vecteurs passifs (Davison et al., 2009). La vaccination à l'aide de vaccins vectoriels viraux atténués et recombinants est la principale mesure de contrôle employée dans les régions endémiques (Collett et al., 2020). Dans un effort pour développer des souches vaccinales plus stables, la technologie CRISPR/Cas9 a été appliquée avec succès pour générer un vecteur viral recombinant exprimant l'antigène ILTV (tableau 2). Tang et al. ont utilisé l'approche d'édition de gènes CRISPR/Cas9 pour introduire la cassette d'expression de la glycoprotéine D-glycoprotéine I (gD-gI) de l'ILTV dans une région spécifique du génome du HVT (Tang et al., 2020). Ces résultats ont montré que l'approche d'édition de gènes CRISPR/Cas9 était capable de couper le génome HVT dans une région spécifique et d'insérer la cassette d'expression ILTV gD-gI via un système de réparation NHEJ indépendant de l'homologie. Les auteurs ont également réussi à insérer et à exprimer deux autres gènes antigènes H9 HA et IBDV VP2 dans divers emplacements du génome HVT recombinant, développant un vaccin HVT recombinant trivalent stable.


Méthodes de clonage

Les Technologie de clonage GATEWAY est basé sur le système de recombinaison spécifique au site utilisé par le phage l pour intégrer son ADN dans le E. coli chromosome. Les deux organismes ont des sites de recombinaison spécifiques appelés attP dans le site du phage l et attPoubelle E. coli. Le processus d'intégration (lysogénie) est catalysé par 2 enzymes : la protéine codée par le phage l Int (Integrase) et la E. coli protéine IHF (Integration Host Factor). Lors de l'intégration, la recombinaison entre attB (25 nt) et attLes sites P (243 nt) génèrent attL (100 nt) et attSites R (168 nt) qui flanquent l'ADN du phage l intégré (voir Figure 1).

Le processus est réversible et l'excision est à nouveau catalysée par Int et IHF en combinaison avec la protéine du phage l Xis. Les attTerre attLes sites R entourant l'ADN du phage inséré se recombinent spécifiquement au cours de l'événement d'excision pour reformer le attsite P dans le phage l et le attsite B dans le E. coli chromosome.

Les Réactions GATEWAY sommes in vitro versions des réactions d'intégration et d'excision. Pour rendre les réactions directionnelles deux sites légèrement différents et spécifiques ont été développés, att1 et att2 pour chaque site de recombinaison. Ces sites réagissent très spécifiquement entre eux. Par exemple dans le Réaction BP attB1 ne réagit qu'avec attP1 résultant en attL1 et attR1 et attB2 uniquement avec attP2 donnant attL2 et attR2. La réaction inverse (Réaction LR) présente la même spécificité.

Le but ultime des réactions GATEWAY est de créer un clone d'expression. Il s'agit souvent d'un processus en deux étapes :

Étape 1 Cloner le gène d'intérêt dans un Vecteur d'entrée en utilisant le Réaction BP.
Étape 2 Sous-clonage du gène d'intérêt du clone d'entrée (étape 1) dans un Vecteur de destination en utilisant le Réaction LR produire le Clonage d'expression.

Regardons de plus près le Réaction LR de l'étape 2 (voir également la figure 2). Le gène d'intérêt est cloné dans un Vecteur d'entrée et flanqué de la attL1 et attSites de recombinaison L2. Les Vecteur d'entrée est transcriptionnellement silencieuse et contient le gène de résistance à la kanamycine (Km r ). Pour produire le Clonage d'expression le gène doit être sous-cloné dans un Vecteur de destination qui contient toutes les informations de séquence nécessaires à l'expression, le gène de résistance à l'ampicilline (Ap r ) et deux sites de recombinaison (attR1 et attR2) qui flanquent un gène de sélection négative, cdcB (la protéine codée est toxique pour la norme E. coli souches).

Les deux plasmides sont mélangés et le Mélange d'enzymes LR C LONASE est ajouté. La réaction est directionnelle et spécifique, de sorte que attL1 ne réagit qu'avec attR1 et attL2 avec attR2. La recombinaison donne deux constructions : la Clonage d'expression et un sous-produit (étiqueté sur la figure 2 comme Vecteur de donneur). Le clone d'expression produit est sous deux formes de sélection : la résistance aux antibiotiques et la sélection négative par la protéine toxique ccdB. En conséquence, des niveaux élevés de clones positifs (typiquement plus de 99 %) sont obtenus après transformation en une souche de clonage ou d'expression standard comme DH5a ou BL21 (DE3).

L'un des principaux avantages de la Technologie de clonage GATEWAY est-ce qu'une fois que vous avez fait un Clonage d'entrée le gène d'intérêt peut être facilement sous-cloné dans une grande variété de Vecteurs de destination en utilisant le Réaction LR (voir la figure 3).

Si vous voulez en savoir plus sur le Technologie de clonage GATEWAY allez sur le site Web d'Invitrogen.


Contenu

Transcription Modifier

La production d'une copie d'ARN à partir d'un brin d'ADN est appelée transcription et est réalisée par des ARN polymérases, qui ajoutent un ribonucléotide à la fois à un brin d'ARN en croissance selon la loi de complémentarité des bases nucléotidiques. Cet ARN est complémentaire du brin d'ADN matrice 3' → 5', [7] à l'exception du fait que les thymines (T) sont remplacées par des uraciles (U) dans l'ARN.

Chez les procaryotes, la transcription est effectuée par un seul type d'ARN polymérase, qui doit se lier à une séquence d'ADN appelée boîte de Pribnow à l'aide de la protéine du facteur sigma (facteur σ) pour démarrer la transcription. Chez les eucaryotes, la transcription est effectuée dans le noyau par trois types d'ARN polymérases, dont chacune a besoin d'une séquence d'ADN spéciale appelée le promoteur et d'un ensemble de protéines de liaison à l'ADN - les facteurs de transcription - pour initier le processus (voir la régulation de la transcription ci-dessous) . L'ARN polymérase I est responsable de la transcription des gènes de l'ARN ribosomique (ARNr). L'ARN polymérase II (Pol II) transcrit tous les gènes codant pour les protéines mais aussi certains ARN non codants (par exemple., snRNAs, snoRNAs ou longs RNAs non-codants). L'ARN polymérase III transcrit l'ARNr 5S, les gènes de l'ARN de transfert (ARNt) et certains petits ARN non codants (par exemple., 7SK). La transcription se termine lorsque la polymérase rencontre une séquence appelée le terminateur.

Traitement de l'ARNm Modifier

Alors que la transcription des gènes codant pour les protéines procaryotes crée un ARN messager (ARNm) prêt à être traduit en protéine, la transcription des gènes eucaryotes laisse un transcrit primaire d'ARN (pré-ARN), qui doit d'abord subir une série de modifications pour devenir un ARN mature. Les types et les étapes impliqués dans les processus de maturation varient entre les préARN codants et non codants c'est à dire. même si les molécules de pré-ARN à la fois pour l'ARNm et l'ARNt subissent un épissage, les étapes et la machinerie impliquées sont différentes. [8] Le traitement de l'ARN non-codant est décrit ci-dessous (maturation de l'ARN non-codant).

Le traitement du premRNA comprend 5′ plafonnement, qui est un ensemble de réactions enzymatiques qui ajoutent de la 7-méthylguanosine (m 7 G) à l'extrémité 5' du pré-ARNm et protègent ainsi l'ARN de la dégradation par les exonucléases. La coiffe m 7 G est ensuite liée par l'hétérodimère complexe de liaison de la coiffe (CBC20/CBC80), qui facilite l'exportation de l'ARNm vers le cytoplasme et protège également l'ARN du décapage.

Une autre modification est 3′ clivage et polyadénylation. Ils se produisent si la séquence signal de polyadénylation (5′-AAUAAA-3′) est présente dans le pré-ARNm, qui se situe généralement entre la séquence codant pour la protéine et le terminateur. Le pré-ARNm est d'abord clivé puis une série de

200 adénines (A) sont ajoutées pour former une queue poly(A), qui protège l'ARN de la dégradation. La queue poly(A) est liée par plusieurs protéines de liaison poly(A) (PABP) nécessaires à l'exportation de l'ARNm et à la réinitiation de la traduction. Dans le processus inverse de la déadénylation, les queues poly(A) sont raccourcies par l'exonucléase CCR4-Not 3'-5', ce qui conduit souvent à une dégradation complète du transcrit.

Une modification très importante du pré-ARNm eucaryote est Épissage d'ARN. La majorité des pré-ARNm eucaryotes sont constitués de segments alternés appelés exons et introns. Au cours du processus d'épissage, un complexe catalytique ARN-protéine connu sous le nom de spliceosome catalyse deux réactions de transestérification, qui éliminent un intron et le libèrent sous forme de structure lariat, puis épissent les exons voisins ensemble. Dans certains cas, certains introns ou exons peuvent être soit supprimés, soit conservés dans l'ARNm mature. Cet épissage alternatif crée des séries de transcrits différents provenant d'un même gène. Étant donné que ces transcrits peuvent être potentiellement traduits en différentes protéines, l'épissage étend la complexité de l'expression des gènes eucaryotes et la taille du protéome d'une espèce.

Le traitement étendu de l'ARN peut être un avantage évolutif rendu possible par le noyau des eucaryotes. Chez les procaryotes, la transcription et la traduction se produisent ensemble, tandis que chez les eucaryotes, la membrane nucléaire sépare les deux processus, laissant le temps au traitement de l'ARN de se produire.

Maturation de l'ARN non codant Modifier

Dans la plupart des organismes, les gènes non codants (ARNnc) sont transcrits en tant que précurseurs qui subissent un traitement ultérieur. Dans le cas des ARN ribosomiques (ARNr), ils sont souvent transcrits en tant que pré-ARNr contenant un ou plusieurs ARNr. Le pré-ARNr est clivé et modifié (2′-O-méthylation et formation de pseudouridine) sur des sites spécifiques par environ 150 différentes espèces d'ARN restreintes au nucléole, appelées snoARN. Les SnoARN s'associent aux protéines, formant des snoRNP. Alors que le snoRNA fait la paire de bases avec l'ARN cible et positionne ainsi la modification à un site précis, la partie protéine effectue la réaction catalytique. Chez les eucaryotes, en particulier un snoRNP appelé RNase, la MRP clive le pré-ARNr 45S en ARNr 28S, 5.8S et 18S. L'ARNr et les facteurs de transformation de l'ARN forment de grands agrégats appelés nucléole. [9]

Dans le cas de l'ARN de transfert (ARNt), par exemple, la séquence 5' est supprimée par la RNase P, [10] tandis que l'extrémité 3' est supprimée par l'enzyme tRNase Z [11] et la queue 3' CCA non-template est ajouté par une nucléotidyl transférase. [12] Dans le cas du micro ARN (miARN), les miARN sont d'abord transcrits en tant que transcrits primaires ou pri-miARN avec une coiffe et une queue poly-A et transformés en de courtes structures tige-boucle de 70 nucléotides connues sous le nom de pré-miARN dans le noyau cellulaire par les enzymes Drosha et Pasha. Après avoir été exporté, il est ensuite transformé en miARN matures dans le cytoplasme par interaction avec l'endonucléase Dicer, qui initie également la formation du complexe de silençage induit par l'ARN (RISC), composé de la protéine Argonaute.

Même les snRNA et les snoRNA eux-mêmes subissent une série de modifications avant de faire partie du complexe RNP fonctionnel. Cela se fait soit dans le nucléoplasme, soit dans les compartiments spécialisés appelés corps de Cajal. Leurs bases sont méthylées ou pseudouridinilées par un groupe de petits ARN spécifiques au corps de Cajal (scaARN), qui sont structurellement similaires aux snoARN.

Exportation d'ARN Modifier

Chez les eucaryotes, la plupart des ARN matures doivent être exportés vers le cytoplasme à partir du noyau. Alors que certains ARN fonctionnent dans le noyau, de nombreux ARN sont transportés à travers les pores nucléaires et dans le cytosol. [13] L'exportation d'ARN nécessite une association avec des protéines spécifiques appelées exportines. Des molécules d'exportine spécifiques sont responsables de l'export d'un type d'ARN donné. Le transport de l'ARNm nécessite également une association correcte avec Exon Junction Complex (EJC), qui garantit que le traitement correct de l'ARNm est terminé avant l'exportation. Dans certains cas, les ARN sont en outre transportés vers une partie spécifique du cytoplasme, telle qu'une synapse, ils sont ensuite remorqués par des protéines motrices qui se lient via des protéines de liaison à des séquences spécifiques (appelées "codes postaux") sur l'ARN. [14]

Traduction Modifier

Pour certains ARN (ARN non codant), l'ARN mature est le produit génique final. [15] Dans le cas de l'ARN messager (ARNm), l'ARN est un vecteur d'information codant pour la synthèse d'une ou plusieurs protéines. L'ARNm portant une seule séquence protéique (commune chez les eucaryotes) est monocistronique, tandis que l'ARNm portant plusieurs séquences protéiques (commune chez les procaryotes) est connu sous le nom de polycistronique.

Chaque ARNm se compose de trois parties : une région non traduite en 5' (5'UTR), une région codant pour une protéine ou cadre de lecture ouvert (ORF) et une région non traduite en 3' (3'UTR). La région codante porte des informations pour la synthèse des protéines codées par le code génétique pour former des triplets. Chaque triplet de nucléotides de la région codante est appelé codon et correspond à un site de liaison complémentaire d'un triplet d'anticodon dans l'ARN de transfert. Les ARN de transfert avec la même séquence d'anticodon portent toujours un type identique d'acide aminé. Les acides aminés sont ensuite enchaînés entre eux par le ribosome selon l'ordre des triplets dans la région codante. Le ribosome aide l'ARN de transfert à se lier à l'ARN messager et prend l'acide aminé de chaque ARN de transfert et en fait une protéine sans structure. [16] [17] Chaque molécule d'ARNm est traduite en de nombreuses molécules de protéines, en moyenne

Chez les procaryotes, la traduction se produit généralement au moment de la transcription (co-transcriptionnellement), en utilisant souvent un ARN messager qui est encore en train d'être créé. Chez les eucaryotes, la traduction peut se produire dans diverses régions de la cellule en fonction de l'endroit où la protéine en cours d'écriture est censée se trouver. Les emplacements principaux sont le cytoplasme pour les protéines cytoplasmiques solubles et la membrane du réticulum endoplasmique pour les protéines qui sont destinées à être exportées de la cellule ou à être insérées dans une membrane cellulaire. Les protéines censées être exprimées au niveau du réticulum endoplasmique sont reconnues à mi-chemin du processus de traduction. Ceci est régi par la particule de reconnaissance du signal, une protéine qui se lie au ribosome et le dirige vers le réticulum endoplasmique lorsqu'elle trouve un peptide signal sur la chaîne d'acides aminés en croissance (naissante). [20]

Pliage Modifier

Chaque protéine existe sous la forme d'un polypeptide déplié ou d'une bobine aléatoire lorsqu'elle est traduite d'une séquence d'ARNm en une chaîne linéaire d'acides aminés. Ce polypeptide est dépourvu de toute structure tridimensionnelle développée (le côté gauche de la figure voisine). Le polypeptide se replie ensuite dans sa structure tridimensionnelle caractéristique et fonctionnelle à partir d'une bobine aléatoire. [21] Les acides aminés interagissent les uns avec les autres pour produire une structure tridimensionnelle bien définie, la protéine repliée (le côté droit de la figure) connue sous le nom d'état natif. La structure tridimensionnelle résultante est déterminée par la séquence d'acides aminés (dogme d'Anfinsen). [22]

La structure tridimensionnelle correcte est essentielle au fonctionnement, bien que certaines parties des protéines fonctionnelles puissent rester dépliées. [23] Le fait de ne pas se plier dans la forme voulue produit généralement des protéines inactives avec des propriétés différentes, y compris des prions toxiques. On pense que plusieurs maladies neurodégénératives et autres résultent de l'accumulation de mal plié protéines. [24] De nombreuses allergies sont causées par le repliement des protéines, car le système immunitaire ne produit pas d'anticorps pour certaines structures protéiques. [25]

Des enzymes appelées chaperons aident la protéine nouvellement formée à atteindre (se replier) dans la structure tridimensionnelle dont elle a besoin pour fonctionner. [26] De même, les chaperons d'ARN aident les ARN à atteindre leurs formes fonctionnelles. [27] L'assistance au repliement des protéines est l'un des principaux rôles du réticulum endoplasmique chez les eucaryotes.

Déplacement Modifier

Les protéines sécrétoires des eucaryotes ou des procaryotes doivent être transloquées pour entrer dans la voie de sécrétion. Les protéines nouvellement synthétisées sont dirigées vers le canal de translocation eucaryote Sec61 ou procaryote SecYEG par des peptides signal. L'efficacité de la sécrétion protéique chez les eucaryotes est très dépendante du peptide signal qui a été utilisé. [28]

Transport de protéines Modifier

De nombreuses protéines sont destinées à d'autres parties de la cellule que le cytosol et une large gamme de séquences de signalisation ou (peptides de signalisation) sont utilisées pour diriger les protéines là où elles sont censées se trouver. Chez les procaryotes, il s'agit normalement d'un processus simple en raison de la compartimentation limitée de la cellule. Cependant, chez les eucaryotes, il existe une grande variété de processus de ciblage différents pour garantir que la protéine arrive au bon organite.

Toutes les protéines ne restent pas dans la cellule et beaucoup sont exportées, par exemple les enzymes digestives, les hormones et les protéines de la matrice extracellulaire. Chez les eucaryotes, la voie d'exportation est bien développée et le principal mécanisme d'exportation de ces protéines est la translocation vers le réticulum endoplasmique, suivie du transport via l'appareil de Golgi. [29] [30]

La régulation de l'expression génique fait référence au contrôle de la quantité et du moment de l'apparition du produit fonctionnel d'un gène. Le contrôle de l'expression est vital pour permettre à une cellule de produire les produits géniques dont elle a besoin lorsqu'elle en a besoin à son tour, ce qui donne aux cellules la flexibilité de s'adapter à un environnement variable, aux signaux externes, aux dommages causés à la cellule et à d'autres stimuli. Plus généralement, la régulation génique donne à la cellule le contrôle de toutes les structures et fonctions, et constitue la base de la différenciation cellulaire, de la morphogenèse ainsi que de la polyvalence et de l'adaptabilité de tout organisme.

De nombreux termes sont utilisés pour décrire les types de gènes en fonction de la façon dont ils sont régulés, notamment :

  • UNE gène constitutif est un gène qui est transcrit en continu par opposition à un gène facultatif, qui n'est transcrit qu'en cas de besoin.
  • UNE gène de ménage est un gène nécessaire au maintien de la fonction cellulaire de base et est donc généralement exprimé dans tous les types de cellules d'un organisme. Les exemples incluent l'actine, la GAPDH et l'ubiquitine. Certains gènes domestiques sont transcrits à un taux relativement constant et ces gènes peuvent être utilisés comme point de référence dans des expériences pour mesurer les taux d'expression d'autres gènes.
  • UNE gène facultatif est un gène transcrit uniquement en cas de besoin par opposition à un gène constitutif.
  • Un gène inductible est un gène dont l'expression est soit sensible aux changements environnementaux, soit dépendante de la position dans le cycle cellulaire.

Toute étape d'expression génique peut être modulée, de l'étape de transcription ADN-ARN à la modification post-traductionnelle d'une protéine. La stabilité du produit génique final, qu'il s'agisse d'ARN ou de protéine, contribue également au niveau d'expression du gène - un produit instable entraîne un faible niveau d'expression. En général, l'expression des gènes est régulée par des changements [31] dans le nombre et le type d'interactions entre les molécules [32] qui influencent collectivement la transcription de l'ADN [33] et la traduction de l'ARN. [34]

Voici quelques exemples simples où l'expression des gènes est importante :

  • Contrôle de l'expression de l'insuline afin qu'elle donne un signal pour la régulation de la glycémie. chez les mammifères femelles pour éviter une « overdose » des gènes qu'il contient. les niveaux d'expression contrôlent la progression à travers le cycle cellulaire eucaryote.

Régulation transcriptionnelle Modifier

La régulation de la transcription peut être décomposée en trois voies principales d'influence génétique (interaction directe d'un facteur de contrôle avec le gène), interaction de modulation d'un facteur de contrôle avec la machinerie de transcription et épigénétique (changements non séquentiels dans la structure de l'ADN qui influencent la transcription) .

L'interaction directe avec l'ADN est la méthode la plus simple et la plus directe par laquelle une protéine modifie les niveaux de transcription. Les gènes ont souvent plusieurs sites de liaison aux protéines autour de la région codante avec la fonction spécifique de réguler la transcription. Il existe de nombreuses classes de sites de liaison à l'ADN régulateurs appelés amplificateurs, isolants et silencieux. Les mécanismes de régulation de la transcription sont très variés, allant du blocage des sites de liaison clés sur l'ADN pour l'ARN polymérase à l'action d'activateur et à la promotion de la transcription en aidant la liaison de l'ARN polymérase.

L'activité des facteurs de transcription est en outre modulée par des signaux intracellulaires provoquant une modification post-traductionnelle des protéines, notamment phosphorylée, acétylée ou glycosylée. Ces changements influencent la capacité d'un facteur de transcription à se lier, directement ou indirectement, à l'ADN promoteur, à recruter l'ARN polymérase ou à favoriser l'élongation d'une molécule d'ARN nouvellement synthétisée.

La membrane nucléaire chez les eucaryotes permet une régulation supplémentaire des facteurs de transcription par la durée de leur présence dans le noyau, qui est régulée par des modifications réversibles de leur structure et par la liaison d'autres protéines. [35] Des stimuli environnementaux ou des signaux endocriniens [36] peuvent provoquer une modification des protéines régulatrices [37] provoquant des cascades de signaux intracellulaires, [38] qui entraînent une régulation de l'expression des gènes.

Plus récemment, il est devenu apparent qu'il y a une influence significative des effets non spécifiques de la séquence d'ADN sur la transcription. Ces effets sont appelés épigénétiques et impliquent la structure d'ordre supérieur de l'ADN, des protéines de liaison à l'ADN non spécifiques à une séquence et la modification chimique de l'ADN. En général, les effets épigénétiques modifient l'accessibilité de l'ADN aux protéines et modulent ainsi la transcription.

Chez les eucaryotes, la structure de la chromatine, contrôlée par le code histone, régule l'accès à l'ADN avec des impacts significatifs sur l'expression des gènes dans les zones euchromatine et hétérochromatine.

Enhancers, facteurs de transcription, complexe médiateur et boucles d'ADN dans la transcription des mammifères Modifier

L'expression des gènes chez les mammifères est régulée par de nombreux éléments de régulation cis, y compris les promoteurs centraux et les éléments promoteurs-proximaux qui sont situés près des sites de démarrage de la transcription des gènes, en amont de l'ADN (vers la région 5' du brin sens). D'autres modules de régulation cis importants sont localisés dans des régions d'ADN éloignées des sites de démarrage de la transcription. Il s'agit notamment d'amplificateurs, de silencieux, d'isolateurs et d'éléments d'attache. [39] Parmi cette constellation d'éléments, les activateurs et leurs facteurs de transcription associés ont un rôle de premier plan dans la régulation de l'expression des gènes. [40]

Les amplificateurs sont des régions du génome qui sont des éléments majeurs de régulation des gènes. Les amplificateurs contrôlent les programmes d'expression génique spécifiques à un type cellulaire, le plus souvent en parcourant de longues distances pour se rapprocher physiquement des promoteurs de leurs gènes cibles. [41] De multiples amplificateurs, chacun souvent à des dizaines ou des centaines de milliers de nucléotides éloignés de leurs gènes cibles, bouclent vers leurs promoteurs de gènes cibles et se coordonnent les uns avec les autres pour contrôler l'expression de leur gène cible commun. [41]

L'illustration schématique à gauche montre un amplificateur en boucle pour se rapprocher physiquement du promoteur d'un gène cible. La boucle est stabilisée par un dimère d'une protéine connecteur (par exemple un dimère de CTCF ou YY1), avec un membre du dimère ancré à son motif de liaison sur l'amplificateur et l'autre membre ancré à son motif de liaison sur le promoteur (représenté par le zigzags rouges dans l'illustration). [42] Plusieurs facteurs de transcription spécifiques à la fonction cellulaire (il existe environ 1 600 facteurs de transcription dans une cellule humaine [43] ) se lient généralement à des motifs spécifiques sur un amplificateur [44] et une petite combinaison de ces facteurs de transcription liés à l'amplificateur, lorsqu'ils sont rapprochés à un promoteur par une boucle d'ADN, régissent le niveau de transcription du gène cible. Le médiateur (un complexe généralement constitué d'environ 26 protéines dans une structure en interaction) communique les signaux régulateurs des facteurs de transcription liés à l'ADN amplificateur directement à l'enzyme ARN polymérase II (pol II) liée au promoteur. [45]

Les activateurs, lorsqu'ils sont actifs, sont généralement transcrits à partir des deux brins d'ADN avec des ARN polymérases agissant dans deux directions différentes, produisant deux ARNe comme illustré sur la figure. [46] Un amplificateur inactif peut être lié par un facteur de transcription inactif. La phosphorylation du facteur de transcription peut l'activer et ce facteur de transcription activé peut alors activer l'amplificateur auquel il est lié (voir la petite étoile rouge représentant la phosphorylation du facteur de transcription lié à l'amplificateur dans l'illustration). [47] Un amplificateur activé commence la transcription de son ARN avant d'activer la transcription de l'ARN messager à partir de son gène cible. [48]

Méthylation et déméthylation de l'ADN dans la régulation transcriptionnelle Modifier

La méthylation de l'ADN est un mécanisme répandu pour l'influence épigénétique sur l'expression des gènes et est observée chez les bactéries et les eucaryotes et joue un rôle dans le silence et la régulation de la transcription héréditaires. La méthylation se produit le plus souvent sur une cytosine (voir Figure). La méthylation de la cytosine se produit principalement dans les séquences dinucléotidiques où une cytosine est suivie d'une guanine, un site CpG. Le nombre de sites CpG dans le génome humain est d'environ 28 millions. [49] Selon le type de cellule, environ 70 % des sites CpG ont une cytosine méthylée. [50]

La méthylation de la cytosine dans l'ADN joue un rôle majeur dans la régulation de l'expression des gènes. La méthylation des CpG dans une région promotrice d'un gène réprime généralement la transcription du gène [51] tandis que la méthylation des CpG dans le corps d'un gène augmente l'expression. [52] Les enzymes TET jouent un rôle central dans la déméthylation des cytosines méthylées. La déméthylation des CpG dans un promoteur de gène par l'activité enzymatique TET augmente la transcription du gène. [53]

Régulation transcriptionnelle dans l'apprentissage et la mémoire Modifier

Chez un rat, le conditionnement contextuel de la peur (CFC) est une expérience d'apprentissage douloureuse. Un seul épisode de CFC peut laisser un souvenir effrayant à vie. [54] Après un épisode de CFC, la méthylation de la cytosine est altérée dans les régions promotrices d'environ 9,17 % de tous les gènes dans l'ADN des neurones de l'hippocampe d'un rat. [55] L'hippocampe est l'endroit où les nouveaux souvenirs sont initialement stockés. Après CFC, environ 500 gènes ont augmenté la transcription (souvent en raison de la déméthylation des sites CpG dans une région promotrice) et environ 1 000 gènes ont diminué la transcription (souvent en raison de la 5-méthylcytosine nouvellement formée sur les sites CpG dans une région promotrice). Le schéma des gènes induits et réprimés dans les neurones semble fournir une base moléculaire pour former le premier souvenir transitoire de cet événement d'entraînement dans l'hippocampe du cerveau de rat. [55]

En particulier, le gène du facteur neurotrophique dérivé du cerveau (BDNF) est connu comme un « gène d'apprentissage ». [56] Après la CFC, il y a eu une réglementation BDNF l'expression des gènes, liée à une diminution de la méthylation des CpG de certains promoteurs internes du gène, et cela était corrélé à l'apprentissage. [56]

Régulation transcriptionnelle dans le cancer Modifier

La majorité des promoteurs de gènes contiennent un îlot CpG avec de nombreux sites CpG. [57] Lorsque plusieurs des sites CpG du promoteur d'un gène sont méthylés, le gène devient silencieux. [58] Les cancers colorectaux ont généralement 3 à 6 mutations du conducteur et 33 à 66 mutations de l'auto-stoppeur ou du passager. [59] Cependant, le silence transcriptionnel peut être plus important que la mutation pour provoquer la progression vers le cancer. Par exemple, dans les cancers colorectaux, environ 600 à 800 gènes sont réduits au silence transcriptionnellement par la méthylation des îlots CpG (voir régulation de la transcription dans le cancer). La répression transcriptionnelle dans le cancer peut également se produire par d'autres mécanismes épigénétiques, tels que l'expression altérée des microARN. [60] Dans le cancer du sein, la répression transcriptionnelle de BRCA1 peut survenir plus fréquemment par microARN-182 surexprimé que par hyperméthylation du promoteur BRCA1 (voir Faible expression de BRCA1 dans les cancers du sein et de l'ovaire).

Régulation post-transcriptionnelle Modifier

Chez les eucaryotes, où l'exportation de l'ARN est requise avant que la traduction ne soit possible, l'exportation nucléaire est censée fournir un contrôle supplémentaire sur l'expression des gènes. Tout le transport à l'intérieur et à l'extérieur du noyau se fait via le pore nucléaire et le transport est contrôlé par une large gamme de protéines d'importine et d'exportine.

L'expression d'un gène codant pour une protéine n'est possible que si l'ARN messager portant le code survit suffisamment longtemps pour être traduit. Dans une cellule typique, une molécule d'ARN n'est stable que si elle est spécifiquement protégée contre la dégradation. La dégradation de l'ARN a une importance particulière dans la régulation de l'expression dans les cellules eucaryotes où l'ARNm doit parcourir des distances importantes avant d'être traduit. Chez les eucaryotes, l'ARN est stabilisé par certaines modifications post-transcriptionnelles, notamment la coiffe 5' et la queue poly-adénylée.

La dégradation intentionnelle de l'ARNm est utilisée non seulement comme mécanisme de défense contre l'ARN étranger (normalement à partir de virus) mais aussi comme voie d'acheminement de l'ARNm déstabilisation. Si une molécule d'ARNm a une séquence complémentaire à un petit ARN interférent, elle est alors ciblée pour être détruite via la voie d'interférence ARN.

Trois régions et microARN non traduits principaux Modifier

Trois régions principales non traduites (3'UTR) des ARN messagers (ARNm) contiennent souvent des séquences régulatrices qui influencent l'expression des gènes de manière post-transcriptionnelle. Ces 3'-UTR contiennent souvent à la fois des sites de liaison pour les microARN (miARN) ainsi que pour les protéines régulatrices. En se liant à des sites spécifiques au sein de la 3'-UTR, les miARN peuvent diminuer l'expression génique de divers ARNm en inhibant la traduction ou en provoquant directement la dégradation du transcrit. Le 3'-UTR peut également avoir des régions de silence qui se lient à des protéines répresseurs qui inhibent l'expression d'un ARNm.

Le 3'-UTR contient souvent des éléments de réponse microARN (MRE). Les MRE sont des séquences auxquelles les miARN se lient. Ce sont des motifs répandus dans les 3'-UTR. Parmi tous les motifs régulateurs au sein des 3'-UTR (par exemple, y compris les régions de silencieux), les MRE représentent environ la moitié des motifs.

En 2014, le site Web miRBase, [61] une archive de séquences et d'annotations de miARN, répertoriait 28 645 entrées dans 233 espèces biologiques. Parmi ceux-ci, 1 881 miARN se trouvaient dans des loci de miARN humains annotés. Les miARN devaient avoir en moyenne environ quatre cents ARNm cibles (affectant l'expression de plusieurs centaines de gènes). [62] Friedman et al. [62] estiment que >45 000 sites cibles de miARN dans les 3′UTR d'ARNm humains sont conservés au-dessus des niveaux de fond, et >60% des gènes codant pour des protéines humaines ont été soumis à une pression sélective pour maintenir l'appariement aux miARN.

Des expériences directes montrent qu'un seul miARN peut réduire la stabilité de centaines d'ARNm uniques. [63] D'autres expériences montrent qu'un seul miARN peut réprimer la production de centaines de protéines, mais que cette répression est souvent relativement légère (moins de 2 fois). [64] [65]

Les effets de la dérégulation de l'expression des gènes par les miARN semblent être importants dans le cancer. [66] Par exemple, dans les cancers gastro-intestinaux, neuf miARN ont été identifiés comme étant épigénétiquement modifiés et efficaces pour réguler à la baisse les enzymes de réparation de l'ADN. [67]

Les effets de la dérégulation de l'expression des gènes par les miARN semblent également être importants dans les troubles neuropsychiatriques, tels que la schizophrénie, le trouble bipolaire, la dépression majeure, la maladie de Parkinson, la maladie d'Alzheimer et les troubles du spectre autistique. [68] [69]

Régulation translationnelle Modifier

La régulation directe de la traduction est moins répandue que le contrôle de la transcription ou de la stabilité de l'ARNm, mais est parfois utilisée. L'inhibition de la traduction des protéines est une cible majeure pour les toxines et les antibiotiques, de sorte qu'ils peuvent tuer une cellule en outrepassant son contrôle normal de l'expression génique. Les inhibiteurs de la synthèse des protéines comprennent l'antibiotique néomycine et la toxine ricine.

Modifications post-traductionnelles Modifier

Les modifications post-traductionnelles (PTM) sont des modifications covalentes des protéines. Comme l'épissage d'ARN, ils contribuent à diversifier considérablement le protéome. Ces modifications sont généralement catalysées par des enzymes. De plus, des processus tels que des additions covalentes aux résidus de chaîne latérale d'acides aminés peuvent souvent être inversés par d'autres enzymes. Cependant, certains, comme le clivage protéolytique du squelette protéique, sont irréversibles. [70]

Les PTM jouent de nombreux rôles importants dans la cellule. [71] Par exemple, la phosphorylation est principalement impliquée dans l'activation et la désactivation des protéines et dans les voies de signalisation. [72] Les PTM sont impliqués dans la régulation transcriptionnelle : une fonction importante de l'acétylation et de la méthylation est la modification de la queue des histones, qui modifie l'accessibilité de l'ADN pour la transcription. [70] Ils peuvent également être observés dans le système immunitaire, où la glycosylation joue un rôle clé. [73] Un type de PTM peut initier un autre type de PTM, comme on peut le voir dans la façon dont l'ubiquitination marque les protéines pour la dégradation par protéolyse. [70] La protéolyse, en plus d'être impliquée dans la dégradation des protéines, est également importante pour les activer et les désactiver, et pour réguler les processus biologiques tels que la transcription de l'ADN et la mort cellulaire. [74]

La mesure de l'expression des gènes est une partie importante de nombreuses sciences de la vie, car la capacité de quantifier le niveau auquel un gène particulier est exprimé dans une cellule, un tissu ou un organisme peut fournir de nombreuses informations précieuses. Par exemple, la mesure de l'expression des gènes peut :

  • Identifier l'infection virale d'une cellule (expression de la protéine virale).
  • Déterminer la susceptibilité d'un individu au cancer (expression oncogène).
  • Trouver si une bactérie est résistante à la pénicilline (expression de bêta-lactamase).

De même, l'analyse de la localisation de l'expression des protéines est un outil puissant, et cela peut être fait à l'échelle de l'organisme ou de la cellule. L'étude de la localisation est particulièrement importante pour l'étude du développement dans les organismes multicellulaires et en tant qu'indicateur de la fonction des protéines dans des cellules individuelles. Idéalement, la mesure de l'expression se fait en détectant le produit génique final (pour de nombreux gènes, il s'agit de la protéine), cependant, il est souvent plus facile de détecter l'un des précurseurs, généralement l'ARNm et de déduire les niveaux d'expression génique à partir de ces mesures.

Quantification de l'ARNm Modifier

Les niveaux d'ARNm peuvent être mesurés quantitativement par Northern blot, qui fournit des informations sur la taille et la séquence des molécules d'ARNm. Un échantillon d'ARN est séparé sur un gel d'agarose et hybride à une sonde d'ARN marquée radioactivement qui est complémentaire de la séquence cible. L'ARN radiomarqué est ensuite détecté par une autoradiographie. Étant donné que l'utilisation de réactifs radioactifs rend la procédure longue et potentiellement dangereuse, des méthodes alternatives de marquage et de détection, telles que les chimies de la digoxigénine et de la biotine, ont été développées. Les inconvénients perçus du transfert de Northern sont que de grandes quantités d'ARN sont nécessaires et que la quantification peut ne pas être complètement précise, car elle implique de mesurer la force de la bande dans une image d'un gel. D'autre part, les informations supplémentaires sur la taille de l'ARNm provenant du transfert de Northern permettent la discrimination de transcrits épissés alternativement.

Une autre approche pour mesurer l'abondance d'ARNm est la RT-qPCR. Dans cette technique, la transcription inverse est suivie d'une PCR quantitative. La transcription inverse génère d'abord une matrice d'ADN à partir de l'ARNm. Cette matrice simple brin est appelée ADNc. La matrice d'ADNc est ensuite amplifiée lors de l'étape quantitative, au cours de laquelle la fluorescence émise par les sondes d'hybridation marquées ou les colorants intercalaires change au fur et à mesure que le processus d'amplification de l'ADN progresse. Avec une courbe standard soigneusement construite, la qPCR peut produire une mesure absolue du nombre de copies d'ARNm d'origine, généralement en unités de copies par nanolitre de tissu homogénéisé ou de copies par cellule. La qPCR est très sensible (la détection d'une seule molécule d'ARNm est théoriquement possible), mais peut être coûteuse selon le type de rapporteur utilisé. Les sondes oligonucléotidiques marquées par fluorescence sont plus chères que les colorants fluorescents intercalants non spécifiques.

Pour le profilage de l'expression ou l'analyse à haut débit de nombreux gènes dans un échantillon, une PCR quantitative peut être effectuée pour des centaines de gènes simultanément dans le cas de puces à faible densité. Une deuxième approche est le microarray d'hybridation. Une seule puce ou "puce" peut contenir des sondes pour déterminer les niveaux de transcription pour chaque gène connu dans le génome d'un ou plusieurs organismes. Alternativement, des technologies "basées sur des balises" telles que l'analyse en série de l'expression génique (SAGE) et RNA-Seq, qui peuvent fournir une mesure relative de la concentration cellulaire de différents ARNm, peuvent être utilisées. Un avantage des méthodes basées sur les marqueurs est l'« architecture ouverte », permettant la mesure exacte de n'importe quel transcrit, avec une séquence connue ou inconnue. Le séquençage de nouvelle génération (NGS) tel que RNA-Seq est une autre approche, produisant de grandes quantités de données de séquence qui peuvent être associées à un génome de référence. Bien que le NGS soit comparativement long, coûteux et gourmand en ressources, il peut identifier des polymorphismes mononucléotidiques, des variantes d'épissage et de nouveaux gènes, et peut également être utilisé pour profiler l'expression dans des organismes pour lesquels peu ou pas d'informations de séquence sont disponibles. .

Profils d'ARN dans Wikipedia Modifier

Des profils comme ceux-ci sont trouvés pour presque toutes les protéines répertoriées dans Wikipedia. Ils sont générés par des organisations telles que l'Institut de génomique de la Fondation de recherche Novartis et l'Institut européen de bioinformatique. Des informations supplémentaires peuvent être trouvées en recherchant leurs bases de données (pour un exemple du transporteur GLUT4 illustré ici, voir la citation). [75] Ces profils indiquent le niveau d'expression de l'ADN (et donc de l'ARN produit) d'une certaine protéine dans un certain tissu, et sont codés par couleur en conséquence dans les images situées dans la Protein Box sur le côté droit de chaque page Wikipedia.

Quantification des protéines Modifier

Pour les gènes codant pour des protéines, le niveau d'expression peut être directement évalué par un certain nombre de méthodes avec des analogies claires avec les techniques de quantification de l'ARNm.

L'une des méthodes les plus couramment utilisées consiste à effectuer un Western blot contre la protéine d'intérêt. [76] Cela donne des informations sur la taille de la protéine en plus de son identité. Un échantillon (souvent un lysat cellulaire) est séparé sur un gel de polyacrylamide, transféré sur une membrane puis sondé avec un anticorps contre la protéine d'intérêt. L'anticorps peut être conjugué à un fluorophore ou à la peroxydase de raifort pour l'imagerie et/ou la quantification. La nature sur gel de ce dosage rend la quantification moins précise, mais il a l'avantage de pouvoir identifier les modifications ultérieures de la protéine, par exemple la protéolyse ou l'ubiquitination, à partir des changements de taille.

Corrélation ARNm-protéine Modifier

La quantification de la protéine et de l'ARNm permet une corrélation des deux niveaux. La question de savoir dans quelle mesure les niveaux de protéines sont en corrélation avec leurs niveaux de transcrits correspondants est très débattue et dépend de plusieurs facteurs. La régulation de chaque étape de l'expression génique peut avoir un impact sur la corrélation, comme le montre la régulation de la traduction [19] ou la stabilité des protéines. [77] Les facteurs post-traductionnels, tels que le transport des protéines dans les cellules hautement polaires, [78] peuvent également influencer la corrélation ARNm-protéine mesurée.

Localisation Modifier

L'analyse de l'expression n'est pas limitée à la quantification, la localisation peut également être déterminée. L'ARNm peut être détecté avec un brin d'ARNm complémentaire marqué de manière appropriée et la protéine peut être détectée via des anticorps marqués. L'échantillon sondé est ensuite observé par microscopie pour identifier où se trouve l'ARNm ou la protéine.

En remplaçant le gène par une nouvelle version fusionnée à un marqueur de protéine fluorescente verte (ou similaire), l'expression peut être directement quantifiée dans les cellules vivantes. Cela se fait par imagerie à l'aide d'un microscope à fluorescence. Il est très difficile de cloner une protéine fusionnée à la GFP dans son emplacement natif dans le génome sans affecter les niveaux d'expression, de sorte que cette méthode ne peut souvent pas être utilisée pour mesurer l'expression génique endogène. Elle est cependant largement utilisée pour mesurer l'expression d'un gène introduit artificiellement dans la cellule, par exemple via un vecteur d'expression. Il est important de noter qu'en fusionnant une protéine cible à un rapporteur fluorescent, le comportement de la protéine, y compris sa localisation cellulaire et son niveau d'expression, peut être considérablement modifié.

Le dosage immuno-enzymatique fonctionne en utilisant des anticorps immobilisés sur une plaque de microtitration pour capturer les protéines d'intérêt à partir d'échantillons ajoutés au puits. En utilisant un anticorps de détection conjugué à une enzyme ou à un fluorophore, la quantité de protéine liée peut être mesurée avec précision par détection fluorométrique ou colorimétrique. Le processus de détection est très similaire à celui d'un Western blot, mais en évitant les étapes de gel, une quantification plus précise peut être obtenue.

Un système d'expression est un système spécialement conçu pour la production d'un produit génique de choix. Il s'agit normalement d'une protéine, bien qu'il puisse également s'agir d'ARN, tel que l'ARNt ou un ribozyme. Un système d'expression se compose d'un gène, normalement codé par l'ADN, et de la machinerie moléculaire requise pour transcrire l'ADN en ARNm et traduire l'ARNm en protéine à l'aide des réactifs fournis. Au sens le plus large, cela inclut chaque cellule vivante, mais le terme est plus normalement utilisé pour désigner l'expression comme un outil de laboratoire. Un système d'expression est donc souvent artificiel d'une certaine manière. Les systèmes d'expression sont cependant un processus fondamentalement naturel. Les virus sont un excellent exemple où ils se répliquent en utilisant la cellule hôte comme système d'expression pour les protéines virales et le génome.

Expression inductible Modifier

Dans la nature Modifier

En plus de ces outils biologiques, certaines configurations d'ADN naturellement observées (gènes, promoteurs, activateurs, répresseurs) et la machinerie associée elle-même sont appelées système d'expression. Ce terme est normalement utilisé dans le cas où un gène ou un ensemble de gènes est activé dans des conditions bien définies, par exemple, le système d'expression de commutateur de répresseur simple dans le phage Lambda et le système d'opérateur lac dans les bactéries. Plusieurs systèmes d'expression naturels sont directement utilisés ou modifiés et utilisés pour des systèmes d'expression artificiels tels que le système d'expression Tet-on et Tet-off.

Les gènes ont parfois été considérés comme des nœuds dans un réseau, les entrées étant des protéines telles que des facteurs de transcription, et les sorties étant le niveau d'expression des gènes. Le nœud lui-même exécute une fonction, et le fonctionnement de ces fonctions a été interprété comme effectuant une sorte de traitement de l'information à l'intérieur des cellules et détermine le comportement cellulaire.

Des réseaux de gènes peuvent également être construits sans formuler un modèle causal explicite. C'est souvent le cas lors de l'assemblage de réseaux à partir de grands ensembles de données d'expression. [79] La covariation et la corrélation de l'expression sont calculées sur un large échantillon de cas et de mesures (souvent des données de transcriptome ou de protéome). La source de variation peut être expérimentale ou naturelle (observationnelle). Il existe plusieurs façons de construire des réseaux d'expression génique, mais une approche courante consiste à calculer une matrice de toutes les corrélations d'expression par paires à travers des conditions, des moments ou des individus et de convertir la matrice (après seuillage à une certaine valeur seuil) en une représentation graphique dans laquelle les nœuds représentent des gènes, des transcrits ou des protéines et les bords reliant ces nœuds représentent la force de l'association (voir [1]). [80]

Les techniques expérimentales suivantes sont utilisées pour mesurer l'expression des gènes et sont répertoriées dans un ordre approximativement chronologique, en commençant par les technologies plus anciennes et mieux établies. Ils sont divisés en deux groupes en fonction de leur degré de multiplexité.


Discussion

Permettre des recherches fonctionnelles fines sur des gènes inconnus et l'établissement d'un système stable et efficace B. mori bioréacteur de glande à soie, les inconvénients des effets de position et la mutagenèse insertionnelle causés par piggyBac-l'intégration aléatoire médiatisée doit être surmontée. Par conséquent, nous avons utilisé une combinaison de différentes techniques de manipulation génomique et le système d'expression optimisé de la chaîne H de la fibroïne pour développer une stratégie générique et efficace pour établir un système d'expression transgénique stable, remplaçable et très efficace chez le ver à soie. Pour développer cette stratégie, nous avons d'abord inséré dans les génomes des vers à soie une cassette d'expression de gène cible exogène qui exprime efficacement et sélectivement la protéine cible dans les glandes à soie du ver à soie, en utilisant le composite piggyBac- vecteur dérivé PB-TP, qui a été intégré au hasard pendant la transformation initiale de la lignée germinale. La structure du vecteur PB-TP a été décrite ci-dessus. Il est à noter que ce vecteur composite, avec deux de type sauvage de pleine longueur piggyBac bras R1 (1050 pb) et L1 (678 pb) et deux raccourcis piggyBac les bras L2 (309 pb) et R2 (238 pb), codent quatre transposons potentiels (Figure supplémentaire S1). Il a été rapporté que le court piggyBac les constructions de bras peuvent être utilisées pour améliorer l'efficacité de mobilisation de piggyBac dans les génomes de D. melanogaster 49 et B. mori 50 . Par conséquent, L2 et R2 ont été développés pour améliorer l'efficacité de la remobilisation R1-L2 et R2-L1 dans B. mori in vivo, améliorant ainsi l'efficacité de suppression de R1-L2 et R2-L1 du locus d'insertion chromosomique initial. Plusieurs études antérieures ont également démontré que non seulement les TIR mais aussi les séquences flanquantes de piggyBac, en particulier les sites TTAA, sont nécessaires à sa transposition réussie 51 . Par conséquent, les sites TTAA ont été construits à l'extrémité 3' des séquences L2 et R2 dans le vecteur composite (indiqué dans les séquences d'amorces dans le tableau supplémentaire S1). Pour réaliser l'intégration précise d'autres gènes exogènes au même locus génomique que le gène cible avec la RMCE médiée par phiC31, deux attP sites ont été introduits, flanquant la cassette d'expression du gène cible, dans la même orientation.

Dans cette étude, nous avons établi quatre souches transgéniques différentes, TS1-RgG1-TS1-RgG4, avec l'insertion aléatoire du transposon R1-L1 dans le génome du ver à soie et les cocons des différentes souches TS1-RgG ont affiché des teneurs en EGFP pures allant de 0,9% à 16% (p/p). Ce résultat indique qu'un transgène inséré à différents loci chromosomiques affecte grandement l'expression de la protéine exogène chez le ver à soie. À notre connaissance, TS1-RgG2 est à ce jour la souche de ver à soie transgénique la plus efficace produisant une protéine exogène dans la glande à soie 18,20,52,53,54,55. L'élimination ultérieure de toutes les séquences de transposon contenant la cassette d'expression du gène PBase et tous les gènes marqueurs pour TS2-RgG2 a été complétée par l'expression induite par un choc thermique de la transposase in vivo, générant TS3-g2, qui ne contient que le attP-cassette d'expression de chaîne H de fibroïne optimisée flanquée dans son génome. Cette méthode empêche non seulement la remobilisation du gène cible, mais élimine également les effets indésirables des gènes marqueurs sélectionnables dans toute application future de l'insecte transgénique, ce qui peut affecter l'expression des gènes cibles, la croissance et le développement des individus transgéniques. , le transfert horizontal de gènes ou tout autre problème potentiel de sécurité écologique associé aux insectes transgéniques 21 . Les résultats du séquençage ont montré qu'il n'y avait pas d'empreinte ou de changements structurels, tels que des suppressions, des inversions ou des réarrangements, au niveau des éléments TTAA du site d'excision ou attP sites dans les génomes des individus TS3-g2. D'autres résultats ont confirmé la stabilité génétique de l'intégration et de l'expression de la EGFP gène dans la descendance TS3-g2. Dans une future étude, différents gènes d'intérêt seront placés précisément au même locus génomique du ver à soie TS3-g2 à l'aide d'une réaction RMCE médiée par phiC31. Cela permettra d'atteindre l'expression très efficace et stable de différentes protéines exogènes chez les vers à soie transgéniques, médiée par le promoteur de la chaîne H de la fibroïne. Parce que la recombinaison médiée par phiC31-intégrase entre le attP et attB sites est unidirectionnel, il assure la stabilité des transgènes après la réaction RMCE 56 . Les vers à soie TS3-g2 établis dans cette étude peuvent être utilisés pour créer un bioréacteur de glande à soie de ver à soie transgénique très efficace pour la production de protéines exogènes. Surtout, ils peuvent également être utilisés pour améliorer les soies naturelles de cocon et produire de nouvelles fibres de soie avec une résistance à la traction élevée, une adhérence élevée et d'autres excellentes propriétés avec l'expression spécifique à la glande de soie de protéines structurellement apparentées (telles que la protéine de dragline d'araignée 57, 58). En fait, d'autres promoteurs spécifiques de la glande à soie (comme le FibL 59,60 , fhx 52 et Ser1 ( Figure 1). De plus, le FLP/FRT et Cre/loxP systèmes ont été utilisés avec succès pour les réactions RMCE dans D. melanogaster 22,29,65 . De plus, Schetelig et Handler ont récemment décrit un système RMCE fondé sur la Crema qui est très efficace dans D. melanogaster et pour la première fois chez un non drosophile, la mouche téphritide, Anastrepha suspensa 66 . Par rapport au système RMCE médié par phiC31, RMCE médié par FLP et Cre ont le principal avantage qui a permis de multiples événements d'insertion / suppression de transgènes à un seul locus 65,66. Dans les travaux futurs, les systèmes RMCE médiés par FLP et Cre pourraient également être combinés avec différentes techniques de manipulation génomique décrites ci-dessus et présentés comme un outil puissant pour les comparaisons génomiques fonctionnelles et pour développer les souches de vers à soie transgéniques les plus avancées pour une utilisation appliquée.

Dans cette étude, un mélange du vecteur PB-TP et du plasmide auxiliaire pHA3PIG a été injecté dans des œufs G0 pour créer des individus TS1 avec une transformation initiale de la lignée germinale. Les individus transgéniques pourraient également être générés par l'injection du vecteur PB-TP seul, sans le plasmide assistant, car le Drosophile hsp70 promoteur dans le vecteur PB-TP induit une expression de protéine transitoire très efficace dans les embryons de plusieurs espèces d'insectes différentes, y compris D. melanogaster 10 , Anopheles stephensi 40 et B. mori 67 . La combinaison structurelle de quatre transposons différents est codée dans le vecteur composite PB-TP, mais la transformation de la lignée germinale de seulement la construction R1-L1 était attendue au cours de la transformation initiale. Par conséquent, un ver à soie cytoplasmique axé sur le promoteur A3 Pbase Le vecteur d'expression génique, pHA3PIG, a été utilisé comme plasmide auxiliaire pour la production de PBase, ce qui augmentera l'efficacité de la transformation initiale attendue, augmentant ainsi la probabilité de produire des individus TS1-RgG.

Ici, nous avons également utilisé le hsp70 promoteur pour induire PBase expression génique chez les individus TS2-RgG2 in vivo avec la TVH. La méthode HST est plus simple que la méthode d'injection directe et le principal inconvénient de la méthode d'hybridation sexuelle est que la PBase La séquence génique est introduite dans le génome de la progéniture hybride, permettant l'expression persistante de PBase, ce qui peut réduire l'efficacité de délétion de R1-L2 et R2-L1. Des études antérieures ont montré que le hsp70 promoteur induit mieux l'expression de gènes en aval lorsque les vers à soie sont exposés à HST continue et répétée à 42 ° C dans leurs stades de développement 68,69. Le ver à soie embryonnaire se développe d'un zygote unicellulaire à une larve et le quatrième stade larvaire du ver à soie est une période critique dans la formation de ses spermatocytes secondaires ou le développement de ses ovocytes primaires 70 . Par conséquent, une HST continue et répétée à 42 °C a été appliquée pour traiter les vers à soie transgéniques au stade embryonnaire ou au stade larvaire de quatrième stade dans cette étude. Les résultats suggèrent que la HST au stade embryonnaire ou larvaire affecte la croissance normale des vers à soie transgéniques et que la HST au stade larvaire provoque le taux de mortalité le plus élevé (tableau 4). Par rapport à la progéniture des individus des groupes témoins non-HST, les efficacités de suppression de R1-L2 et/ou R2-L1 étaient significativement plus élevées chez la progéniture des individus TS2-RgG2 dans les groupes HST, en particulier chez la progéniture des groupes avec HST au stade embryonnaire (tableau 5). L'efficacité de suppression de R2-L1 était jusqu'à 80% dans la progéniture d'individus TS4-gG-2 avec HST appliqué au stade embryonnaire (tableau supplémentaire S3 et figure 5A). Tous ces résultats suggèrent que la HST continue et répétée à 42°C au stade embryonnaire des vers à soie transgéniques est le moyen le plus efficace pour supprimer les transposons de leur progéniture.

Cependant, quelques couvées G3 gG-positives d'individus TS2-RgG2 et G5 g-positives d'individus TS4-gG ont également été observées dans les groupes non-HST, ce qui est attribuable à l'expression de fond de PBase sous le contrôle de la hsp70 promoteur, même si cette activité de fond était très faible chez les vers à soie transgéniques in vivo (Tableau 5 et Tableau supplémentaire S3). Ces résultats sont cohérents avec ceux d'une étude précédente qui a rapporté l'expression de fond d'un Bombyx gène Ftz-F1 du récepteur nucléaire (BmFtz-F1) sous le contrôle du Drosophile hsp70 promoteur chez les vers à soie transgéniques 68 . Bien que l'activité basale de la hsp70 promoteur était faible à 25°C, notre étude confirme que la Drosophile hsp70 est un promoteur inductible très efficace pour réguler l'expression de gènes exogènes chez les vers à soie transgéniques.

Au cours des dernières années, des méthodes d'édition du génome, telles que la nucléase à doigt de zinc (ZFN), la nucléase effectrice de type transcription-activateur (TALEN) et la nucléase Cas9 guidée par l'ARN de répétitions palindromiques courtes régulièrement intercalées (CRISPR), ont été utilisées avec succès pour cibler et clivent des gènes chez le ver à soie 71,72,73 . Cependant, la longueur du fragment d'ADN intégré dans le génome du ver à soie par l'édition de gènes médiée par TALEN à l'aide d'oligonucléotides d'ADN simple brin est très limitée 74 et le seul rapport efficace GFP cassette d'expression (A3-GFP-SV40T) le knock-in était encore très limité chez le ver à soie lorsqu'il était médié par ZFN (seulement 0,008 %, 1/11770) 75 . La figure 7 montre une méthode efficace pour modifier des transgènes précédemment insérés et pour l'intégration de grands fragments d'ADN dans le génome du ver à soie en utilisant une combinaison des piggyBacbasée sur la méthode sans transposon, le système RMCE médié par phiC31 et le FLP/FRT système. Le phiC31/att Il a été démontré que le système permet l'intégration d'ADN jusqu'à 100 kb dans des sites récepteurs spécifiques dans D. melanogaster 76, de sorte que cette méthode pourrait être utilisée pour surmonter les inconvénients de ces systèmes d'édition du génome. En outre, une combinaison du système SSR et des méthodes d'édition du génome décrites ci-dessus devrait surmonter à la fois l'insertion aléatoire de transposons et les problèmes associés à l'intégration de grands fragments d'ADN à l'aide de systèmes d'édition du génome.

Stratégie pour l'intégration de gènes spécifiques au site via le RMCE médié par phiC31 et l'excision subséquente du marqueur du locus cible à l'aide du FLP/FRT système.

La production et la sélection de souches de vers à soie transgéniques contenaient une seule copie du gène cible 1 (Traget 1) sans aucun transposon ni gène marqueur (Marker 1 et Marker 2) dans leurs génomes (Target loci) en utilisant le piggyBacplasmide dérivé et comme décrit dans les méthodes et illustré à la figure 1. Recombinaison entre deux attB/attP des paires du vecteur donneur et des loci cibles médiés par l'intégrase phiC31 (Int) ont entraîné l'intégration d'une seule copie du gène taget 2 (cible 2), du marqueur 1 et d'un promoteur inductible (IP) pilotant la cassette d'expression de la recombinase FLP (Ter indique la séquence de terminaison) dans les loci cibles du génome du ver à soie. Expression inductible ultérieure de la recombinase FLP (FLP) in vivo, qui peut catalyser la recombinaison entre deux FRT sites et l'excision résultante du marqueur 1 et de la cassette d'expression de la recombinase FLP des loci cibles du génome du ver à soie.

En conclusion, nous avons développé une stratégie efficace et générique pour produire un système d'expression transgénique stable, remplaçable et hautement efficace dans B. mori. Notre stratégie élimine efficacement la remobilisation des piggyBac-transgènes intégrés médiés chez le ver à soie. Elle est également applicable à d'autres insectes lépidoptères pour améliorer la sécurité écologique des souches transgéniques destinées à être relâchées dans les programmes de lutte biologique. Parce que les vers à soie sont un insecte d'importance commerciale et sont largement utilisés comme modèle expérimental d'insectes lépidoptères, les souches transgéniques établies dans cette étude peuvent être utilisées non seulement pour optimiser l'expression des protéines exogènes et pour améliorer les propriétés des soies de cocon naturelles, mais aussi dans la recherche génomique, comme l'étude des fonctions de différents gènes aux mêmes endroits dans le génome du ver à soie. L'utilisation du piggyBac-méthode sans transposon associée à un système RMCE médié par phiC31 dans B. mori ou toute autre espèce n'a pas été signalée jusqu'à présent. Dans une future étude, nous combinerons notre stratégie avec les systèmes d'édition du génome décrits ci-dessus pour établir des technologies de manipulation génomique chez le ver à soie et d'autres espèces de lépidoptères.


Les éléments transposables et l'essai de biologie du génome

Les transposons sont des éléments mobiles de l'ADN, des gènes sauteurs qui peuvent sauter à l'intérieur des génomes ou à travers par transmission horizontale. On les trouve à la fois dans les génomes pro et eucaryotes. Barbara McClintock l'a d'abord appelé « éléments de contrôle » et il a ensuite été remplacé par des éléments transposables (TE). Son travail de pionnier pour comprendre la nature des motifs de couleur en mosaïque des graines de maïs et son héritage instable a conduit à la découverte des éléments activateurs (AC) et dissociateurs (Ds) dans le maïs. Cela a ouvert la voie à la compréhension de la nature dynamique du génome et du mécanisme de contrôle de l'expression des gènes (McClintock, 1950). Plus de 45% des génomes humains ont évolué à partir de transposons (Lander et al., 2001) ce qui les rend très intéressants à étudier et nous donne l'opportunité de comprendre les forces évolutives qui ont façonné notre génome au cours de l'évolution. Une fréquence élevée d'ET à transposer, approximativement de l'ordre de 103 à 105 par élément par génération, fournit suffisamment de matériel pour que l'évolution ait un effet majeur sur la formation de nouvelles espèces par série de mobilisation ou de perte (Biéacutemont et Vieira, 2006). Outre leur rôle dans l'évolution, les ET apparaissent maintenant comme des vecteurs prometteurs largement utilisés dans les applications de transgénèse et de thérapie génique.

Structure et transcription des TE

Les TE eucaryotes sont globalement divisés en deux classes principales en fonction de leur mécanisme de transposition. Les éléments de classe 1 sont des rétrotransposons qui utilisent un mode de transposition copier-coller médié par l'ARN et les éléments de classe 2 sont des transposons d'ADN qui utilisent une transposition couper-coller à base d'ADN (figure 1A). Les rétrotransposons représentent environ 42 % du génome humain (Lander et al., 2001), les ARN sont reverse transcrits en ADN par un élément de reverse transcriptase qui les intègre dans un nouveau site génomique. Ils sont ensuite subdivisés en éléments à répétition terminale longue (LTR) et non-LTR. Les rétrovirus endogènes humains (HERV), qui ressemblent à des rétrovirus dans la structure et le mécanisme, sont classés sous LTR en raison d'un gène d'enveloppe non fonctionnel qui empêche leur transmission extracellulaire. La majorité des éléments de classe I présents dans le génome humain sont principalement des éléments non LTR intercalés en longueur (LINE ou L1) (Lander et al., 2001). L'activité trans se produit rarement par leur machinerie de transposition rétro qui mobilise des éléments nucléaires courts intercalés non autonomes (SINES) comme les éléments Alu et SVA, qui forment des pseudogènes transformés (Boeke et Corces, 1989 Ostertag et Jr, 2001 Wei et al., 2001) . Même si la grande majorité des rétrotransposons sont inactifs, un génome humain moyen se compose de 80 à 100 éléments L1 actifs (Brouha et al., 2003).

Figure 1. Types d'éléments transposables et mécanisme de mobilisation des transposons. Les éléments transposables se répartissent en deux groupes principaux : (A) L'ADN Transposon code pour un seul gène, la transposase, flanqué de deux répétitions inversées terminales (IR). L'enzyme transposase r reconnaît les IR, excise l'élément et l'insère dans un nouveau locus génomique ailleurs. Les sites d'intégration et d'excision sont scellés à l'aide de l'enzyme de réparation de l'ADN hôte. Les rétroéléments (B) et (C) (type longue répétition terminale (LTR) et non-LTR) se déplacent via un intermédiaire ARN et codent pour une transcriptase inverse (RT), une intégrase (IN) et une endonucléase (EN). Chacun de ce groupe contient des éléments autonomes et non autonomes. Les éléments non autonomes ne codent pas les composants fonctionnels nécessaires à la transposition, mais dépendent plutôt de la transaction de leur homologue autonome pour leur mobilisation. Modifié après (Levin et Moran, 2011)

Dans la nature, les transposons existent soit sous forme de copie fonctionnelle complète qui code tous les composants (transposase et séquence de reconnaissance) soit sous forme de copie non autonome avec la séquence de reconnaissance à mobiliser en trans codée par une copie autonome. La transcription d'un transposon est l'étape la plus essentielle et la plus fondamentale vers la transposition. Ils reposent soit sur leur promoteur intrinsèque, soit sur un promoteur génomique adjacent. Les éléments rétrovirus et LTR utilisent leur LTR comme un signal promoteur/amplificateur puissant pour la transcription, ce qui est nécessaire pour la propagation réussie à la génération suivante dans l'organisme donné (Boeke et Corces, 1989) Il a été démontré que les éléments non LTR comme L1 ont des propriétés intrinsèques activité de promoteur dans leur région 5' intraduisible (UTR) (Swergold, 1990).

Un transposon d'ADN consiste en un gène codant pour la transposase flanqué de deux répétitions inversées terminales (IR). L'enzyme transposase reconnaît et lie les deux répétitions inversées terminales (IR), coupe l'ADN et le réinsère dans un nouvel emplacement génomique. Les transposons eucaryotes peuvent être subdivisés en trois grandes classes en fonction du mécanisme de transposition.

Transposons "couper-coller" classiques d'ADN double brin

Des hélitrons qui transposent en utilisant le mécanisme de réplication en cercle roulant (Kapitonov et Jurka, 2001)

Mavericks code sa propre ADN polymérase et transpose par un processus réplicatif de copier-coller (Pritham et al., 2007).

Les transposons d'ADN présents dans le génome humain appartiennent à la famille Tc-1/mariner super » (c. Les deux grandes classes ont été subdivisées en super-familles puis en familles sur la base du mécanisme de transposition, des similitudes de séquences et des relations structurelles. (Pace et Feschotte, 2007). La plupart des transposons d'ADN sont caractérisés par la présence de leur propre promoteur interne ou reposent sur l'expression des gènes voisins pour transcrire leur transposase en vue de la transposition. Des exemples de transposons d'ADN qui transposent avec leur propre promoteur incluent les éléments p chez les mouches (Kaufman et al., 1989) et les éléments mutateurs chez les plantes (Fridlender et al., 1998) (Raina et al., 1993). L'activité du promoteur n'est pas toujours conservée entre les membres d'une même famille. Dans le cas de Tc-1/mariner, les éléments Pot2 dans les plantes ont leur propre activité de promoteur à la fois dans le sens et dans le sens antisens (Kimura et Yamaguchi, 1998) et Tc3 dans C.elegans (Moldt et al., 2007) et d'autres membres tels que car les transposons Tc1 dépendent de la transcription fortuite par lecture des promoteurs génomiques adjacents. (Sijen et Plasterk, 2003).

Le mécanisme hôte régule l'expression des TE

Les ET sont souvent qualifiés d'éléments « égoïstes » ou « parasites car leur succès est inversement proportionnel à l'aptitude de l'hôte (Slotkin et Martienssen, 2007). L'activité des TE est souvent considérée comme délétère pour l'hôte, car ils sont hautement mutagènes et leur insertion peut altérer la régulation et l'expression des gènes flanquants de plusieurs manières. Bien que la plupart des transposons soient inactifs en raison de mutations, ils peuvent rester intacts mais silencieux dans les génomes de l'hôte. Pour minimiser la nature pernicieuse des transposons, le génome de l'hôte a développé un certain nombre de mécanismes de « défense » épigénétiques qui sont des voies interdépendantes telles que les petits ARN non codants, la méthylation de l'ADN et les modifications de la chromatine pour protéger les effets nocifs des ET.

Silençage piRNA et RNAi des TE

Les petits ARN interférents (siARN) sont de courtes séquences de molécules d'ARN de 21 à 30 nucléotides clivées par la famille de protéines dicer par un mécanisme appelé ARN interférence (ARNi). Les protéines Argonaute constituent les composants catalytiques du complexe de silençage induit par l'ARN (RISC). Tc1 est la famille de transposons la plus abondante chez C. elegans qui est réduite au silence par l'ARNi dans la lignée germinale (Sijen et Plasterk, 2003). Il est important de noter que les mutations des protéines des familles argonaute et dicer provoquent la remobilisation des ET chez de nombreuses espèces eucaryotes. Les siARN endogènes, qui sont présents chez les mammifères, sont largement contribués par l'activité des TE (Watanabe et al., 2006). Les rétrotransposons L1 représentant les 17% du génome humain sont réduits au silence par l'ARNi par l'activité sens et antisens de son promoteur (Yang et Kazazian, 2006). Les ARN interagissant avec Piwi (piARN) sont une nouvelle classe de petits ARN d'une longueur d'environ 30 nt exprimés au cours du développement des cellules germinales mâles. et al., 2006). Les PiARN sont disposés en grappes chez la souris et l'homme, suggérant une fonction commune dans le développement des cellules germinales (Aravin et al., 2007). Le gène de Drosophila piwi s'est avéré très important pour les cellules souches germinales (CGC) qui sont hautement conservées chez C. elegans et les humains. De plus, les éléments Gypsy, P & I sont tous réduits au silence dans la lignée germinale de Drosophila, où les protéines argonaute Piwi sont activement exprimées (Cox et al., 1998) (Rehwinkel et al., 2006). Les caractéristiques structurelles des TE pourraient aider à distinguer leurs transcrits du gène hôte pour le ciblage spécifique par la voie piARN et ARNi.

Figure 1. Voies de silençage génique médiées par les petits ARN (ARNs). Les déclencheurs d'ARNdb (représentés par l'épingle à cheveux), qui sont dérivés des répétitions terminales inversées d'un transposon d'ADN, sont traités et clivés en 21-24 nucléotides (nt) siARN par la famille de protéines Dicer. Ces siRNA guident les protéines Argonaute vers des ARN messagers complémentaires (ARNm) et interviennent dans leur dégradation ou répression traductionnelle. Les ARN spécifiques à la lignée germinale interagissant avec Piwi sont traités à partir d'ARN long simple brin, souvent des transcrits antisens de transposons. La liaison du piARN mature par les protéines PIWI ou Aubergine (AUB) lui permet d'être dirigé vers des séquences complémentaires dans l'ARNm TE. Le clivage endonucléolytique de l'ARNm, à 10 nt de l'extrémité 5 ² du petit ARN et le clivage/traitement 3 ² libère un piARN secondaire de transposon sens, qui s'associe à la protéine Argonaute 3 (AGO3). La liaison de ce complexe à des séquences complémentaires dans l'ARNm précurseur d'origine, suivie d'un clivage endonucléolytique, régénère un ARNpi antisens qui peut être dirigé vers l'ARNm TE au niveau transcriptionnel et post-transcriptionnel. Modifié après (Levin et Moran, 2011)

Méthylation de l'ADN et modifications de la chromatine

La méthylation de l'ADN fonctionne comme un marqueur épigénétique important qui joue un rôle central dans la régulation de l'expression des gènes et au cours du développement. Les modèles de méthylation de l'ADN qui sont définis dans les cellules germinales pendant la gamétogenèse sont largement effacés lors de l'embryogenèse et sont réinitialisés après l'implantation (Gaudet et al., 2004). Les résidus de cytosine dans l'ADN peuvent être à la fois méthylés chez les plantes ainsi que chez les animaux. Elles sont généralement réalisées par une famille d'enzymes ADN méthyltransférases. Chez la souris, la méthylation de la particule de type A intracisternale du rétrotransposon (IAP) supprime son expression dans l'embryogenèse. Mais l'inactivation de la DNMT1, l'ADN méthyltransférase responsable du maintien de la méthylation de l'ADN, conduit à des niveaux élevés d'éléments IAP (Walsh et al., 1998).

Figure 1. Déclencheurs développementaux de la transposition. Les événements d'intégration d'éléments transposables (TE) de la lignée germinale peuvent résulter de la mobilité des TE dans les cellules qui donnent naissance aux gamètes ou de la mobilité des TE après la fécondation au cours du développement précoce. La mobilité TE embryonnaire dans les cellules qui ne contribuent pas à la lignée germinale ou la mobilité à des stades de développement ultérieurs peut, en principe, conduire à des événements d'intégration TE somatiques. Modifié après (Levin et Moran, 2011)

La méthylation de l'ADN joue un rôle important dans la condensation et l'encapsidation de la chromatine par des modifications des queues amino (N)-terminales des histones qui altèrent son affinité pour les facteurs de transcription. Les régions dominées par TE dans les nucléosomes sont enrichies pour la méthylation de l'histone H3 à la lysine 9 (H3K9) associée à la répression transcriptionnelle (Martens et al., 2005). Chez Arabidopsis, la méthylation de l'ADN dirigée par l'ARN peut être induite par l'ARN double brin par l'ARNi. DICER-LIKE 3 (DCL3) recrute des composants qui signalent la méthylation de l'ADN d'une manière indépendante de son activité catalytique et génère un plus grand siARN de 24 à 26 nucléotides qui forme un complexe avec Argonaute4 (AGO4), et cela réduit au silence les TE par méthylation asymétrique de l'ADN (Qi et al., 2006). Le silençage génique transcriptionnel (TGS) médié par l'ARNi est mal compris chez les mammifères, mais on sait que les siARN introduits artificiellement peuvent lier l'ADN méthyltransférase Dnmt3a pour diriger la méthylation de l'ADN dans les cellules humaines (Weinberg et al., 2006).

Co-adaptation des TE pour les fonctions d'accueil

Au cours de l'évolution, la présence abondante de transposons avec et leur capacité à induire des mutations ont conduit à leur domestication (Miller et al., 1999). Ils sont connus pour être impliqués dans les réseaux de régulation tels que la fourniture d'un signal activateur qui peut recâbler l'expression du gène de l'hôte. Il est maintenant prouvé expérimentalement que près de 25 % des promoteurs humains contiennent des séquences de TE (Jordan et al., 2003). Un élément transposable spécifique aux eutherian (MER20) a contribué à l'origine du réseau de régulation génique spécifique du placenta chez les mammifères en augmentant la voie de signalisation de l'AMPc dans les cellules stromales de l'endomètre (Lynch et al., 2011). Le maintien du télomère intact de la drosophile est associé à des transpositions terminales de rétrotransposons spécialisés TART (telomere-associated retrotransposon) et HeT-A (Levis et al., 1993). Les rétroéléments de rétrovirus endogènes (ERV) LTR de classe I ont évolué pour avoir 1 500 sites de liaison pour p53 représentant 30 % de tous les sites de liaison de p53. Ces éléments ERV sont spécifiques aux primates et nous donnent une compréhension approfondie des rétrovirus endogènes qui façonnent le réseau transcriptionnel d'une protéine suppressive de tumeur humaine p53 (Wang et al., 2007). La recombinaison V(D)J est un réarrangement spécialisé de l'ADN de segments de gènes variables (V), de diversité (D) et de jonction (J) qui ont joué un rôle important dans le développement du système immunitaire des vertébrés. Les protéines RAG1 et RAG2 sont les composants essentiels qui interagissent pour former la recombinase responsable des activités de jonction et de transfert. Les séquences signal de recombinaison (RSS) jouxtant les segments V (variable), D (diversité) et J (jointure) sont responsables du clivage et de la jonction spécifiques à la séquence par le complexe protéique RAG1/2 (Gellert, 2002). L'ensemble du mécanisme rappelle beaucoup une réaction de transposition et RAG1/2 peut catalyser la transposition d'un segment d'ADN flanqué de RSS in vitro (Agrawal et al., 1998). Le noyau catalytique du RAG1 a évolué à partir des éléments Transib, un groupe de transposons d'ADN identifiés chez les invertébrés et la structure du RSS présente des caractéristiques de similarité de séquence avec le TIR du Transib Transposon (Kapitonov et Jurka, 2005). Avec toutes ces découvertes, la recombinaison V(D)J représente la co-adaptation et la domestication réussies des transposons avec la machinerie hôte.

Système de transposon Tc1/Mariner family & Sleeping Beauty (SB)

Les familles Tc1/Mariner sont la famille de transposons d'ADN la plus répandue chez les eucaryotes allant des plantes aux humains (Plasterk, 1999) Elles varient en longueur de 1,3 à 2,4 kb et codent pour une seule enzyme transposase (Ivics et al., 1997 Robertson, 1993) Il a été trouvé comme élément répétitif chez C.elegans (van Luenen et al., 1993) et lorsqu'une transposition a été détectée, il a été appelé Tc1 (pour le transposon Caenorhaditis numéro 1). Les autres membres de la famille des marins se trouvent principalement chez différentes espèces de mouches (Bigot et al., 1994 Capy et al., 1994) mais ont depuis été signalés chez l'homme. La protéine transposase de la famille est caractérisée par la présence du motif DDE ou DDD présent dans la plupart des transposases et intégrases, avec des répétitions inversées terminales et une intégration préférentielle pour la séquence TA (Vos et Plasterk, 1994). Malheureusement, la plupart des membres de la famille Tc1/Mariner sont inactifs, rendus par "l'inactivation verticale" (Lohe et al., 1995). De plus, des éléments endogènes de type Tc1 (TcE) de Drosophila hydei ont été utilisés avec succès pour la transgénèse germinale de la mouche Ceratitis capitata (Loukeris et al., 1995). La reconstruction moléculaire à partir des multiples éléments Tc1/mariner inactifs chez les poissons a entraîné la résurrection d'un transposon actif nommé Sleeping Beauty (SB). SB est le transposon le plus actif et le plus étudié chez les vertébrés pour deux raisons principales. Cela a permis de comprendre la régulation hôte-transposon et le précieux vecteur non viral à utiliser dans la transgénèse des vertébrés et la thérapie génique. Le système de transposon SB se compose de deux composants principaux, le transposon avec les répétitions inversées terminales (IR) des deux côtés, chacun contenant deux sites de liaison de la transposase (DR) et la transposase. Les IR ont une longueur de 230 pb avec deux répétitions directes imparfaites (DR) de 32 pb ne sont pas égales des deux côtés avec l'IR gauche contenant la région UTR qui peut fonctionner comme un amplificateur pour transcrire la transposase SB dans son arrangement natif. SB se compose de 340 acides aminés avec son domaine de liaison à l'ADN de type N-terminal reconnaissant les IR et le signal de localisation nucléaire (NLS) qui se chevauchent impliqués dans le transport nucléaire et le C-terminal avec la signature DDE caractéristique est responsable de l'activité catalytique impliquée dans le clivage de l'ADN, le transfert de brin et la réaction de jonction (Ivics et al., 1997).

Figure 1. La structure de la transposase de la Belle au bois dormant. Sleeping Beauty se compose d'un domaine de liaison à l'ADN apparié, du signal de localisation nucléaire (NLS) et du domaine catalytique terminal C.

Une transposition SB typique commence par la liaison de la transposase à ses IR suivie de la formation d'un complexe synaptique dans lequel les deux extrémités du transposon sont rapprochées de manière proximale. Il est ensuite excisé du locus donneur et réintégré dans un nouveau locus qui à son tour crée une mutation d'empreinte de 5 pb dans le site donneur (Ivics et al., 1997).

Figure 1. Représentation schématique de la transposition copier-coller. Le gène de la transposase (boîte bleue) est flanqué des répétitions inversées (flèches grises IR). La transposase (cercle vert), la seule protéine nécessaire à la réaction de transposition, se lie aux répétitions inversées, catalyse l'excision de l'élément transposable du locus donneur (lignes vertes) et médie l'intégration de l'élément dans un nouveau locus d'ADN ( lignes jaunes). Les cassures d'ADN au niveau du site d'intégration et du site donneur sont réparées par la machinerie de réparation de l'ADN hôte.

Les étapes détaillées sont élaborées par un schéma de principe. La SB Transposase peut reconnaître les IR soit en cis soit en trans, ce qui permet de séparer physiquement le gène de la transposase des IR. L'arrangement trans facilite le clonage de tout gène d'intérêt entre les IR (figure ) avec la transposase entraînée par un promoteur puissant qui servira ainsi de précieux pour l'ingénierie du génome. Mais l'efficacité de la réaction de transposition en tant que système à deux composants peut être limitée par un phénomène appelé inhibition de la surproduction qui est largement répandu dans la famille Tc1/mariner et la capacité de chargement de l'insert d'ADN cloné entre les IR (Grabundzija et al., 2010).

Figure 1. Le système de transposon de la Belle au bois dormant. (A) Arrangement naturel du transposon de la Belle au bois dormant. Le gène de la transposase (boîte bleue) est flanqué des répétitions inversées (flèches grises IR) qui contiennent les sites de liaison de la transposase (flèches blanches DR). (B) Arrangement de laboratoire du système de vecteur de transfert Sleeping Beautygene. La région codant pour la transposase est remplacée par un gène d'intérêt (encadré vert).La transposase est fournie sur un vecteur plasmidique séparé exprimé à partir d'un promoteur approprié (flèche bleue).

Une étude systématique du système de vecteur de transposon le plus efficace parmi la famille Tc1/mariner comme Tc1, Tc3, Himar1 et Mos1 avec un test de culture de cellules de mammifère in vitro a déterminé que SB est le système le plus efficace (Fischer et al., 2001). SB a une préférence de site cible pour la répétition AT palindromique, ATATAT, dans laquelle le TA central est le site cible canonique et lors de la transposition subit une duplication du dinucléotide TA dans le site cible réparé par la machinerie de réparation de l'hôte. C'est le système de transposon le plus actif de la famille Tc1/Mariner utilisé dans la manipulation du génome et diverses applications de thérapie génique chez les vertébrés (examiné dans Mátés et al., 2007). La reconstruction moléculaire par évolution in vitro a conduit à la génération de nouvelles formes hyperactives de SB dans lesquelles, SB100x est le transfert de gène stable le plus actif et soutenu à 35-50% dans les cellules primaires humaines et à 45% de transgenèse stable dans les zygotes de souris (Mátés et al. , 2009)

Facteurs de l'hôte et régulation de la Belle au bois dormant

Le transposon SB a une large gamme d'activité chez les vertébrés avec une efficacité et une efficacité différentes parmi les cellules de différents tissus de la même espèce. Une explication possible de cette différence d'efficacité peut être attribuée à l'interaction du mécanisme de transposition avec les facteurs de l'hôte. Néanmoins, si les protéines hôtes participent effectivement à la réaction de transposition, elles doivent être conservées chez les vertébrés. Une protéine de flexion de l'ADN hautement conservée appartenant au groupe de protéines à haute mobilité, HMGB1, a d'abord été identifiée comme un cofacteur de la transposition de SB nécessaire pour les complexes transposons-transposons au niveau des DR internes (Zayed, 2003). La transposition de SB conduit à des cassures double brin de l'ADN, qui sont réparées par la machinerie de réparation de l'hôte. Ku70, une protéine importante impliquée dans la voie de réparation des extrémités non homologues interagit physiquement avec la transposase SB, établissant un lien fonctionnel entre la réparation de l'ADN de l'hôte machinerie et transposase. (Izsvák et al., 2004).

La modification épigénétique de l'élément transposable SB par méthylation CpG au sein de la séquence du transposon augmente la fréquence de transposition du transposon SB (Yusa et al., 2004). SB, par son interaction avec une autre protéine codée de l'hôte Miz-1, un facteur de transcription, régule à la baisse l'expression de la cycline D1 dans les cellules humaines et induit un ralentissement de G1, qui peut être considéré comme un acte égoïste pour un événement de transposition maximal (Walisko et al., 2006).

HMG2L1 induit la transcription du transposon 5′-UTR

Les protéines HMGB (high-mobility-group-box) sont l'une des trois super familles de protéines chromosomiques HMG qui peuvent être classées en deux sous-groupes principaux : les protéines du groupe 1 ont plus d'un domaine HMGB avec une longue queue C-terminale acide sans spécificité de séquence particulière. Les protéines du groupe 2 ne contiennent qu'un seul domaine HMGB avec un certain degré de spécificité de séquence et peuvent agir comme un facteur de transcription (Bustin, 1999). Il est important de noter que HMG2L1 appartient au deuxième sous-groupe des protéines HMGB. Il a été montré que HMG2L1 régule négativement la signalisation Wnt en interagissant avec une nouvelle protéine liant NLK (Yamada et al., 2003). D'autres études ont montré son rôle dans l'atténuation de la différenciation des muscles lisses (Zhou et al., 2010). À la recherche d'autres protéines hôtes par la levure, deux écrans hybrides pouvant éventuellement interagir avec la transposase SB, ont abouti à une autre protéine à haute mobilité HMG2L1 (protéine de groupe à haute mobilité 2-like 1). Celle-ci interagit avec la transposase SB puis se lie à sa 5' région non traduite, entraînant ainsi son expression bien qu'en présence de transposase SB, la HMG2L1 soit régulée négativement par rétro-inhibition (Walisko et al., 2008).

Buts et objectifs

Les éléments transposables sont souvent considérés comme des parasites à ADN égoïstes qui sont rarement cooptés par le génome pour jouer un rôle bénéfique. Mais le niveau élevé de transposition pourrait affecter négativement la forme physique de l'hôte, suggérant un contrôle strict de la régulation des éléments transposables dans l'environnement cellulaire. Le transposon de la Belle au bois dormant (SB) est un membre de la superfamille Tc1/mariner des transposons d'ADN, mobilisé via un mécanisme de copier-coller. Dans cette étude, l'élément transposable Sleeping Beauty (SB) a été utilisé comme outil pour étudier les interactions transposon-cellule hôte chez les vertébrés.

La transposition de la Belle au bois dormant (SB) est fortement régulée par les facteurs cellulaires de l'hôte. L'expression de la transposase est conduite par son propre promoteur présent dans la région 5'UTR du transposon. Notamment, la transcription est significativement régulée à la hausse par une protéine cellulaire, HMG2L1. Comme HMG2L1 est une protéine mal caractérisée, l'étude du réseau d'interaction protéique qui régule l'activité de la protéine HMG2L1 était d'un grand intérêt, car cela module à son tour la transcription et l'expression de la transposase.

Le transposon de la Belle au bois dormant (SB) montre une transposition efficace dans les cellules de vertébrés et dans les cellules de différents tissus de la même espèce, mais avec des efficacités différentes. Une explication possible est l'expression et la régulation de facteurs hôtes qui pourraient réguler l'efficacité de la transposition. En utilisant le poisson zèbre comme organisme modèle, cette étude visait à déchiffrer l'expression développementale de HMG2L1 et son rôle dans la régulation dynamique de la transposase dans le développement précoce des cellules embryonnaires et germinales.

Les systèmes d'intégration basés sur la Belle au bois dormant (SB) ont été largement utilisés pour la manipulation génétique des vertébrés. L'objectif était d'exploiter la puissance des transgéniques à base de transposons couplés à l'échange de cassettes par recombinaison (RMCE) pour créer un rat transgénique modèle, dans lequel un transgène d'intérêt peut être reciblé dans les loci génomiques marqués par des transposons pour contourner les problèmes d'injection pronucléaire basée sur transgenèse.


Remerciements

Ce travail a été soutenu par des subventions du Cancer Council of Victoria, Australie (1066554) et du National Health and Medical Research Council (NHMRC) d'Australie (1003667). MHK et PKD ont été soutenus par des bourses de recherche senior du NHMRC. ATP a été soutenu par une bourse de développement de carrière du National Health and Medical Research Council (NHMRC) (1003856), une subvention du programme NHMRC (1054618) et a bénéficié du soutien du Victorian State Government Operational Infrastructure Support et du gouvernement australien NHMRC Independent Research Institute Infrastructure Support Scheme . Nous remercions le Dr Carol Ginns (Peter MacCallum Cancer Center, Melbourne, Victoria, Australie 3002) pour ses conseils et ses discussions sur l'impact des sites d'intégration chromosomique sur le développement et la fonction cellulaires chez les souris transgéniques.


Voir la vidéo: Science. La Génie Génétique - 3ème année (Janvier 2023).