Informations

Pourquoi y a-t-il 10 étapes de paires de bases, pas 16 ?

Pourquoi y a-t-il 10 étapes de paires de bases, pas 16 ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Dans un cours de biochimie que je suis, le conférencier a souligné qu'il y a 10 étapes de paires de bases possibles ; J'ai inclus une capture d'écran d'une diapositive indiquant cela. Cela m'embrouille, parce que je ne peux pas comprendre pourquoi ce n'est pas 16 ; pourquoi les 6 grisés dans l'image ne sont-ils pas autorisés (par exemple, CG empilé sur CG compte, mais GC empilé sur GC ne le fait pas) ? TA|AT est répertorié comme distinct de AT|TA, ce n'est donc pas que les grisés soient redondants. J'ai trouvé quelques articles mentionnant qu'il y a 10 étapes de base, mais pas pourquoi. (Je n'arrive pas à joindre le conférencier.)

Merci d'avance!


Contrairement à l'ARN, où le sens de la molécule est unique, l'ADN est double brin, les deux brins ayant le sens opposé. Dans le sens de la stabilité chimique, peu importe quel sens est considéré comme positif et lequel est négatif.

Ainsi, si nous considérons une étape de paire de bases WX|YZ, nous avons Y suivant W sur le brin de sens positif (W->Y), et X suivant Z dans le brin de sens négatif (antisens) (Z -> X). Cela signifie que, si nous étiquetions les brins différemment, nous aurions Z->X sur le brin positif et W->Y sur le négatif, c'est-à-dire que nous aurions l'étape de paire de bases ZY|XW. C'est-à-dire que la règle de symétrie générale est $$ WX|YZ ightarrow ZY|XW $$

En particulier, cela signifie que CG|CG est identique à GC|GC, alors que TA|AT est identique à lui-même, plutôt qu'à AT|TA.

Visuellement, ces symétries sont obtenues en faisant pivoter l'image de la paire de bases pas à pas de 180 degrés, comme on peut le voir facilement sur l'image fournie dans la question.


La structure de l'ADN dans le noyau du nucléosome

La structure cristalline à résolution 1,9 Å de la particule centrale du nucléosome contenant 147 paires de bases d'ADN révèle la conformation de l'ADN nucléosomique avec une précision sans précédent. La structure de l'ADN est remarquablement différente de celle des oligonucléotides et des complexes protéine-ADN non histones. La géométrie de l'étape des paires de bases d'ADN a, dans l'ensemble, deux fois la courbure nécessaire pour s'adapter au trajet superhélicoïdal de l'ADN dans le nucléosome. Les segments d'ADN pliés dans le petit sillon sont soit coudés, soit décalés en alternance. Les paramètres inhabituels de conformation de l'ADN induits par la liaison de la protéine histone ont des implications pour la reconnaissance des protéines dépendantes de la séquence et le positionnement et la mobilité des nucléosomes. La comparaison de la structure de 147 paires de bases avec deux structures de 146 paires de bases révèle des altérations de la torsion de l'ADN qui sont manifestement courantes dans la chromatine en vrac, et qui sont probablement d'importance pour la formation de fibres de chromatine et le remodelage de la chromatine.


Expérience "helix" de tubes en caoutchouc

Coupez deux longueurs de tube en caoutchouc de 1/8 po, chacune d'environ 20 po de long. Insérez un plus petit morceau de tube ou un morceau de pointe de pipette dans les extrémités pour permettre aux extrémités d'être connectées. Ces deux morceaux de tube en caoutchouc représentent chaque brin d'un duplex d'ADN. L'ADN peut être ligaturé ou joint lorsque nous avons des extrémités 5' (phosphate) et 3' (hydroxyle). Nous avons donc besoin d'un moyen de savoir quelle extrémité est quelle extrémité pour chaque morceau de tube.

  1. Vous pouvez soit écrire "5" et "3" sur les extrémités opposées de chaque pièce et les aligner dans des directions opposées, ou
  2. Sur un morceau de tube, marquez les deux extrémités avec un sharpie. Seules les extrémités de couleur similaire peuvent être ligaturées (voir schéma ci-dessus)

Cela vous permettra de maintenir une "orientation" correcte des brins lorsque vous "ligaturerez" les brins du duplex.

  • Introduisez un numéro de liaison = +2 (deux torsions droitières à 360 degrés dans le duplex)
  • puis "ligaturez" les extrémités (assurez-vous de maintenir l'orientation des brins, c'est-à-dire que vous connectez les deux brins appropriés).

Confirmez que le numéro de liaison correct a été introduit en "fondant" le duplex d'un côté et en forçant tous les tours dans une petite région du duplex (facile à compter de cette façon).

  • Confirmez qu'en regardant vers le bas de l'hélice les virages qu'ils sont "droitier" (peu importe de quel côté vous regardez vers le bas de l'hélice).

Notez que le "duplex" lorsqu'il est tenu entre le pouce et l'index et laissé pendre, préfère une topologie "super enroulée", par opposition à "relaxée" [Remarque : cela se voit généralement avec des tubes très fins, les tubes de plus grand diamètre peuvent ne pas adopter facilement cette topologie].

  • Confirmez que les "superbobines" sont réellement gaucher lorsque vous regardez vers le bas les supercoils (indépendamment de la direction vers le bas des supercoils).
  • Le "supercoil" est très probablement un 360° complet, plutôt que 180°. Dans tous les cas, maintenez les extrémités du duplex de manière à ce qu'un "supercoil" à 360 degrés pour gaucher soit présent.
  • Maintenant, comptez combien de fois les brins du "duplex" se croisent. Dans cette conformation, les brins du "duplex" seront ne pas se croisent réellement (Remarque : vous pouvez avoir un croisement de brins puis un décroisement plus tard, pour un résultat net sans croisement).

Ainsi, en réponse à l'introduction du nombre de liaison +2, le "duplex" peut adopter +2 (180°) "supercoils", de sorte que le résultat numéro de liaison apparent (c'est-à-dire "tourner" value) des deux brins est nul

Une superbobine est considérée comme positive, si elle est "gauche").

  • Supprimer une "positif" supercoil en se déroulant par 180°.
  • Tenez maintenant les extrémités du "duplex" et comptez le numéro de liaison apparent (c'est-à-dire "rebondissements"). Il y aura un seul droitier "tourner".
  • Ainsi, une seule superbobine "positive" à 180° a pour effet de supprimer une seule torsion "positive" (c'est-à-dire réduit le nombre de liaison apparent de 1).

Les Se tordre le nombre fait référence au nombre de superbobines présentes.

  • Bien qu'il puisse sembler que la conséquence de l'introduction surenroulement (Writhe) change le numéro de liaison, ce n'est pas.
  • La conséquence de Writhe est que le Tourner (apparentnuméro de liaison) est altéré (augmenté ou diminué).

L'ADN a une préférence "Twist" valeur (numéro de liaison apparent préféré) pour une longueur spécifiée d'ADN :

  • Le modèle de Watson et Crick du duplex d'ADN avait 10 paires de bases par tour.
  • Dans des conditions physiologiques de sel (0,15 M NaCl) et de température, L'ADN préfère adopter environ 10,6 pb/tour.
  • Writhe est introduit dans l'ADN pour atteindre cette valeur pour le "Twist" (numéro de liaison apparent)

Pour un nombre de liaisons (fixe) donné sur une longueur donnée d'ADN, l'ADN peut adopter des superbobines positives ou négatives pour obtenir un "twist" (nombre de liaison apparent) tel qu'il y aura 10,6 paires de bases/tour.

Le numéro de liaison ne change pas avec le supercoiling (ça ne peut changer qu'en cassant le duplex)

  • Writhe a pour effet de changer le nombre apparent de Linkage.
  • Une superbobine est définie comme étant capable de modifier le numéro de liaison apparent de +/- 1.

La valeur de torsion (numéro de liaison apparent) pour une longueur donnée d'ADN est liée au nombre de paires de bases par tour que l'ADN veut adopter :

Numéro de liaison = (taille de l'ADN en paires de bases)/(paires de bases/tour) + Writhe

Numéro de liaison = nombre de torsions + Writhe

ceci est généralement abrégé en

Liaison = Twist + Writhe

Par exemple, si nous avons une molécule d'ADN circulairement fermée avec une longueur de 5300 paires de bases et une conformation préférée de 10,6 paires de bases par tour, peut-elle atteindre cette conformation sans avoir à introduire de super-enroulement (c'est-à-dire de se contorsionner) ?

Numéro de liaison apparent (Twist) = (5300 paires de bases) / (10,6 paires de bases/tour)

Numéro de liaison apparent (Twist) = 500

En d'autres termes, pour obtenir la conformation souhaitée de 10,6 pb/tour dans l'hélice, exactement 500 tours sont nécessaires sur la longueur de 5 300 paires de bases.

Numéro de liaison = 500 + Writhe

Nous pouvons avoir des valeurs entières pour le numéro de liaison, et nous pouvons certainement introduire 500, ce qui ne nécessiterait aucun Writhe :

Quelle est la molécule d'ADN était 5200 paires de bases?

Numéro de liaison apparent (Twist) = (5200 paires de bases) / (10,6 paires de bases/tour)

Numéro de couplage apparent (Twist) = 490,6

Nous pouvons introduire 490 ou 491 comme numéro de couplage, mais pas 490.6. Que se passe-t-il s'il y a un nombre de liaison de 490 dans la molécule d'ADN ?

Numéro de liaison = Twist + Writhe

Dans ce cas, l'ADN adopte une superbobine négative de 0,6 (environ 108 degrés d'une superbobine droite) qui augmentera le nombre apparent de liaison de 490 à 490,6 (et atteindra 10,6 paires de bases par tour dans le duplex).

Combien de paires de bases par tour y aurait-il dans l'ADN si l'ADN n'était pas capable d'adopter une structure de superbobine pour cette longueur d'ADN avec un nombre de liaison de 490 ?

Numéro de liaison = Twist + Writhe

Twist = (5200 paires de bases) / (pb/tour) = 490 tours

pb/tour = 5200 paires de bases/490 tours

Il y a un peu plus de 10,6 paires de bases par tour dans l'ADN


Contenu

La PCR amplifie une région spécifique d'un brin d'ADN (la cible d'ADN). La plupart des méthodes de PCR amplifient des fragments d'ADN d'une longueur comprise entre 0,1 et 10 kilo paires de bases (kpb), bien que certaines techniques permettent l'amplification de fragments jusqu'à 40 kpb. [5] La quantité de produit amplifié est déterminée par les substrats disponibles dans la réaction, qui deviennent limitatifs au fur et à mesure que la réaction progresse. [6]

Une configuration PCR de base nécessite plusieurs composants et réactifs, [7] dont :

  • une modèle d'ADN qui contient la région cible d'ADN à amplifier
  • une ADN polymérase une enzyme qui polymérise de nouveaux brins d'ADN résistant à la chaleur Taq la polymérase est particulièrement courante, [8] car elle est plus susceptible de rester intacte pendant le processus de dénaturation de l'ADN à haute température
  • deux ADN amorces qui sont complémentaires aux extrémités 3' (trois premiers) de chacun des brins sens et anti-sens de l'ADN cible (l'ADN polymérase ne peut se lier et s'allonger qu'à partir d'une région double brin d'ADN sans amorces, il n'y a pas de double -site d'initiation brin auquel la polymérase peut se lier) [9] des amorces spécifiques qui sont complémentaires à la région cible de l'ADN sont sélectionnées à l'avance, et sont souvent fabriquées sur mesure dans un laboratoire ou achetées auprès de fournisseurs biochimiques commerciaux
  • désoxynucléosides triphosphates, ou dNTP (parfois appelés nucléotides « désoxynucléotides triphosphates » contenant des groupes triphosphate), les éléments constitutifs à partir desquels l'ADN polymérase synthétise un nouveau brin d'ADN
  • une solution tampon fournir un environnement chimique approprié pour une activité et une stabilité optimales de l'ADN polymérase
  • bivalents, généralement les ions magnésium (Mg) ou manganèse (Mn) Mg 2+ est le plus courant, mais Mn 2+ peut être utilisé pour la mutagenèse de l'ADN par PCR, car une concentration plus élevée de Mn 2+ augmente le taux d'erreur lors de la synthèse de l'ADN [10 ] et cations monovalents, typiquement des ions potassium (K) [meilleure source nécessaire]

La réaction est généralement effectuée dans un volume de 10 à 200 L dans de petits tubes de réaction (volumes de 0,2 à 0,5 ml) dans un thermocycleur. Le thermocycleur chauffe et refroidit les tubes de réaction pour atteindre les températures requises à chaque étape de la réaction (voir ci-dessous). De nombreux thermocycleurs modernes utilisent l'effet Peltier, qui permet à la fois de chauffer et de refroidir le bloc contenant les tubes PCR en inversant simplement le courant électrique. Les tubes de réaction à paroi mince permettent une conductivité thermique favorable pour permettre un équilibre thermique rapide. La plupart des thermocycleurs ont des couvercles chauffants pour empêcher la condensation au sommet du tube de réaction. Les thermocycleurs plus anciens dépourvus de couvercle chauffant nécessitent une couche d'huile sur le mélange réactionnel ou une boule de cire à l'intérieur du tube.

Procédure Modifier

En règle générale, la PCR consiste en une série de 20 à 40 changements de température répétés, appelés cycles thermiques, chaque cycle étant généralement composé de deux ou trois étapes de température discrètes (voir la figure ci-dessous). Le cyclage est souvent précédé d'une seule étape de température à une température très élevée (>90 °C (194 °F)), et suivi d'une attente à la fin pour l'extension du produit final ou un bref stockage. Les températures utilisées et la durée pendant laquelle elles sont appliquées dans chaque cycle dépendent de divers paramètres, notamment l'enzyme utilisée pour la synthèse de l'ADN, la concentration d'ions bivalents et de dNTP dans la réaction et la température de fusion (Tm) des amorces. [11] Les étapes individuelles communes à la plupart des méthodes PCR sont les suivantes :

  • Initialisation: Cette étape n'est requise que pour les ADN polymérases qui nécessitent une activation thermique par PCR hot-start. [12] Il consiste à chauffer la chambre de réaction à une température de 94-96 °C (201-205 °F), ou 98 °C (208 °F) si des polymérases extrêmement thermostables sont utilisées, qui est ensuite maintenue pendant 1- 10 minutes.
  • Dénaturation: Cette étape est le premier cycle régulier et consiste à chauffer la chambre de réaction à 94-98 °C (201-208 °F) pendant 20-30 secondes. Cela provoque la fusion de l'ADN, ou la dénaturation, de la matrice d'ADN double brin en brisant les liaisons hydrogène entre les bases complémentaires, produisant deux molécules d'ADN simple brin.
  • recuit: Dans l'étape suivante, la température de réaction est abaissée à 50–65 °C (122–149 °F) pendant 20–40 secondes, permettant l'hybridation des amorces à chacune des matrices d'ADN simple brin. Deux amorces différentes sont typiquement incluses dans le mélange réactionnel : une pour chacun des deux compléments simple brin contenant la région cible. Les amorces sont elles-mêmes des séquences simple brin, mais sont beaucoup plus courtes que la longueur de la région cible, ne complétant que des séquences très courtes à l'extrémité 3' de chaque brin.
  • Allongement/allongement: La température à cette étape dépend de l'ADN polymérase utilisée la température d'activité optimale pour l'ADN polymérase thermostable de Taq la polymérase est d'environ 75 à 80 °C (167 à 176 °F), [13][14] bien qu'une température de 72 °C (162 °F) soit couramment utilisée avec cette enzyme. Dans cette étape, l'ADN polymérase synthétise un nouveau brin d'ADN complémentaire au brin matrice d'ADN en ajoutant des dNTP libres du mélange réactionnel qui est complémentaire à la matrice dans la direction 5'-à-3', en condensant le groupe 5'-phosphate des dNTP avec le groupe 3'-hydroxy à l'extrémité du brin d'ADN naissant (allongeant). Le temps précis requis pour l'élongation dépend à la fois de l'ADN polymérase utilisée et de la longueur de la région cible d'ADN à amplifier. En règle générale, à leur température optimale, la plupart des ADN polymérases polymérisent un millier de bases par minute. Dans des conditions optimales (c'est-à-dire s'il n'y a pas de limitations dues à des substrats ou des réactifs limitants), à chaque étape d'extension/élongation, le nombre de séquences cibles d'ADN est doublé. À chaque cycle successif, les brins de matrice d'origine ainsi que tous les brins nouvellement générés deviennent des brins de matrice pour le prochain cycle d'allongement, conduisant à une amplification exponentielle (géométrique) de la région cible d'ADN spécifique.
  • Allongement final: Cette étape unique est facultative, mais est effectuée à une température de 70 à 74 °C (158 à 165 °F) (la plage de température requise pour une activité optimale de la plupart des polymérases utilisées en PCR) pendant 5 à 15 minutes après la dernière PCR cycle pour s'assurer que tout ADN simple brin restant est complètement allongé.
  • Prise finale: L'étape finale refroidit la chambre de réaction à 4-15 °C (39-59 °F) pendant une durée indéterminée et peut être utilisée pour le stockage à court terme des produits de PCR.

Pour vérifier si la PCR a généré avec succès la région cible d'ADN prévue (également parfois appelée amplimère ou amplicon), l'électrophorèse sur gel d'agarose peut être utilisée pour la séparation par taille des produits de PCR. La taille des produits PCR est déterminée par comparaison avec une échelle d'ADN, un marqueur de poids moléculaire qui contient des fragments d'ADN de tailles connues, qui défile sur le gel à côté des produits PCR.

Étapes Modifier

Comme avec d'autres réactions chimiques, la vitesse de réaction et l'efficacité de la PCR sont affectées par des facteurs limitants. Ainsi, l'ensemble du processus de PCR peut être divisé en trois étapes en fonction de la progression de la réaction :

  • Amplification exponentielle: A chaque cycle, la quantité de produit est doublée (en supposant une efficacité de réaction de 100%). Après 30 cycles, une seule copie d'ADN peut être augmentée jusqu'à 1 000 000 000 (un milliard) de copies. Dans un sens, donc, la réplication d'un brin discret d'ADN est manipulée dans un tube dans des conditions contrôlées. [15] La réaction est très sensible : seules des quantités infimes d'ADN doivent être présentes.
  • Mise à niveau de la scène: La réaction ralentit à mesure que l'ADN polymérase perd de son activité et que la consommation de réactifs, tels que les dNTP et les amorces, les rend plus limitées.
  • Plateau: Plus aucun produit ne s'accumule en raison de l'épuisement des réactifs et de l'enzyme.

En pratique, la PCR peut échouer pour diverses raisons, en partie en raison de sa sensibilité à la contamination provoquant l'amplification de produits d'ADN parasites. Pour cette raison, un certain nombre de techniques et de procédures ont été développées pour optimiser les conditions de PCR. [16] [17] La ​​contamination par de l'ADN étranger est traitée avec des protocoles et des procédures de laboratoire qui séparent les mélanges pré-PCR des contaminants potentiels de l'ADN. [7] Cela implique généralement la séparation spatiale des zones de configuration PCR des zones d'analyse ou de purification des produits PCR, l'utilisation de matériel en plastique jetable et le nettoyage approfondi de la surface de travail entre les configurations de réaction. Les techniques de conception d'amorces sont importantes pour améliorer le rendement du produit PCR et éviter la formation de produits parasites, et l'utilisation de composants tampons alternatifs ou d'enzymes polymérases peut aider à l'amplification de régions longues ou autrement problématiques de l'ADN. L'ajout de réactifs, tels que le formamide, dans les systèmes tampons peut augmenter la spécificité et le rendement de la PCR. [18] Des simulations informatiques des résultats théoriques de la PCR (PCR électronique) peuvent être effectuées pour aider à la conception des amorces. [19]

Isolement sélectif de l'ADN Modifier

La PCR permet l'isolement de fragments d'ADN à partir d'ADN génomique par amplification sélective d'une région spécifique d'ADN. Cette utilisation de la PCR augmente de nombreuses façons, telles que la génération de sondes d'hybridation pour l'hybridation Southern ou Northern et le clonage d'ADN, qui nécessitent de plus grandes quantités d'ADN, représentant une région d'ADN spécifique. La PCR fournit à ces techniques de grandes quantités d'ADN pur, permettant l'analyse d'échantillons d'ADN même à partir de très petites quantités de matière première.

D'autres applications de la PCR comprennent le séquençage d'ADN pour déterminer des séquences inconnues amplifiées par PCR dans lesquelles l'une des amorces d'amplification peut être utilisée dans le séquençage de Sanger, l'isolement d'une séquence d'ADN pour accélérer les technologies de l'ADN recombinant impliquant l'insertion d'une séquence d'ADN dans un plasmide, un phage , ou cosmide (selon la taille) ou le matériel génétique d'un autre organisme. Colonies bactériennes (comme E. coli) peuvent être rapidement criblés par PCR pour des constructions de vecteurs d'ADN correctes. [20] La PCR peut également être utilisée pour les empreintes génétiques, une technique médico-légale utilisée pour identifier une personne ou un organisme en comparant des ADN expérimentaux à l'aide de différentes méthodes basées sur la PCR.

Certaines méthodes d'empreintes digitales PCR ont un pouvoir discriminant élevé et peuvent être utilisées pour identifier les relations génétiques entre les individus, telles que parent-enfant ou entre frères et sœurs, et sont utilisées dans les tests de paternité (Fig. 4). Cette technique peut également être utilisée pour déterminer les relations évolutives entre les organismes lorsque certaines horloges moléculaires sont utilisées (c'est-à-dire les gènes ARNr 16S et recA des micro-organismes). [21]

Amplification et quantification de l'ADN Modifier

Étant donné que la PCR amplifie les régions d'ADN qu'elle cible, la PCR peut être utilisée pour analyser de très petites quantités d'échantillon. Ceci est souvent critique pour l'analyse médico-légale, lorsque seule une trace d'ADN est disponible comme preuve. La PCR peut également être utilisée dans l'analyse d'ADN ancien qui a des dizaines de milliers d'années. Ces techniques basées sur la PCR ont été utilisées avec succès sur des animaux, comme un mammouth de quarante mille ans, mais aussi sur l'ADN humain, dans des applications allant de l'analyse de momies égyptiennes à l'identification d'un tsar russe et du corps de Le roi anglais Richard III. [22]

Les méthodes de PCR quantitative ou PCR en temps réel (qPCR, [23] à ne pas confondre avec la RT-PCR) permettent d'estimer la quantité d'une séquence donnée présente dans un échantillon, une technique souvent appliquée pour déterminer quantitativement les niveaux d'expression génique. La PCR quantitative est un outil établi pour la quantification de l'ADN qui mesure l'accumulation de produit d'ADN après chaque cycle d'amplification PCR.

La qPCR permet la quantification et la détection d'une séquence d'ADN spécifique en temps réel puisqu'elle mesure la concentration pendant le processus de synthèse. Il existe deux méthodes de détection et de quantification simultanées. La première méthode consiste à utiliser des colorants fluorescents qui sont retenus de manière non spécifique entre les doubles brins. La seconde méthode implique des sondes qui codent pour des séquences spécifiques et sont marquées par fluorescence. La détection de l'ADN à l'aide de ces méthodes ne peut être observée qu'après l'hybridation des sondes avec son ADN complémentaire. Une combinaison de techniques intéressante est la PCR en temps réel et la transcription inverse. Cette technique sophistiquée, appelée RT-qPCR, permet de quantifier une petite quantité d'ARN. Grâce à cette technique combinée, l'ARNm est converti en ADNc, qui est ensuite quantifié par qPCR. Cette technique réduit la possibilité d'erreur au point final de la PCR, [24] augmentant les chances de détection de gènes associés à des maladies génétiques telles que le cancer. [4] Les laboratoires utilisent la RT-qPCR dans le but de mesurer avec sensibilité la régulation des gènes. Les fondements mathématiques de la quantification fiable de la PCR [25] et de la RT-qPCR [26] facilitent la mise en œuvre de procédures d'ajustement précises des données expérimentales dans les applications de recherche, médicales, diagnostiques et de maladies infectieuses. [27] [28] [29] [30]

Applications médicales et diagnostiques Modifier

Les futurs parents peuvent être testés pour être des porteurs génétiques, ou leurs enfants peuvent être testés pour être réellement affectés par une maladie. [1] Les échantillons d'ADN pour les tests prénatals peuvent être obtenus par amniocentèse, prélèvement de villosités choriales, ou même par l'analyse de cellules fœtales rares circulant dans le sang de la mère. L'analyse par PCR est également essentielle au diagnostic génétique préimplantatoire, où les cellules individuelles d'un embryon en développement sont testées pour les mutations.

  • La PCR peut également être utilisée dans le cadre d'un test sensible pour typage des tissus, vitale pour la transplantation d'organes. Depuis 2008, [mise à jour], il existe même une proposition visant à remplacer les tests traditionnels basés sur les anticorps pour le groupe sanguin par des tests basés sur la PCR. [31]
  • De nombreuses formes de cancer impliquent des altérations de oncogènes. En utilisant des tests basés sur la PCR pour étudier ces mutations, les schémas thérapeutiques peuvent parfois être personnalisés individuellement pour un patient. La PCR permet un diagnostic précoce des maladies malignes telles que la leucémie et les lymphomes, qui est actuellement la plus développée dans la recherche sur le cancer et est déjà utilisée en routine. Les tests PCR peuvent être effectués directement sur des échantillons d'ADN génomique pour détecter les cellules malignes spécifiques de la translocation à une sensibilité au moins 10 000 fois supérieure à celle des autres méthodes. [32] La PCR est très utile dans le domaine médical car elle permet l'isolement et l'amplification de suppresseurs de tumeurs. La PCR quantitative, par exemple, peut être utilisée pour quantifier et analyser des cellules individuelles, ainsi que pour reconnaître les confirmations et combinaisons d'ADN, d'ARNm et de protéines. [24]

Applications en maladies infectieuses Modifier

La PCR permet un diagnostic rapide et hautement spécifique des maladies infectieuses, y compris celles causées par des bactéries ou des virus. [33] La PCR permet également l'identification de micro-organismes non cultivables ou à croissance lente tels que les mycobactéries, les bactéries anaérobies ou les virus à partir d'essais de culture tissulaire et de modèles animaux. La base des applications de diagnostic PCR en microbiologie est la détection d'agents infectieux et la discrimination des souches non pathogènes des souches pathogènes en vertu de gènes spécifiques. [33] [34]

La caractérisation et la détection des organismes pathogènes ont été révolutionnées par la PCR des manières suivantes :

  • Les virus de l'immunodéficience humaine (ou VIH), est une cible difficile à trouver et à éradiquer. Les premiers tests d'infection reposaient sur la présence d'anticorps dirigés contre le virus circulant dans le sang. Cependant, les anticorps n'apparaissent que plusieurs semaines après l'infection, les anticorps maternels masquent l'infection d'un nouveau-né et les agents thérapeutiques pour combattre l'infection n'affectent pas les anticorps. Des tests PCR ont été développés qui peuvent détecter aussi peu qu'un génome viral parmi l'ADN de plus de 50 000 cellules hôtes. [35] Les infections peuvent être détectées plus tôt, le sang donné peut être testé directement pour le virus, les nouveau-nés peuvent être immédiatement testés pour l'infection et les effets des traitements antiviraux peuvent être quantifiés.
  • Certains organismes pathogènes, comme celui de tuberculose, sont difficiles à prélever sur les patients et lentes à se développer en laboratoire. Les tests basés sur la PCR ont permis de détecter un petit nombre d'organismes pathogènes (vivants ou morts), dans des échantillons pratiques. Une analyse génétique détaillée peut également être utilisée pour détecter la résistance aux antibiotiques, permettant une thérapie immédiate et efficace. Les effets de la thérapie peuvent également être évalués immédiatement.
  • La propagation d'un organisme pathogène à travers des populations d'animaux domestiques ou sauvages peuvent être surveillés par des tests PCR. Dans de nombreux cas, l'apparition de nouveaux sous-types virulents peut être détectée et surveillée. Les sous-types d'un organisme qui étaient responsables d'épidémies antérieures peuvent également être déterminés par analyse PCR.
  • L'ADN viral peut être détecté par PCR. Les amorces utilisées doivent être spécifiques des séquences ciblées dans l'ADN d'un virus, et la PCR peut être utilisée pour des analyses diagnostiques ou le séquençage de l'ADN du génome viral. La haute sensibilité de la PCR permet la détection du virus peu de temps après l'infection et même avant le début de la maladie. [33] Une telle détection précoce peut donner aux médecins un délai de traitement important. La quantité de virus (« charge virale ») chez un patient peut également être quantifiée par des techniques de quantification d'ADN basées sur la PCR (voir ci-dessous). Une variante de la PCR (RT-PCR) est utilisée pour détecter l'ARN viral plutôt que l'ADN : dans ce test, l'enzyme transcriptase inverse est utilisée pour générer une séquence d'ADN qui correspond à l'ARN viral, cet ADN est ensuite amplifié selon la méthode PCR habituelle. La RT-PCR est largement utilisée pour détecter le génome viral du SRAS-CoV-2. [36]
  • Les maladies telles que la coqueluche (ou coqueluche) sont causées par la bactérie Bordetella pertussis. Cette bactérie est marquée par une grave infection respiratoire aiguë qui affecte divers animaux et humains et a entraîné la mort de nombreux jeunes enfants. La toxine coquelucheuse est une exotoxine protéique qui se lie aux récepteurs cellulaires par deux dimères et réagit avec différents types cellulaires tels que les lymphocytes T qui jouent un rôle dans l'immunité cellulaire. [37] La ​​PCR est un outil de test important qui peut détecter des séquences dans le gène de la toxine coquelucheuse. Parce que la PCR a une sensibilité élevée pour la toxine et un délai d'exécution rapide, elle est très efficace pour diagnostiquer la coqueluche par rapport à la culture. [38]

Applications médico-légales Modifier

Le développement de protocoles d'empreintes génétiques (ou ADN) basés sur la PCR a été largement appliqué en médecine légale :

  • Sous sa forme la plus discriminante, empreintes génétiques peut discriminer de manière unique n'importe quelle personne de l'ensemble de la population du monde. Des échantillons infimes d'ADN peuvent être isolés d'une scène de crime et comparés à ceux de suspects, ou à partir d'une base de données ADN de preuves antérieures ou de condamnés. Des versions plus simples de ces tests sont souvent utilisées pour écarter rapidement des suspects lors d'une enquête criminelle. Les preuves de crimes vieux de plusieurs décennies peuvent être testées, confirmant ou disculpant les personnes initialement condamnées.
  • Le typage ADN médico-légal a été un moyen efficace d'identifier ou d'exonérer des suspects criminels grâce à l'analyse des preuves découvertes sur une scène de crime. Le génome humain a de nombreuses régions répétitives qui peuvent être trouvées dans des séquences de gènes ou dans des régions non codantes du génome. Plus précisément, jusqu'à 40 % de l'ADN humain est répétitif. [4] Il existe deux catégories distinctes pour ces régions répétitives et non codantes du génome. La première catégorie est appelée répétitions en tandem à nombre variable (VNTR), qui sont longues de 10 à 100 paires de bases et la deuxième catégorie est appelée répétitions en tandem courtes (STR) et elles consistent en des sections répétées de 2 à 10 paires de bases. La PCR est utilisée pour amplifier plusieurs VNTR et STR bien connus à l'aide d'amorces qui flanquent chacune des régions répétitives. Les tailles des fragments obtenus à partir de n'importe quel individu pour chacun des STR indiqueront quels allèles sont présents. En analysant plusieurs STR pour un individu, un ensemble d'allèles pour chaque personne sera trouvé qui statistiquement est susceptible d'être unique. [4] Les chercheurs ont identifié la séquence complète du génome humain. Cette séquence est facilement accessible via le site Web du NCBI et est utilisée dans de nombreuses applications réelles. Par exemple, le FBI a compilé un ensemble de sites de marqueurs ADN utilisés pour l'identification, et ceux-ci sont appelés la base de données ADN du Combined DNA Index System (CODIS). [4] L'utilisation de cette base de données permet d'utiliser une analyse statistique pour déterminer la probabilité qu'un échantillon d'ADN corresponde. La PCR est un outil analytique très puissant et important à utiliser pour le typage médico-légal de l'ADN, car les chercheurs n'ont besoin que d'une très petite quantité de l'ADN cible à utiliser pour l'analyse. Par exemple, un seul cheveu humain avec un follicule pileux attaché a suffisamment d'ADN pour effectuer l'analyse. De même, quelques spermatozoïdes, des échantillons de peau sous les ongles ou une petite quantité de sang peuvent fournir suffisamment d'ADN pour une analyse concluante. [4]
  • Des formes moins discriminantes d'empreintes génétiques peuvent aider à test ADN de paternité, où un individu est jumelé à ses proches. L'ADN de restes humains non identifiés peut être testé et comparé à celui d'éventuels parents, frères et sœurs ou enfants. Des tests similaires peuvent être utilisés pour confirmer les parents biologiques d'un enfant adopté (ou kidnappé). Le père biologique réel d'un nouveau-né peut également être confirmé (ou exclu).
  • La conception PCR AMGX/AMGY s'est avérée non seulement [éclaircissements nécessaires] facilitent l'amplification de séquences d'ADN à partir d'une très petite quantité de génome. Cependant, il peut également être utilisé pour la détermination du sexe en temps réel à partir d'échantillons osseux médico-légaux. Cela fournit un moyen puissant et efficace de déterminer le sexe dans les affaires médico-légales et les spécimens anciens. [39]

Applications de recherche Modifier

La PCR a été appliquée à de nombreux domaines de recherche en génétique moléculaire :

  • La PCR permet la production rapide de courts morceaux d'ADN, même lorsque pas plus que la séquence des deux amorces est connue. Cette capacité de la PCR augmente de nombreuses méthodes, telles que la génération sondes d'hybridation pour l'hybridation Southern ou Northern blot. La PCR fournit à ces techniques de grandes quantités d'ADN pur, parfois sous forme d'un seul brin, permettant une analyse même à partir de très petites quantités de matériel de départ.
  • La tâche de séquençage ADN peut également être assisté par PCR. Des segments connus d'ADN peuvent facilement être produits à partir d'un patient présentant une mutation d'une maladie génétique. Les modifications apportées à la technique d'amplification peuvent extraire des segments d'un génome totalement inconnu, ou peuvent générer un seul brin d'une zone d'intérêt.
  • La PCR a de nombreuses applications au processus plus traditionnel de Clonage d'ADN. Il peut extraire des segments à insérer dans un vecteur à partir d'un plus grand génome, qui peut n'être disponible qu'en petites quantités. À l'aide d'un seul jeu d'« amorces vectorielles », il peut également analyser ou extraire des fragments qui ont déjà été insérés dans des vecteurs. Certaines modifications du protocole PCR peuvent générer des mutations (général ou dirigé vers le site) d'un fragment inséré.
  • Sites marqués par séquence est un processus où la PCR est utilisée comme indicateur qu'un segment particulier d'un génome est présent dans un clone particulier. Le projet du génome humain a trouvé cette application vitale pour cartographier les clones de cosmides qu'ils séquençaient et pour coordonner les résultats de différents laboratoires.
  • Une application de la PCR est l'analyse phylogénique de l'ADN de sources anciennes, comme celui trouvé dans les os récupérés des Néandertaliens, à partir de tissus congelés de mammouths ou du cerveau de momies égyptiennes. [15] Dans certains cas, l'ADN hautement dégradé de ces sources pourrait être réassemblé pendant les premières étapes de l'amplification.
  • Une application courante de la PCR est l'étude des modèles de l'expression du gène. Les tissus (ou même les cellules individuelles) peuvent être analysés à différentes étapes pour voir quels gènes sont devenus actifs ou lesquels ont été désactivés. Cette application peut également utiliser la PCR quantitative pour quantifier les niveaux réels d'expression
  • La capacité de la PCR à amplifier simultanément plusieurs loci à partir de spermatozoïdes individuels [40] a grandement amélioré la tâche plus traditionnelle de cartographie génétique en étudiant les croisements chromosomiques après la méiose. De rares événements de croisement entre des loci très proches ont été directement observés en analysant des milliers de spermatozoïdes individuels. De même, des délétions, insertions, translocations ou inversions inhabituelles peuvent être analysées, le tout sans avoir à attendre (ou payer) les longs et laborieux processus de fécondation, d'embryogenèse, etc. : la PCR peut être utilisée pour créer des gènes mutants avec des mutations choisies par scientifiques à volonté. Ces mutations peuvent être choisies afin de comprendre comment les protéines remplissent leurs fonctions et de modifier ou d'améliorer la fonction des protéines.

La PCR présente de nombreux avantages. Il est assez simple à comprendre et à utiliser, et produit des résultats rapidement. La technique est très sensible avec le potentiel de produire des millions à des milliards de copies d'un produit spécifique pour le séquençage, le clonage et l'analyse. La qRT-PCR partage les mêmes avantages que la PCR, avec un avantage supplémentaire de quantification du produit synthétisé. Par conséquent, il a ses utilisations pour analyser les altérations des niveaux d'expression des gènes dans les tumeurs, les microbes ou d'autres états pathologiques. [24]

La PCR est un outil de recherche très puissant et pratique. Le séquençage d'étiologies inconnues de nombreuses maladies est en train d'être déterminé par la PCR. La technique peut aider à identifier la séquence de virus auparavant inconnus liés à ceux déjà connus et ainsi nous donner une meilleure compréhension de la maladie elle-même. Si la procédure peut être encore simplifiée et que des systèmes de détection non radiométriques sensibles peuvent être développés, la PCR occupera une place prépondérante dans le laboratoire clinique pour les années à venir. [15]

Une limitation majeure de la PCR est que des informations préalables sur la séquence cible sont nécessaires afin de générer les amorces qui permettront son amplification sélective. [24] Cela signifie que, généralement, les utilisateurs de PCR doivent connaître la ou les séquences précises en amont de la région cible sur chacune des deux matrices simple brin afin de s'assurer que l'ADN polymérase se lie correctement aux hybrides amorce-matrice et génère ensuite toute la région cible au cours de la synthèse d'ADN.

Comme toutes les enzymes, les ADN polymérases sont également sujettes aux erreurs, ce qui provoque à son tour des mutations dans les fragments PCR générés. [41]

Une autre limitation de la PCR est que même la plus petite quantité d'ADN contaminant peut être amplifiée, ce qui entraîne des résultats trompeurs ou ambigus. Pour minimiser le risque de contamination, les enquêteurs doivent réserver des salles séparées pour la préparation des réactifs, la PCR et l'analyse du produit. Les réactifs doivent être distribués dans des aliquotes à usage unique. Des pipettes avec des pistons jetables et des pointes de pipette extra-longues doivent être utilisées régulièrement. [15]

Les échantillons environnementaux qui contiennent des acides humiques peuvent inhiber l'amplification PCR et conduire à des résultats inexacts.

  • PCR allèle-spécifique: une technique de diagnostic ou de clonage basée sur les variations mononucléotidiques (SNV à ne pas confondre avec les SNP) (différences mono-base chez un patient). Il nécessite une connaissance préalable d'une séquence d'ADN, y compris les différences entre les allèles, et utilise des amorces dont les extrémités 3' englobent le SNV (tampon de paires de bases autour du SNV généralement incorporé). L'amplification par PCR dans des conditions strictes est beaucoup moins efficace en présence d'un mésappariement entre la matrice et l'amorce, donc une amplification réussie avec une amorce spécifique au SNP signale la présence du SNP spécifique dans une séquence. [42] Voir Génotypage SNP pour plus d'informations.
  • PCR d'assemblage ou Assemblage de cycle de polymérase (PCA): synthèse artificielle de longues séquences d'ADN en réalisant une PCR sur un pool d'oligonucléotides longs avec de courts segments chevauchants. Les oligonucléotides alternent entre les directions sens et antisens, et les segments qui se chevauchent déterminent l'ordre des fragments PCR, produisant ainsi sélectivement le long produit d'ADN final. [43]
  • PCR asymétrique: amplifie préférentiellement un brin d'ADN dans une matrice d'ADN double brin. Il est utilisé dans le séquençage et le sondage d'hybridation où l'amplification d'un seul des deux brins complémentaires est requise. La PCR est réalisée comme d'habitude, mais avec un grand excès d'amorce pour le brin ciblé pour l'amplification. En raison de l'amplification lente (arithmétique) plus tard dans la réaction après épuisement de l'amorce limitante, des cycles supplémentaires de PCR sont nécessaires. [44] Une modification récente de ce processus, connue sous le nom Ldans l'oreille-UNEaprès-Til-Exponential-PCR (LATE-PCR), utilise une amorce limitante avec une température de fusion plus élevée (Tm) que l'excès d'amorce pour maintenir l'efficacité de la réaction car la concentration d'amorce limite diminue à mi-réaction. [45]
  • PCR convective: une manière pseudo-isothermique de réaliser la PCR. Au lieu de chauffer et de refroidir à plusieurs reprises le mélange PCR, la solution est soumise à un gradient thermique. Le flux convectif résultant de l'instabilité thermique mélange automatiquement les réactifs PCR des régions chaudes et froides, ce qui permet la PCR à plusieurs reprises. [46] Des paramètres tels que les conditions aux limites thermiques et la géométrie de l'enceinte PCR peuvent être optimisés pour produire une PCR robuste et rapide en exploitant l'émergence de champs d'écoulement chaotiques.[47] Une telle configuration de PCR à flux convectif réduit considérablement les besoins en énergie de l'appareil et le temps de fonctionnement.
  • PCR à distance: une méthode hautement parallèle pour récupérer des molécules d'ADN précises pour la synthèse de gènes. Une bibliothèque complexe de molécules d'ADN est modifiée avec des balises flanquantes uniques avant un séquençage massivement parallèle. Les amorces dirigées par marqueur permettent ensuite la récupération de molécules avec les séquences souhaitées par PCR. [48]
  • PCR numérique (dPCR): utilisé pour mesurer la quantité d'une séquence d'ADN cible dans un échantillon d'ADN. L'échantillon d'ADN est fortement dilué de sorte qu'après avoir exécuté de nombreuses PCR en parallèle, certaines d'entre elles ne reçoivent pas une seule molécule de l'ADN cible. La concentration d'ADN cible est calculée en utilisant la proportion de résultats négatifs. D'où le nom de « PCR numérique ».
  • Amplification hélicase-dépendante: similaire à la PCR traditionnelle, mais utilise une température constante plutôt que des cycles de dénaturation et d'annelage/extension. L'ADN hélicase, une enzyme qui déroule l'ADN, est utilisée à la place de la dénaturation thermique. [49]
  • PCR de démarrage à chaud: une technique qui réduit l'amplification non spécifique pendant les étapes initiales de configuration de la PCR. Elle peut être effectuée manuellement en chauffant les composants réactionnels à la température de dénaturation (par exemple, 95°C) avant d'ajouter la polymérase. [50] Des systèmes enzymatiques spécialisés ont été développés qui inhibent l'activité de la polymérase à température ambiante, soit par la liaison d'un anticorps [12][51], soit par la présence d'inhibiteurs liés de manière covalente qui ne se dissocient qu'après une étape d'activation à haute température. La PCR avec démarrage à chaud/finition à froid est réalisée avec de nouvelles polymérases hybrides inactives à température ambiante et instantanément activées à température d'élongation.
  • PCR in silico (PCR numérique, PCR virtuelle, PCR électronique, e-PCR) fait référence aux outils de calcul utilisés pour calculer les résultats théoriques de la réaction en chaîne de la polymérase à l'aide d'un ensemble donné d'amorces (sondes) pour amplifier les séquences d'ADN d'un génome ou d'un transcriptome séquencé. La PCR in silico a été proposée comme outil pédagogique pour la biologie moléculaire. [52]
  • PCR spécifique à l'interséquence (ISSR) : une méthode PCR pour l'empreinte ADN qui amplifie les régions entre les répétitions de séquences simples pour produire une empreinte unique de longueurs de fragments amplifiés. [53]
  • PCR inverse: est couramment utilisé pour identifier les séquences flanquantes autour des inserts génomiques. Il implique une série de digestions d'ADN et d'auto-ligature, résultant en des séquences connues à chaque extrémité de la séquence inconnue. [54]
  • PCR par ligature: utilise de petits linkers d'ADN ligaturés à l'ADN d'intérêt et plusieurs amorces s'hybridant aux linkers d'ADN, il a été utilisé pour le séquençage de l'ADN, la marche du génome et l'empreinte ADN. [55]
  • PCR spécifique à la méthylation (MSP) : développé par Stephen Baylin et James G. Herman à la Johns Hopkins School of Medicine, [56] et est utilisé pour détecter la méthylation des îlots CpG dans l'ADN génomique. L'ADN est d'abord traité avec du bisulfite de sodium, qui convertit les bases cytosines non méthylées en uracile, qui est reconnu par les amorces PCR comme étant la thymine. Deux PCR sont ensuite effectuées sur l'ADN modifié, en utilisant des ensembles d'amorces identiques sauf au niveau des îlots CpG au sein des séquences d'amorces. À ces points, un ensemble d'amorces reconnaît l'ADN avec des cytosines pour amplifier l'ADN méthylé, et un ensemble reconnaît l'ADN avec l'uracile ou la thymine pour amplifier l'ADN non méthylé. La MSP utilisant qPCR peut également être effectuée pour obtenir des informations quantitatives plutôt que qualitatives sur la méthylation.
  • PCR mini-amorce: utilise une polymérase thermostable (S-Tbr) qui peut s'étendre à partir d'amorces courtes ("smalligos") aussi courtes que 9 ou 10 nucléotides. Cette méthode permet un ciblage par PCR vers des régions de liaison d'amorces plus petites et est utilisée pour amplifier des séquences d'ADN conservées, telles que le gène d'ARNr 16S (ou eucaryote 18S). [57]
  • Amplification de sonde dépendante de la ligature multiplex (MLPA) : permet d'amplifier plusieurs cibles avec une seule paire d'amorces, évitant ainsi les limitations de résolution de la PCR multiplex (voir ci-dessous).
  • Multiplex-PCR: se compose de plusieurs ensembles d'amorces dans un seul mélange PCR pour produire des amplicons de différentes tailles qui sont spécifiques à différentes séquences d'ADN. En ciblant plusieurs gènes à la fois, des informations supplémentaires peuvent être obtenues à partir d'un seul test qui, autrement, nécessiterait plusieurs fois plus de réactifs et plus de temps à effectuer. Les températures de recuit pour chacun des ensembles d'amorces doivent être optimisées pour fonctionner correctement dans une seule réaction et les tailles d'amplicon. C'est-à-dire que leur longueur de paire de bases doit être suffisamment différente pour former des bandes distinctes lorsqu'elles sont visualisées par électrophorèse sur gel.
  • PCR assistée par nanoparticules (nanoPCR): certaines nanoparticules (NP) peuvent améliorer l'efficacité de la PCR (ainsi appelées nanoPCR), et certaines peuvent même surpasser les amplificateurs de PCR d'origine. Il a été rapporté que les points quantiques (QD) peuvent améliorer la spécificité et l'efficacité de la PCR. Les nanotubes de carbone à paroi unique (SWCNT) et les nanotubes de carbone à parois multiples (MWCNT) sont efficaces pour améliorer l'amplification de la PCR longue. La nanopoudre de carbone (CNP) peut améliorer l'efficacité de la PCR répétée et de la PCR longue, tandis que l'oxyde de zinc, le dioxyde de titane et les Ag NP augmentent le rendement de la PCR. Des données antérieures indiquaient que les NP non métalliques conservaient une fidélité d'amplification acceptable. Étant donné que de nombreuses NP sont capables d'améliorer l'efficacité de la PCR, il est clair qu'il existe probablement un grand potentiel d'amélioration de la technologie nanoPCR et de développement de produits. [58][59]
  • PCR imbriquée: augmente la spécificité de l'amplification de l'ADN, en réduisant le bruit de fond dû à l'amplification non spécifique de l'ADN. Deux jeux d'amorces sont utilisés dans deux PCR successives. Dans la première réaction, une paire d'amorces est utilisée pour générer des produits d'ADN qui, outre la cible visée, peuvent encore consister en des fragments d'ADN non spécifiquement amplifiés. Le ou les produits sont ensuite utilisés dans une seconde PCR avec un jeu d'amorces dont les sites de liaison sont totalement ou partiellement différents et situés en 3' de chacune des amorces utilisées dans la première réaction. La PCR nichée est souvent plus efficace pour amplifier spécifiquement de longs fragments d'ADN que la PCR conventionnelle, mais elle nécessite une connaissance plus détaillée des séquences cibles.
  • PCR chevauchement-extension ou Épissage par extension de chevauchement (SOEing) : une technique de génie génétique qui est utilisée pour épisser ensemble deux ou plusieurs fragments d'ADN qui contiennent des séquences complémentaires. Il est utilisé pour joindre des morceaux d'ADN contenant des gènes, des séquences régulatrices ou des mutations, la technique permet la création de constructions d'ADN spécifiques et longues. Il peut également introduire des délétions, des insertions ou des mutations ponctuelles dans une séquence d'ADN. [60][61]
  • PAN-AC: utilise des conditions isothermes pour l'amplification, et peut être utilisé dans des cellules vivantes. [62][63]
  • PCR quantitative (qPCR) : utilisé pour mesurer la quantité d'une séquence cible (généralement en temps réel). Il mesure quantitativement les quantités de départ d'ADN, d'ADNc ou d'ARN. La PCR quantitative est couramment utilisée pour déterminer si une séquence d'ADN est présente dans un échantillon et le nombre de ses copies dans l'échantillon. PCR quantitative a un très haut degré de précision. Les méthodes de PCR quantitatives utilisent des colorants fluorescents, tels que Sybr Green, EvaGreen ou des sondes d'ADN contenant des fluorophores, telles que TaqMan, pour mesurer la quantité de produit amplifié en temps réel. Il est aussi parfois abrégé en RT-PCR (temps réel PCR) mais cette abréviation ne doit être utilisée que pour la PCR avec transcription inverse. qPCR est les contractions appropriées pour la PCR quantitative (PCR en temps réel).
  • PCR du complément inversé (RC-PCR) : permet d'ajouter indépendamment des domaines fonctionnels ou des séquences de choix à chaque extrémité de l'amplicon généré dans une seule réaction en tube fermé. Cette méthode génère des amorces spécifiques à la cible dans la réaction par l'interaction d'amorces universelles (qui contiennent les séquences ou domaines souhaités à ajouter) et de sondes RC.
  • PCR par transcription inverse (RT-PCR): pour amplifier l'ADN à partir d'ARN. La transcriptase inverse transcrit l'ARN en ADNc, qui est ensuite amplifié par PCR. La RT-PCR est largement utilisée dans le profilage d'expression, pour déterminer l'expression d'un gène ou pour identifier la séquence d'un transcrit d'ARN, y compris les sites de début et de terminaison de la transcription. Si la séquence d'ADN génomique d'un gène est connue, la RT-PCR peut être utilisée pour cartographier l'emplacement des exons et des introns dans le gène. L'extrémité 5' d'un gène (correspondant au site de démarrage de la transcription) est généralement identifiée par RACE-PCR (Amplification rapide des extrémités d'ADNc).
  • PCR dépendante de la RNase H (rhPCR) : une modification de la PCR qui utilise des amorces avec un bloc d'extension 3' qui peut être éliminé par une enzyme RNase HII thermostable. Ce système réduit les dimères d'amorces et permet d'effectuer des réactions multiplexées avec un plus grand nombre d'amorces. [64]
  • Amorce-PCR spécifique unique (SSP-PCR) : permet l'amplification d'ADN double brin même lorsque l'information de séquence n'est disponible qu'à une extrémité. Cette méthode permet l'amplification de gènes pour lesquels seule une information de séquence partielle est disponible, et permet la marche unidirectionnelle du génome depuis des régions connues vers des régions inconnues du chromosome. [65]
  • PCR en phase solide: englobe plusieurs significations, y compris l'amplification Polony (où les colonies PCR sont dérivées dans une matrice de gel, par exemple), Bridge PCR [66] (les amorces sont liées de manière covalente à une surface de support solide), la PCR en phase solide conventionnelle (où la PCR asymétrique est appliqué en présence d'un apprêt portant un support solide avec une séquence correspondant à l'un des apprêts aqueux) et une PCR en phase solide améliorée [67] (où la PCR en phase solide conventionnelle peut être améliorée en utilisant une Tm élevée et un apprêt de support solide niché avec l'application facultative d'un « étape » pour favoriser l'amorçage du support solide).
  • PCR suicide: généralement utilisé dans la paléogénétique ou d'autres études où éviter les faux positifs et assurer la spécificité du fragment amplifié est la priorité la plus élevée. Il a été initialement décrit dans une étude visant à vérifier la présence du microbe Yersinia pestis dans des échantillons dentaires obtenus à partir de tombes du 14ème siècle de personnes prétendument tuées par la peste lors de l'épidémie médiévale de peste noire. [68] La méthode prescrit l'utilisation de toute combinaison d'amorces une seule fois dans une PCR (d'où le terme « suicide »), qui n'aurait jamais dû être utilisée dans une réaction PCR de contrôle positif, et les amorces devraient toujours cibler une région génomique jamais amplifiée avant dans le laboratoire en utilisant cet ensemble d'amorces ou tout autre. Cela garantit qu'aucun ADN contaminant provenant de réactions PCR précédentes n'est présent dans le laboratoire, ce qui pourrait sinon générer des faux positifs.
  • PCR thermique asymétrique entrelacée (TAIL-PCR): pour l'isolement d'une séquence inconnue flanquant une séquence connue. Dans la séquence connue, la TAIL-PCR utilise une paire d'amorces imbriquées avec des températures d'hybridation différentes, une amorce dégénérée est utilisée pour amplifier dans l'autre sens à partir de la séquence inconnue. [69]
  • PCR à l'atterrissage (PCR abaissée) : une variante de la PCR qui vise à réduire le bruit de fond non spécifique en abaissant progressivement la température de recuit au fur et à mesure que le cycle de PCR progresse. La température de recuit aux cycles initiaux est généralement de quelques degrés (3 à 5 °C) au-dessus de la Tm des amorces utilisées, alors qu'aux cycles ultérieurs, elle est inférieure de quelques degrés (3 à 5 °C) à l'amorce Tm. Les températures plus élevées donnent une plus grande spécificité pour la liaison des amorces, et les températures plus basses permettent une amplification plus efficace à partir des produits spécifiques formés pendant les cycles initiaux. [70]
  • Marche rapide universelle: pour la marche du génome et les empreintes génétiques en utilisant une PCR « bilatérale » plus spécifique que les approches « unilatérales » conventionnelles (en utilisant une seule amorce spécifique au gène et une seule amorce générale, ce qui peut entraîner un « bruit » artéfactuel) [71] en vertu d'un mécanisme impliquant la formation d'une structure de lariat. Les dérivés simplifiés de l'UFW sont LaNe RAGE (PCR nichée dépendante du lariat pour une amplification rapide des extrémités de l'ADN génomique), [72] 5'RACE LaNe [73] et 3'RACE LaNe. [74]

Les enzymes résistantes à la chaleur qui sont un élément clé de la réaction en chaîne par polymérase ont été découvertes dans les années 1960 en tant que produit d'une forme de vie microbienne qui vivait dans les eaux surchauffées de Mushroom Spring de Yellowstone. [75]

Un article de 1971 dans le Journal de biologie moléculaire par Kjell Kleppe et ses collègues du laboratoire de H. Gobind Khorana ont d'abord décrit une méthode d'utilisation d'un test enzymatique pour répliquer une courte matrice d'ADN avec des amorces in vitro. [76] Cependant, cette manifestation précoce du principe de base de la PCR n'a pas reçu beaucoup d'attention à l'époque et l'invention de la réaction en chaîne par polymérase en 1983 est généralement attribuée à Kary Mullis. [77]

Lorsque Mullis a développé la PCR en 1983, il travaillait à Emeryville, en Californie, pour Cetus Corporation, l'une des premières sociétés de biotechnologie, où il était responsable de la synthèse de chaînes courtes d'ADN. Mullis a écrit qu'il a conçu l'idée de PCR lors d'une croisière le long de la Pacific Coast Highway une nuit dans sa voiture. [78] Il jouait dans son esprit avec une nouvelle façon d'analyser les changements (mutations) de l'ADN lorsqu'il s'est rendu compte qu'il avait plutôt inventé une méthode d'amplification de n'importe quelle région de l'ADN à travers des cycles répétés de duplication entraînés par l'ADN polymérase. Dans Scientifique américain, Mullis a résumé la procédure : « En commençant par une seule molécule du matériel génétique ADN, la PCR peut générer 100 milliards de molécules similaires en un après-midi. La réaction est facile à exécuter. Elle ne nécessite pas plus qu'un tube à essai, quelques réactifs simples. , et une source de chaleur." [79] Les empreintes génétiques ont été utilisées pour la première fois pour les tests de paternité en 1988. [80]

Mullis et le professeur Michael Smith, qui avaient développé d'autres moyens essentiels de manipuler l'ADN, [81] ont reçu conjointement le prix Nobel de chimie en 1993, sept ans après que Mullis et ses collègues de Cetus ont mis en pratique sa proposition pour la première fois. [82] L'article de Mullis en 1985 avec RK Saiki et HA Erlich, "Enzymatic Amplification of -globin Genomic Sequences and Restriction Site Analysis for Diagnosis of Sickle Cell Anemia" - l'invention de la réaction en chaîne par polymérase (PCR) - a été récompensé par une citation pour la chimie Breakthrough Award de la Division d'histoire de la chimie de l'American Chemical Society en 2017. [83] [1]

Au cœur de la méthode PCR se trouve l'utilisation d'une ADN polymérase appropriée capable de résister aux températures élevées de >90 °C (194 °F) requises pour la séparation des deux brins d'ADN dans la double hélice d'ADN après chaque cycle de réplication. Les ADN polymérases initialement employées pour des expériences in vitro présageant la PCR étaient incapables de résister à ces températures élevées. [1] Ainsi, les premières procédures de réplication de l'ADN étaient très inefficaces et prenaient beaucoup de temps, et nécessitaient de grandes quantités d'ADN polymérase et une manipulation continue tout au long du processus.

La découverte en 1976 de Taq polymérase - une ADN polymérase purifiée à partir de la bactérie thermophile, Thermus aquatique, qui vit naturellement dans des environnements chauds (50 à 80 °C (122 à 176 °F)) [13] tels que les sources chaudes, a ouvert la voie à des améliorations spectaculaires de la méthode PCR. L'ADN polymérase isolée de T. aquaticus est stable à des températures élevées et reste actif même après la dénaturation de l'ADN, [14] évitant ainsi la nécessité d'ajouter une nouvelle ADN polymérase après chaque cycle. [2] Cela a permis un processus automatisé basé sur un thermocycleur pour l'amplification de l'ADN.

Litiges en matière de brevets Modifier

La technique PCR a été brevetée par Kary Mullis et attribuée à Cetus Corporation, où Mullis a travaillé lorsqu'il a inventé la technique en 1983. La Taq l'enzyme polymérase était également couverte par des brevets. Il y a eu plusieurs procès très médiatisés liés à la technique, y compris un procès infructueux intenté par DuPont. La société pharmaceutique suisse Hoffmann-La Roche a acheté les droits sur les brevets en 1992 et actuellement [ lorsque? ] détient ceux qui sont encore protégés.

Une bataille de brevets connexe sur le Taq l'enzyme polymérase est toujours en cours dans plusieurs juridictions à travers le monde entre Roche et Promega. Les arguments juridiques se sont étendus au-delà de la durée de vie du PCR original et Taq brevets sur la polymérase, qui ont expiré le 28 mars 2005. [84]


ADN et ARN (avec diagramme)

Watson et Crick (1953) ont proposé un modèle pour la structure de la molécule d'ADN qui est maintenant généralement accepté par tous. Selon ce modèle appelé Watson Crick Model, la molécule d'ADN est une structure à double hélice composée de deux longues chaînes de polynucléotides enroulées l'une autour de l'autre autour d'un axe imaginaire et opposées l'une à l'autre. (Fig. 9.14).

Chaque chaîne polynucléotidique est constituée de milliers d'unités nucléotidiques.

Le squelette des deux hélices de la chaîne polynucléotidique est constitué de phosphates de désoxyribose tandis que les bases sont présentes sur les faces internes.

Les bases d'une chaîne polynucléotidique sont complémentaires des bases de l'autre chaîne polynucléotidique et sont reliées entre elles par des liaisons hydrogène (Fig. 9.16).

L'appariement des bases est très spécifique (Fig 9.15), Les bases complémentaires sont :-

Le rapport des bases puriques et pyrimidiques est de 1: 1.

La distance entre deux paires de bases suivantes dans la chaîne polynucléotidique est de 3,4 Â.

Chaque tour des deux chaînes polynucléotidiques est terminé après 10 paires de bases, c'est-à-dire une distance de 34 Â.

La distance entre l'axe et la région du phosphate de sucre est d'environ 10 . L'enroulement hélicoïdal est droitier.

(1. Les molécules d'ADN sont gigantesques. Leurs poids moléculaires sont de l'ordre de plusieurs millions. 2. Dans certains bactériophages, c'est-à-dire les virus qui attaquent les bactéries, l'ADN est simple brin.)

Il existe différentes formes d'ADN dans les organismes vivants, à savoir A, B, C et rarement D et E. Dans toutes ces formes, l'enroulement hélicoïdal de la molécule d'ADN est droitier. Ces formes diffèrent par le nombre de paires de bases (pb) par tour, le diamètre de l'hélice et d'autres détails mineurs similaires. La forme d'ADN la plus courante et la plus courante dans les organismes vivants est la forme B, appelée ADN-B. L'exposé précédent de la structure de l'ADN se rapporte en fait à l'ADN-B.

Récemment, une autre forme d'ADN a été artificiellement synthétisée dans laquelle l'enroulement hélicoïdal de l'ADN est gauche et le squelette phosphate des polynucléotides suit un parcours en zigzag. Cette forme d'ADN a donc été désignée sous le nom d'ADN-Z. Certaines des autres caractéristiques importantes de Z-DNA one : 1. Chaque tour des deux chaînes polynucléotidiques est terminé après 12 paires de bases, c'est-à-dire une distance d'environ 45 Å. 2. La distance entre deux paires de bases suivantes est de 3,7 . 3.

La distance entre l'axe et le sucre-phosphate est de 9 . 4. D'autres unités de sucre désoxyribose dans la chaîne polynucléotidique ont une orientation inverse (une telle unité ayant de l'oxygène éthéré orienté vers le haut et l'autre unité suivante orientée vers le bas).

Acide nucléique ribose (ARN) :

L'ARN est une structure simple brin constituée d'une seule chaîne polynucléotidique. Si parfois les bases complémentaires sont très proches les unes des autres, des liaisons hydrogène s'établissent entre elles pour donner à la chaîne polynucléotidique un aspect hélicoïdal comme l'ADN.

L'ARN est constitué des bases suivantes :

Le rapport des bases puriques et pyrimidiques n'est pas de 1:1.

Le sucre pentose est le -D-ribose.

La taille de la molécule d'ARN est très petite par rapport à la molécule d'ADN. Poids moléculaire d'ARN peut aller de plusieurs milliers à quelques lakhs.

Il existe 3 formes différentes d'ARN dans les cellules végétales :

Poids moléculaire d'ARNm est plus élevé parmi les différents types d'ARN, variant généralement de 5 à 10 lakhs. Ceux-ci constituent 5 à 10% de l'ARN total de la cellule.

L'ARNm est synthétisé dans le nucléole et, après avoir extrait l'information génétique de l'ADN, pénètre dans le cytoplasme et aide à la formation d'une protéine spécifique. Les ARNm sont de courte durée.

La séquence de 3 bases de nucléotides dans la molécule d'ARNm constitue un codon. En fait, l'information génétique obtenue à partir de l'ADN est codée dans des codons qui lui sont spécifiques (pour les dé­tails voir code génétique).

(ii) ARN ribosomique (ARNr):

L'ARNr se trouve dans le ribosome qui sert de matrice pour la synthèse des protéines. Il est du type le plus stable et constitue environ 80% de l'ARN total dans la cellule.

(iii) ARN de transfert ou soluble (ARNt ou s-ARN):

Les structures de nombreuses molécules d'ARN-t sont connues de manière assez détaillée. Celles-ci sont comparativement très petites avec un poids moléculaire d'environ 25 000. La structure de base de toutes les molécules d'ARN-t se trouve sur le motif des feuilles de trèfle. Le modèle de feuille de trèfle de l'ARN-t est présenté sur la figure 9.17.

Les ARNt se trouvent dans le cytoplasme et ne sont constitués que d'environ 80 bases. Ceux-ci constituent 10 à 15 % de l'ARN total dans la cellule.

Les ARNt contiennent de nombreuses bases et nucléotides inhabituels. Ce sont, par exemple, la pseudouridine (Ψ), la dihydrouridine (DHU), l'inosine (I), etc. La méthylation des bases est également courante.

Toutes les molécules d'ARNt contiennent de la guanine (G) à l'extrémité 5 & 8242. L'extrémité 3 & 8242 se termine toujours dans la séquence de bases Cytosine-Cytosine-Adénine (CCA). Au cours de la synthèse des protéines, cette extrémité récupère en fait l'acide aminé et le transfère à la chaîne polypeptidique en croissance. Par conséquent, ces ARN sont appelés ARN-t ou ARN de transfert.

Ces ARN-t sont également appelés ARN-s ou ARN solubles car ils sont solubles dans le NaCl IM.

Les molécules d'ARN-t sont repliées dans un motif de feuille de trèfle avec au moins trois ré­gions doubles hélicoïdaux (comme l'ADN) se terminant par des boucles.

Les trois boucles importantes de l'ARN-t sont :

(ii) Boucle de liaison à l'amino acyl synthétase

(iii) Boucle de liaison ribosomique.

La boucle anticodon est constituée de 7 bases. A l'extrémité libre, 3 bases non appariées constituent l'anticodon qui est complémentaire du codon dans l'ARNm. La boucle de liaison de l'aminoacyl synthétase se compose de 8 à 12 bases. En raison de la présence de dihydrouridines dans cette boucle, elle est également connue sous le nom de boucle DHU.

La boucle de liaison ribosomique est constituée de 7 bases. In contient la séquence de GTΨC et est donc également appelé boucle GTΨC.

Il existe différentes molécules d'ARN-t avec des anticodons spécifiques pour capter des acides aminés spécifiques. Cependant, de nombreux ARNt peuvent être spécifiques à un acide aminé particulier ou une seule espèce d'ARNt peut reconnaître plusieurs acides aminés.

La molécule d'ARNt dont la structure a été donnée pour la première fois par Holley en détail est l'alanyl-t-ARN de levure (Fig. 9.18).


67 Structure et séquençage de l'ADN

À la fin de cette section, vous serez en mesure d'effectuer les opérations suivantes :

  • Décrire la structure de l'ADN
  • Expliquer la méthode Sanger de séquençage de l'ADN
  • Discuter des similitudes et des différences entre l'ADN eucaryote et procaryote

Les éléments constitutifs de l'ADN sont les nucléotides. Les composants importants du nucléotide sont une base azotée (portant de l'azote), un sucre à 5 carbones (pentose) et un groupe phosphate ((Figure)). Le nucléotide est nommé en fonction de la base azotée. La base azotée peut être une purine telle que l'adénine (A) et la guanine (G), ou une pyrimidine telle que la cytosine (C) et la thymine (T).


Les images ci-dessus illustrent les cinq bases de l'ADN et de l'ARN. Examinez les images et expliquez pourquoi elles sont appelées « bases azotées ». En quoi les purines sont-elles différentes des pyrimidines ? En quoi une purine ou une pyrimidine est-elle différente d'une autre, par exemple l'adénine de la guanine ? En quoi un nucléoside est-il différent d'un nucléotide ?

Les purines ont une structure à double cycle avec un cycle à six chaînons fusionné à un cycle à cinq chaînons. Les pyrimidines sont de plus petite taille, elles ont une seule structure cyclique à six chaînons.

Le sucre est le désoxyribose dans l'ADN et le ribose dans l'ARN. Les atomes de carbone du sucre à cinq carbones sont numérotés 1′, 2′, 3′, 4′ et 5′ (1′ est lu comme « un premier »). Le phosphate, qui rend l'ADN et l'ARN acides, est relié au carbone 5'8242 du sucre par la formation d'une liaison ester entre l'acide phosphorique et le groupe 5'8242-OH (un ester est un acide + un alcool). Dans les nucléotides d'ADN, le carbone 3 & 8242 du sucre désoxyribose est attaché à un groupe hydroxyle (OH). Dans les nucléotides d'ARN, le carbone 2 & 8242 du sucre ribose contient également un groupe hydroxyle. La base est attachée au 1’carbone du sucre.

Les nucléotides se combinent entre eux pour produire des liaisons phosphodiester. Le résidu phosphate attaché au carbone 5′ du sucre d'un nucléotide forme une seconde liaison ester avec le groupe hydroxyle du carbone 3′ du sucre du nucléotide suivant, formant ainsi un phosphodiester 5′-3′ lier. Dans un polynucléotide, une extrémité de la chaîne a un phosphate 5'8242 libre et l'autre extrémité a un 3'8242-OH libre. Celles-ci sont appelées les extrémités 5′ et 3′ de la chaîne.

Dans les années 1950, Francis Crick et James Watson ont travaillé ensemble pour déterminer la structure de l'ADN à l'Université de Cambridge, en Angleterre. D'autres scientifiques comme Linus Pauling et Maurice Wilkins exploraient également activement ce domaine. Pauling avait précédemment découvert la structure secondaire des protéines en utilisant la cristallographie aux rayons X. Dans le laboratoire de Wilkins, la chercheuse Rosalind Franklin utilisait des méthodes de diffraction des rayons X pour comprendre la structure de l'ADN. Watson et Crick ont ​​pu reconstituer le puzzle de la molécule d'ADN sur la base des données de Franklin, car Crick avait également étudié la diffraction des rayons X ((Figure)). En 1962, James Watson, Francis Crick et Maurice Wilkins ont reçu le prix Nobel de médecine. Malheureusement, à ce moment-là, Franklin était décédé et les prix Nobel ne sont pas décernés à titre posthume.


Watson et Crick ont ​​proposé que l'ADN soit composé de deux brins qui sont enroulés l'un autour de l'autre pour former une hélice droite. L'appariement des bases a lieu entre une purine et une pyrimidine sur des brins opposés, de sorte que A s'apparie avec T et G s'apparie avec C (suggéré par les règles de Chargaff). Ainsi, l'adénine et la thymine sont des paires de bases complémentaires, et la cytosine et la guanine sont également des paires de bases complémentaires. Les paires de bases sont stabilisées par des liaisons hydrogène : l'adénine et la thymine forment deux liaisons hydrogène et la cytosine et la guanine forment trois liaisons hydrogène. Les deux brins sont de nature anti-parallèle, c'est-à-dire que l'extrémité 3 & 8242 d'un brin fait face à l'extrémité 5 & 8242 de l'autre brin. Le sucre et le phosphate des nucléotides forment l'épine dorsale de la structure, tandis que les bases azotées sont empilées à l'intérieur, comme les barreaux d'une échelle. Chaque paire de bases est séparée de la paire de bases suivante par une distance de 0,34 nm, et chaque tour de l'hélice mesure 3,4 nm. Par conséquent, 10 paires de bases sont présentes par tour d'hélice. Le diamètre de la double hélice d'ADN est de 2 nm et il est uniforme partout. Seul l'appariement entre une purine et une pyrimidine et l'orientation antiparallèle des deux brins d'ADN peuvent expliquer le diamètre uniforme. La torsion des deux brins l'un autour de l'autre entraîne la formation de rainures principales et secondaires uniformément espacées ((Figure)).


Techniques de séquençage de l'ADN

Jusqu'aux années 1990, le séquençage de l'ADN (lecture de la séquence de l'ADN) était un processus relativement long et coûteux. L'utilisation de nucléotides radiomarqués a également aggravé le problème en raison de problèmes de sécurité. Avec la technologie et les machines automatisées actuellement disponibles, le processus est moins cher, plus sûr et peut être terminé en quelques heures. Fred Sanger a développé la méthode de séquençage utilisée pour le projet de séquençage du génome humain, qui est largement utilisée aujourd'hui ((Figure)).

Visitez ce site pour regarder une vidéo expliquant la technique de lecture de séquences d'ADN qui a résulté des travaux de Sanger.

Le séquençage
La méthode est connue sous le nom de méthode de terminaison de chaîne didésoxy. La méthode est basée sur l'utilisation de terminateurs de chaîne, les didésoxynucléotides (ddNTP). Les ddNTPS diffèrent des désoxynucléotides par l'absence d'un groupe OH libre 3 & 8242 sur le sucre à cinq carbones. Si un ddNTP est ajouté à un brin d'ADN en croissance, la chaîne ne peut pas être prolongée davantage car le groupe 3 & 8242 OH libre nécessaire pour ajouter un autre nucléotide n'est pas disponible. En utilisant un rapport prédéterminé de désoxyribonucléotides aux didésoxynucléotides, il est possible de générer des fragments d'ADN de différentes tailles.


L'échantillon d'ADN à séquencer est dénaturé (séparé en deux brins en le chauffant à haute température). L'ADN est divisé en quatre tubes dans lesquels une amorce, l'ADN polymérase et les quatre nucléosides triphosphates (A, T, G et C) sont ajoutés. De plus, des quantités limitées de l'un des quatre didésoxynucléosides triphosphates (ddCTP, ddATP, ddGTP et ddTTP) sont respectivement ajoutées dans chaque tube. Les tubes sont étiquetés A, T, G et C selon le ddNTP ajouté. À des fins de détection, chacun des quatre didésoxynucléotides porte un marqueur fluorescent différent. L'allongement de la chaîne se poursuit jusqu'à ce qu'un didésoxynucléotide fluorescent soit incorporé, après quoi aucun autre allongement n'a lieu. Une fois la réaction terminée, une électrophorèse est effectuée. Même une différence de longueur d'une seule base peut être détectée. La séquence est lue à partir d'un scanner laser qui détecte le marqueur fluorescent de chaque fragment. Pour ses travaux sur le séquençage de l'ADN, Sanger a reçu un prix Nobel de chimie en 1980.

Le séquençage du génome de Sanger a conduit à une course pour séquencer les génomes humains à une vitesse rapide et à faible coût, souvent appelée séquence de 1 000 $ en un jour. En savoir plus en sélectionnant le Animation de séquençage à grande vitesse ici.

L'électrophorèse sur gel est une technique utilisée pour séparer des fragments d'ADN de différentes tailles. Habituellement, le gel est composé d'un produit chimique appelé agarose (un polymère polysaccharidique extrait d'algues riches en résidus de galactose). La poudre d'agarose est ajoutée à un tampon et chauffée. Après refroidissement, la solution de gel est versée dans un bac de coulée. Une fois le gel solidifié, l'ADN est chargé sur le gel et un courant électrique est appliqué. L'ADN a une charge nette négative et se déplace de l'électrode négative vers l'électrode positive. Le courant électrique est appliqué pendant un temps suffisant pour permettre à l'ADN de se séparer en fonction de la taille, les fragments les plus petits seront les plus éloignés du puits (où l'ADN a été chargé) et les fragments de poids moléculaire les plus lourds seront les plus proches du puits. Une fois l'ADN séparé, le gel est coloré avec un colorant spécifique à l'ADN pour le visualiser ((Figure)).


Le premier projet de séquence du génome de Néandertal a été récemment publié par Richard E. Green et al. en 2010. 1 Les Néandertaliens sont les ancêtres les plus proches des humains d'aujourd'hui. Ils étaient connus pour avoir vécu en Europe et en Asie occidentale (et maintenant, peut-être, en Afrique du Nord) avant de disparaître des archives fossiles il y a environ 30 000 ans. L'équipe de Green a étudié des restes fossiles vieux de près de 40 000 ans qui ont été sélectionnés sur des sites du monde entier. Des moyens extrêmement sophistiqués de préparation des échantillons et de séquençage de l'ADN ont été employés en raison de la nature fragile des os et de la forte contamination microbienne. Dans leur étude, les scientifiques ont pu séquencer quelque quatre milliards de paires de bases. La séquence de Néandertal a été comparée à celle des humains actuels du monde entier. Après avoir comparé les séquences, les chercheurs ont découvert que le génome de Néandertal avait une similitude 2 à 3 pour cent plus grande avec les personnes vivant en dehors de l'Afrique qu'avec les personnes en Afrique. Alors que les théories actuelles suggèrent que tous les humains actuels peuvent être attribués à une petite population ancestrale en Afrique, les données du génome de Néandertal suggèrent un certain croisement entre les Néandertaliens et les premiers humains modernes.

Green et ses collègues ont également découvert des segments d'ADN chez les peuples d'Europe et d'Asie qui sont plus similaires aux séquences néandertaliennes qu'à d'autres séquences humaines contemporaines. Une autre observation intéressante était que les Néandertaliens sont aussi étroitement liés aux peuples de Papouasie-Nouvelle-Guinée qu'à ceux de Chine ou de France. Ceci est surprenant car les restes fossiles de Néandertal n'ont été localisés qu'en Europe et en Asie occidentale. Très probablement, des échanges génétiques ont eu lieu entre les Néandertaliens et les humains modernes lorsque les humains modernes ont émergé d'Afrique, avant la divergence des Européens, des Asiatiques de l'Est et des Papouasie-Nouvelle-Guinée.

Plusieurs gènes semblent avoir subi des changements par rapport aux Néandertaliens au cours de l'évolution de l'homme actuel. Ces gènes sont impliqués dans la structure crânienne, le métabolisme, la morphologie de la peau et le développement cognitif. L'un des gènes qui présente un intérêt particulier est RUNX2, ce qui est différent chez les humains modernes et les Néandertaliens. Ce gène est responsable de l'os frontal proéminent, de la cage thoracique en forme de cloche et des différences dentaires observées chez les Néandertaliens. On suppose qu'un changement évolutif de RUNX2 était important dans l'origine de l'homme moderne, et cela a affecté le crâne et le haut du corps.

Regardez la conférence de Svante Pääbo expliquant la recherche sur le génome de Néandertal lors de la conférence annuelle TED (Technology, Entertainment, Design) de 2011.

Emballage de l'ADN dans les cellules

Les procaryotes sont beaucoup plus simples que les eucaryotes dans bon nombre de leurs caractéristiques ((Figure)). La plupart des procaryotes contiennent un seul chromosome circulaire qui se trouve dans une zone du cytoplasme appelée le région nucléoïde.


Dans les cellules eucaryotes, la synthèse d'ADN et d'ARN se produit dans un compartiment séparé de la synthèse des protéines. Dans les cellules procaryotes, les deux processus se produisent ensemble. Quels avantages pourrait-il y avoir à séparer les processus ? Quels avantages pourrait-il y avoir à les faire se dérouler ensemble ?

La taille du génome chez l'un des procaryotes les mieux étudiés, E. coli, est de 4,6 millions de paires de bases (environ 1,1 mm, si coupé et étiré). Alors, comment cela s'intègre-t-il dans une petite cellule bactérienne? L'ADN est tordu par ce qu'on appelle le superenroulement. Le superenroulement suggère que l'ADN est soit "sous-enroulé" (moins d'un tour d'hélice pour 10 paires de bases) soit "sur-enroulé" (plus d'un tour pour 10 paires de bases) par rapport à son état de relaxation normal. Certaines protéines sont connues pour être impliquées dans le superenroulement, d'autres protéines et enzymes telles que l'ADN gyrase aident à maintenir la structure superenroulée.

Les eucaryotes, dont les chromosomes sont chacun constitués d'une molécule d'ADN linéaire, utilisent un type différent de stratégie d'emballage pour adapter leur ADN à l'intérieur du noyau ((Figure)). Au niveau le plus élémentaire, l'ADN est enroulé autour de protéines appelées histones pour former des structures appelées nucléosomes. Les histones sont des protéines conservées au cours de l'évolution qui sont riches en acides aminés basiques et forment un octamère composé de deux molécules de chacune des quatre histones différentes. L'ADN (rappelez-vous qu'il est chargé négativement à cause des groupes phosphate) est étroitement enroulé autour du noyau d'histone. Ce nucléosome est lié au suivant à l'aide d'un ADN de liaison. Ceci est également connu sous le nom de structure « perles sur une chaîne ». À l'aide d'une cinquième histone, une chaîne de nucléosomes est encore compactée en une fibre de 30 nm, qui correspond au diamètre de la structure. Les chromosomes en métaphase sont encore plus condensés par association avec des protéines d'échafaudage. Au stade de la métaphase, les chromosomes sont les plus compacts, d'environ 700 nm de largeur.

En interphase, les chromosomes eucaryotes ont deux régions distinctes qui peuvent être distinguées par coloration. La région étroitement emballée est connue sous le nom d'hétérochromatine et la région la moins dense est connue sous le nom d'euchromatine. L'hétérochromatine contient généralement des gènes qui ne sont pas exprimés et se trouve dans les régions du centromère et des télomères. L'euchromatine contient généralement des gènes qui sont transcrits, avec de l'ADN emballé autour des nucléosomes mais pas davantage compacté.


Résumé de la section

Le modèle actuellement accepté de la structure en double hélice de l'ADN a été proposé par Watson et Crick. Certaines des caractéristiques saillantes sont que les deux brins qui composent la double hélice ont des séquences de bases complémentaires et des orientations anti-parallèles. L'alternance de sucres désoxyribose et de phosphates forme l'épine dorsale de la structure, et les bases azotées sont empilées comme des barreaux à l'intérieur. Le diamètre de la double hélice, 2 nm, est uniforme partout. Une purine s'apparie toujours avec une pyrimidine A s'apparie avec T et G s'apparie avec C. Un tour de l'hélice a 10 paires de bases. Les procaryotes sont beaucoup plus simples que les eucaryotes dans bon nombre de leurs caractéristiques. La plupart des procaryotes contiennent un seul chromosome circulaire. En général, les chromosomes eucaryotes contiennent une molécule d'ADN linéaire emballée dans des nucléosomes et ont deux régions distinctes qui peuvent être distinguées par coloration, reflétant différents états d'empaquetage et de compactage.

Questions de connexion visuelle

(Figure) Dans les cellules eucaryotes, la synthèse d'ADN et d'ARN se produit dans un compartiment séparé de la synthèse des protéines. Dans les cellules procaryotes, les deux processus se produisent ensemble. Quels avantages pourrait-il y avoir à séparer les processus ? Quels avantages pourrait-il y avoir à les faire se dérouler ensemble ?

(Figure) La compartimentation permet à une cellule eucaryote de diviser les processus en étapes discrètes afin qu'elle puisse construire des produits protéiques et ARN plus complexes. Mais il y a aussi un avantage à avoir un seul compartiment : la synthèse de l'ARN et des protéines se produit beaucoup plus rapidement dans une cellule procaryote.

Questions de révision

La double hélice d'ADN n'a pas lequel des éléments suivants ?

  1. configuration antiparallèle
  2. appariement de bases complémentaires
  3. rainures majeures et mineures
  4. uracile

Chez les eucaryotes, de quoi est enroulé l'ADN ?

Questions de pensée critique

Fournissez un bref résumé de la méthode de séquençage de Sanger.

Le brin d'ADN matrice est mélangé avec une ADN polymérase, une amorce, les 4 désoxynucléotides et une concentration limite de 4 didésoxynucléotides. L'ADN polymérase synthétise un brin complémentaire de la matrice. L'incorporation de ddNTP à différents emplacements donne des fragments d'ADN qui se terminent à chaque base possible dans la matrice. Ces fragments sont séparés par électrophorèse sur gel et visualisés par un détecteur laser pour déterminer la séquence de bases.

Décrire la structure et l'appariement des bases complémentaires de l'ADN.

L'ADN a deux brins en orientation anti-parallèle. Les liaisons sucre-phosphate forment une épine dorsale à l'extérieur et les bases sont appariées à l'intérieur : A avec T et G avec C, comme les barreaux d'une échelle en spirale.

Les procaryotes ont un seul chromosome circulaire tandis que les eucaryotes ont des chromosomes linéaires. Décrivez un avantage et un inconvénient de l'empaquetage du génome eucaryote par rapport aux procaryotes.

Avantage : L'arrangement linéaire du chromosome eucaryote permet à plus d'ADN d'être emballé en l'enroulant étroitement autour des histones. Plus de matériel génétique signifie que l'organisme peut coder plus d'informations dans une seule cellule.Cela a finalement permis à certains eucaryotes de se développer en organismes multicellulaires avec une spécialisation cellulaire.
Inconvénient : Maintenir plus de matériel génétique nécessite plus d'énergie et introduit la possibilité de plus d'erreurs (plus de complexité).


Résultats

Référence et périodicité

Les séquences d'ADN dans les nucléosomes sont caractérisées par des distributions périodiques de fréquence des dinucléotides AA/TT de 10 paires de bases se manifestant le plus clairement dans la levure. À des degrés divers, il est également observé dans d'autres organismes modèles : l'homme, la souris, le ver [35] et la mouche des fruits [36]. Nous avons étudié des modèles formés par des paires de dinucléotides WW/SS et RR/YY et des dinucléotides individuels AA/TT/TA et CC/GG qui transportent des signaux de positionnement de nucléosome par leurs arrangements périodiques. L'analyse de fréquence (transformée de Fourier) des profils de dinucléotides dans le cerveau de souris NAC a montré des pics à 10,1-10,4 période de base en accord avec la périodicité anticipée de 10 pb. Les distributions de fréquence des dinucléotides dans les cellules de souris et humaines avaient une ligne de base légèrement différente, peut-être en raison des différences de contenu en G+C dans le génome humain par rapport à celui de la souris 38,345% tel que calculé avec BEDTools nuc fonction). Nous avons observé un schéma très différent de la composition des séquences de nucléosomes dans les cellules apoptotiques par rapport au schéma dans les cellules de souris et humaines normales, suggérant un mécanisme différent basé sur les séquences régissant la dynamique des nucléosomes dans les cellules en apoptose. Comment les modèles se comparent dans le cerveau de souris NAC, CD4 + humain et cellules apoptotiques est montré dans la section 1 Figures A-E dans l'annexe S2.

Comparaison des profils d'ADN nucléosomique entre l'homme et la souris

La similitude et la différence globales entre les profils de fréquence des dinucléotides dans différentes conditions ont été quantifiées en calculant le coefficient de corrélation de Pearson entre les modèles par paire. La figure 1 montre des cartes thermiques des amplitudes de corrélation entre les modèles d'ADN nucléosomique de l'homme et de la souris et des dendrogrammes dérivés de ces matrices de corrélation.

Pour chaque dinucléotide composite (WW, SS, RR, YY) et individuel (AA, TT, CC, GG), une similitude entre les profils des cellules CD4+ humaines en tant que cd4, des cellules lymphocytaires apoptotiques humaines en tant qu'apo et des cellules NAC de cerveaux de souris témoins comme con, résilient au stress comme res et sensible au stress comme sus est montré. La similarité est quantifiée par un coefficient de corrélation de Pearson dont l'amplitude est indiquée dans chaque cellule de la matrice de corrélation. Deux représentations de similarité sont représentées pour chaque dinucléotide : une carte thermique dans laquelle les cellules codées par couleur montrent un coefficient de corrélation de Pearson entre deux profils et la couleur fournit une direction : le rouge est positif, le bleu est négatif. Les dendrogrammes de similarité sont calculés à partir de la matrice de corrélation montrée dans la carte thermique et illustrent le regroupement hiérarchique complet de liaisons des modèles.

Les schémas des cellules CD4+ humaines normales et de la NAC du cerveau de souris sont étonnamment similaires, même si leurs contextes expérimentaux et fonctionnels originaux sont très différents. Au contraire, les profils des cellules humaines apoptotiques étaient très différents de ceux des cellules NAC de souris et des cellules CD4+ humaines. Cependant, il existe un degré élevé de similitude entre les motifs apoptotiques et les motifs observés chez la levure [8]. Les profils WW, AA et TT dans les cellules NAC de souris et les cellules CD4+ humaines ont des corrélations positives significatives (> 0,8). Les patrons CC, GG et SS sont moins corrélés (> 0,49). Dans tous les cas, les modèles de dinucléotides dans les cellules apoptotiques n'ont aucune corrélation ou une corrélation négative (WW est < -0,27 et SS est < -0,5) avec les modèles dans les cellules CD4+ de souris et humaines.

Synchronisation des pics et préférences de position

Les préférences de position des nucléosomes pour certaines signatures de séquences se manifestent statistiquement sous forme de pics de certains dinucléotides à certaines positions dans les profils de fréquence calculés à partir d'un grand ensemble de séquences alignées d'ADN nucléosomique. Nous avons observé les maxima et minima (pics et creux) des profils de dinucléotides AA/TT, CC/GG, WW/SS et RR/YY dans des cellules de souris et humaines se produisant à une très grande proximité. Les positions dans lesquelles une majorité de dinucléotides dans des séquences provenant de différentes conditions ont des pics bien définis peuvent indiquer hubs qui peut avoir une signification particulière dans la dynamique des nucléosomes. Pour localiser les positions de hub, nous utilisons des profils de dinucléotides transformés en une séquence indicatrice d'unité dans laquelle un +1 spécifie une position d'un maximum et un -1 spécifie une position d'un minimum et toutes les autres positions ont des valeurs nulles. Nous avons observé que les pics se produisent principalement à des intervalles séparés par un pas de 10 ± 1 paires de bases. Les sites de l'ADN nucléosomique dans les cellules de souris et humaines ont été utilisés différemment par les dinucléotides. Dans les cellules humaines, les positions des multiples pics coïncidents le long de l'ADN nucléosomique étaient de ±69, ±47, ±46, ±43, ±28, ±23, ±19, ±13, ±7. Dans les cellules de souris, ils étaient : ±64, ±60, ±44, ±39, ±16, ±11. Les organismes humains et murins différaient également par l'identité des pics dinucléotidiques apparaissant simultanément.

Les dinucléotides mutuellement exclusifs tels que WW et SS ne peuvent pas occuper simultanément la même position. Cependant, nous avons observé que les pics de CC et GG et les pics de TA et YY se produisent simultanément chez la souris. Dans les cellules CD4+ humaines, les pics apparaissant simultanément étaient TA et GG et WW et SS. Cela signifie que les séquences analysées d'ADN nucléosomique contiennent plusieurs classes de motifs différentes. L'étude de l'analyse des cellules individuelles [2] a montré qu'à tout moment, les cellules individuelles sont à l'état binaire : certaines ont des nucléosomes remodelés et d'autres non. Cela peut expliquer la présence de pics de dinucléotides incompatibles dans des séquences d'ADN nucléosomique alignées provenant de la même source. Dans les cellules CD4+ humaines, les séquences d'ADN nucléosomiques ont formé deux groupes distincts favorisant chacun des motifs WW ou SS, comme indiqué précédemment [18]. Les moyeu les sites dans lesquels une majorité de dinucléotides (y compris incompatibles) avaient des pics étaient de ±45, ±31, ±20. Ces moyeu les sites sont situés dans ±2, ±3 et ±4 emplacements superhélicoïdaux (SHL) où l'ADN interagit avec l'octamère d'histone dans un processus de remodelage qui stabilise ou déstabilise les nucléosomes [37]. Plus de détails sur la synchronisation des pics, les dinucléotides et le moyeu les positions sont fournies dans la section 2, les figures F, G, H et le tableau A de l'annexe S2.

Signatures structurelles de motifs dinucléotidiques dans diverses conditions

Nous avons étudié plus en détail comment les modèles d'ADN nucléosomique dans les organismes supérieurs humains et murins se comparent aux modèles bien établis [8] dans les organismes de levure unicellulaires. Comme dimension supplémentaire à notre comparaison, nous avons ajouté une distribution généralisée des emplacements superhélicoïdaux. Les SHL comprenant des sillons mineurs et majeurs dans l'ADN nucléosomique ont été dérivés par Cui et Zhurkin à partir des angles de roulis des structures cristallines de la particule centrale du nucléosome (NCP) illustrée sur la figure 3 dans [10]. Nous avons superposé les distributions des pics WW/SS, RR/YY, AA/TT/TA et CC/GG chez trois organismes (levure, souris et humain) sur une carte des zones SHL du dessin de la figure 3 dans [10] qui correspond à la moitié de l'ADN nucléosomique. Un diagramme en échelle codé par couleur des pics WW/SS et RR/YY est illustré à la figure 2. Les étapes WW et SS et les étapes RR et YY sont représentées en face l'une de l'autre pour faciliter la visualisation d'un ordre dans la disposition des ces étapes.

Les diagrammes en échelle représentent la moitié du nucléosome avec une position de dyade en bas et allant de -1 paire de bases à -72 paires de bases. Les positions correspondant aux sillons majeurs sont indiquées en rouge et les sillons mineurs sont en bleu (comme dans le dessin animé de la figure 3 dans [10] étiquetés par des numéros SHL). Les pics WW sont codés en vert, les SS en rouge, les RR sont codés en magenta et YY en orange. Chaque pic indiqué à l'intérieur de la cellule est étiqueté par une lettre indiquant à quel organisme il appartient (H- pour cellules CD4+ humaines, M- pour NAC de souris témoin, Y levure et A pour cellules lymphocytaires apoptotiques humaines). Les diagrammes SS1/WW1 et RR1/YY1 montrent les distributions maximales chez l'homme et la souris. Les diagrammes SS2/WW2 et RR2/YY2 montrent les distributions de pics dans les cellules apoptotiques de levure et humaines. Les numéros 1 et 2 désignent ces classes de motifs distinctes. Les diagrammes à relais illustrent une synchronisation entre les occurrences de pic. Les pics WW chez l'homme et la souris ont des homologues des pics SS dans la levure et les cellules apoptotiques et vice versa. Les motifs RR1/YY1 semblent être très réguliers. Le RR2/YY2 a une apparence moins régulière dans laquelle les pics sont principalement concentrés dans les zones SHL ±2,5, ±3,5 et ±4,5.

Dans les cellules CD4+ humaines et les cellules NAC de souris, la plupart des sites de pic WW coïncident et sont situés dans les sillons principaux. Cependant, les pics de WW dans la levure et les cellules apoptotiques humaines apparaissent principalement comme opposés par rapport au même pic dans les cellules CD4+ humaines et la NAC de souris. Les pics WW dans les cellules CD4+ humaines et la NAC de souris se produisent dans les zones de sillon majeur SHL ±6, ±5, ±4, ±3, ±2, mais les cellules apoptotiques de levure et humaine ont des pics SS dans ces zones. Et l'inverse : les zones ±4,5 et ±2,5 ont des pics SS dans les cellules CD4+ humaines et la NAC de souris, mais dans les cellules apoptotiques de levure et humaines, ces emplacements contiennent des pics WW. Les pics de SS à proximité de la dyade à ±1,5 se produisent uniquement chez la souris. La plupart des pics de SS chez la souris et l'homme sont séparés de ±1, ±2 paires de bases, mais le pic de SS central au niveau de la dyade coïncide dans les deux organismes. Généralement, dans tous les organismes, les pics de la zone SHL -1 ont une amplitude plus faible. La souris et l'humain à la dyade ont des pics SS et la levure a à la fois : des pics SS et WW. Il existe des similitudes significatives entre les distributions des pics de position dans la NAC de souris et les cellules CD4+ humaines normales. Cependant, la distribution des pics de position dans les cellules apoptotiques humaines est significativement différente et ressemble fortement à la distribution des pics dans la levure.

Les distributions des pics RR/YY ont des caractéristiques similaires chez les CD4+ humains et chez la souris. Cependant, il est différent dans les cellules de levure et considérablement différent dans les cellules apoptotiques humaines. Le modèle RR2/YY2 chez la levure a des pics RR (Purine-Purine) apparaissant dans les zones mineures SHL en échange avec les étapes YY (Pyrimidine-Pyrimidine) apparaissant dans toutes les zones SHL tandis que dans les cellules CD4+ humaines et le NAC de souris, les étapes RR et YY se produisent dans zones principales et sont disposés à proximité immédiate les uns des autres. Le motif RR2/YY2 dans les cellules apoptotiques humaines a une structure régulière qui est très différente des autres motifs. La configuration de motif WW/SS observée est une configuration classique de séquence favorisant les nucléosomes [7, 8]. En ce qui concerne les motifs RR/YY observés, les structures d'ADN contenant ces configurations de dinucléotides ne persistent pas en raison de la rigidité des étapes dinucléotidiques RR et YY [8] and [38]. La localisation du site de pic dans les zones SHL diffère entre la souris (souris témoin, sensible et résistante au stress) et l'humain (cellules CD4+ et apoptotiques). Tous les sites qui avaient un ou plusieurs pics ont été comptés dans chaque zone SHL pour la souris et pour l'homme. La distribution des comptes est montrée sur la figure 3. Les positions des pics de tous les dinucléotides dans cette étude et leurs zones structurelles correspondantes sont résumées dans le tableau 1 dans le tableau S1.

Les barres montrent le nombre de décomptes de sites de pic à travers le SHL dans les cellules CD4+ humaines et les lymphocytes apoptotiques par rapport aux décomptes dans le NAC de souris chez les souris témoins, sensibles et résilientes au stress.

Les dénombrements de pointe à travers le SHL chez l'homme et la souris présentaient une différence statistiquement significative (valeur p du test de somme des rangs de Wilcoxon apparié = 0,02). La zone SHL -1,5 a 4 sites de pic chez la souris, mais chez l'homme, elle n'a qu'un seul site de pic dans les cellules apoptotiques. Les zones SHL ±4, ±4,5 et -3,5 chez l'homme ont plus de sites de pic par rapport à la souris. Dans la zone SHL -6,5, seule la souris sensible au stress présentait un pic. Les zones SHL ± 1,5, ± 4 et ± 4,5 qui diffèrent entre l'homme et la souris en termes de préférences de position jouent un rôle dans la dynamique des nucléosomes. La plupart des déformations de l'ADN ont lieu dans la zone SHL ± 1,5. Il a une liaison accrue aux protéines de l'ADN et il est plus sensible aux dommages à l'ADN [39]. D'autres zones importantes dans lesquelles plusieurs pics de tous les organismes ont été observés sont les zones SHL ±2, ± 3 et ± 4. Les SHL ± 2, ± 3 sont des zones dans lesquelles les remodeleurs de la chromatine interagissent avec l'ADN et dans la zone SHL ± 4, la queue de l'histone H2A interagit. avec de l'ADN ce qui en fait une zone moins stable [37]. Des relations statistiquement définies entre le positionnement des nucléosomes et la modification covalente de la chromatine ont été notées, mais il n'y a pas de relation établie entre les modifications des histones et les nucléotides spécifiques observés à un endroit donné [5]. Il n'est pas encore clair comment la composition spécifique de la séquence d'ADN pourrait interagir avec ces processus et affecter le positionnement et le remodelage des nucléosomes. Un bref résumé des connaissances actuelles sur l'importance de zones SHL spécifiques essayant de fournir plus de contexte aux régularités observées dans ce travail est fourni dans la section 3 de l'annexe S2.

Cartographie informatique des nucléosomes dans les emplacements de changement d'occupation des nucléosomes chez des souris sensibles au stress et résilientes au stress

Les motifs dans un profil de dinucléotide agrégé ne sont pas nécessairement observés dans un nombre significatif de séquences individuelles [40]. Dans ce cas, ils reflètent probablement des préférences de séquence relativement faibles du noyau d'histone, plutôt qu'un mécanisme de placement des nucléosomes qui est significatif pour la régulation biologique au niveau des loci individuels tels que les promoteurs ou les amplificateurs de gènes.

Pour vérifier si les modèles RR/YY sont fréquemment observés dans des séquences individuelles dans les loci dans lesquels des événements régulateurs ont eu lieu en réponse au stress chez des souris sensibles au stress et résilientes au stress, nous avons effectué une cartographie informatique des nucléosomes dans ces séquences en utilisant des modèles dérivés dans cette étude. En outre, nous avons cartographié les nucléosomes dans un sous-ensemble de séquences de nucléosomes +1 échantillonnées au hasard à partir de séquences fasta de souris affectées par le stress. Le tableau 2 montre les proportions de motifs des corrélations de Pearson positives les plus élevées avec les distributions de dinucléotides dans les séquences des loci dans lesquels des changements d'occupation des nucléosomes ont eu lieu en réponse au stress chez les souris affectées par le stress. Les modèles RR/YY et SS2 dominent de manière significative dans ces séquences chez les souris à la fois sensibles au stress et résilientes au stress. Des proportions de motifs similaires ont été observées dans des séquences échantillonnées au hasard de +1 nucléosome à l'échelle du génome des souris affectées par le stress. Les distributions des coefficients de corrélation de Pearson maximum entre les motifs et les séquences ne diffèrent pas significativement entre les séquences de promoteur, de corps de gène et de nucléosome +1 aléatoire. Seules des corrélations légèrement plus élevées ont été observées dans les promoteurs et les loci du corps des gènes pour le modèle YY2. Les chiffres comparant les fonctions de distribution cumulative empiriques (ECDF) des coefficients de corrélation de Pearson obtenus dans la cartographie des nucléosomes dans le promoteur, le corps du gène et les séquences de nucléosomes +1 échantillonnées au hasard se trouvent dans l'annexe S3 supplémentaire. Même si nous avons observé une prévalence de modèles RR/YY moins stables dans les séquences des loci dans lesquels les événements régulateurs du changement d'occupation des nucléosomes ont eu lieu, une expérience dirigée plus rigoureuse est nécessaire pour établir si ces modèles pourraient interférer ou influencer la chromatine régulatrice biologiquement significative. activité.


Contenu

Les débats concernant les fonctions potentielles de ces éléments sont de longue date. Des références controversées à l'ADN « poubelle » ou « égoïste » ont été avancées dès le début, ce qui implique que les segments d'ADN répétitifs sont des restes d'une évolution passée ou de séquences autonomes auto-répliquantes piratant la machinerie cellulaire pour proliférer. [2] [3] Découvert à l'origine par Barbara McClintock, [4] les répétitions dispersées ont été de plus en plus reconnues comme une source potentielle de variation génétique et de régulation. Parallèlement à ces rôles régulateurs, un rôle structurel de l'ADN répété dans la formation du repliement 3D des génomes a également été proposé. [5] Cette hypothèse n'est soutenue que par un ensemble limité de preuves expérimentales. Par exemple, chez l'homme, la souris et la mouche, plusieurs classes d'éléments répétitifs présentent une forte tendance à la colocalisation dans l'espace nucléaire, ce qui suggère que les positions des répétitions d'ADN peuvent être utilisées par la cellule comme carte de repliement du génome. [6]

Répétitions en tandem dans la maladie humaine Modifier

Les séquences répétées en tandem, en particulier les répétitions trinucléotidiques, sous-tendent plusieurs maladies humaines. Les répétitions de trinucléotides peuvent se développer dans la lignée germinale au cours des générations successives, entraînant des manifestations de plus en plus graves de la maladie. Les maladies dans lesquelles l'expansion se produit comprennent la maladie de Huntington, le syndrome de l'X fragile, plusieurs ataxies spinocérébelleuses, la dystrophie myotonique et l'ataxie de Friedrich. [7] Des expansions répétées de trinucléotides peuvent se produire par glissement de brin pendant la réplication de l'ADN ou pendant la synthèse de réparation de l'ADN. [7]

Séquences répétées de l'hexanucléotide GGGGCC dans le C9orf72 sont une cause fréquente de sclérose latérale amyotrophique et de démence frontotemporale. [8] Des séquences répétées de trinucléotides CAG sous-tendent plusieurs ataxies spinocérébelleuses (SCAs-SCA1 SCA2 SCA3 SCA6 SCA7 SCA12 SCA17). [8] La maladie de Huntington résulte d'une expansion instable de séquences CAG répétées dans l'exon 1 du la chasse gène (HTT). HTT code pour une protéine d'échafaudage qui participe directement à la réparation des dommages oxydatifs de l'ADN. [9] Il a été noté que les gènes contenant des répétitions CAG pathogènes codent souvent pour des protéines qui elles-mêmes jouent un rôle dans la réponse aux dommages à l'ADN et que les expansions répétées peuvent altérer des voies de réparation spécifiques de l'ADN. [10] Une réparation défectueuse des dommages à l'ADN dans des séquences répétées peut entraîner une expansion supplémentaire de ces séquences, créant ainsi un cercle vicieux de pathologie. [dix]

Principaux types Modifier

Principales catégories de séquence répétée ou répète:

    : sont des copies adjacentes les unes aux autres, directement ou inversées. ADN satellite - généralement trouvé dans les centromères et l'hétérochromatine. Minisatellite - unités répétées d'environ 10 à 60 paires de bases, trouvées à de nombreux endroits du génome, y compris les centromères. Microsatellite - unités répétées de moins de 10 paires de bases, y compris les télomères, qui ont généralement 6 à 8 unités répétées de paires de bases.
    (alias éléments nucléaires intercalés) : éléments transposables. ADN transposons.retrotransposons.LTR-retrotransposons (HERVs).non LTR-retrotransposons.SINEs (Scourt jeintercalé Nuclair Eéléments).LIGNES (Llong jeintercalé Nuclair Eéléments).SVA

Chez les primates, la majorité des LINEs sont des LINE-1 et la majorité des SINEs sont des Alu. Les SVA sont spécifiques aux hominoïdes.

Chez les procaryotes, les CRISPR sont des réseaux de répétitions et d'espaceurs alternés.

Séquences répétées évolutives dérivées d'événements d'infection virale. [11]

Autres types Modifier

Remarque : Les éléments suivants sont traités en détail dans « Calcul pour la génomique microbienne comparative ». [12]

    • Répétition directe globale
    • Répétitions simples directes locales
    • Répétitions directes locales
    • Répétitions directes locales avec espaceur
    • Répétition inversée globale
    • Répétition inversée locale
    • Répétition inversée avec espaceur

    L'ADN répétitif est difficile à séquencer à l'aide de techniques de séquençage de nouvelle génération : l'assemblage de séquences à partir de lectures courtes ne peut tout simplement pas déterminer la longueur d'une partie répétitive.Ce problème est particulièrement grave pour les microsatellites, qui sont constitués de minuscules unités répétées de 1 à 6 pb. [13]

    De nombreux chercheurs ont historiquement omis les parties répétitives lors de l'analyse et de la publication de données sur le génome entier. [14]


    Pourquoi y a-t-il 10 étapes de paires de bases, pas 16 ? - La biologie

    Lorsque l'on compare les cellules procaryotes aux cellules eucaryotes, les procaryotes sont beaucoup plus simples que les eucaryotes dans bon nombre de leurs caractéristiques (Figure 1). La plupart des procaryotes contiennent un seul chromosome circulaire qui se trouve dans une zone du cytoplasme appelée nucléoïde.

    Question de pratique

    Figure 1. Un eucaryote contient un noyau bien défini, alors que chez les procaryotes, le chromosome se trouve dans le cytoplasme dans une zone appelée nucléoïde.

    Dans les cellules eucaryotes, la synthèse d'ADN et d'ARN se produit dans un compartiment séparé de la synthèse des protéines. Dans les cellules procaryotes, les deux processus se produisent ensemble. Quels avantages pourrait-il y avoir à séparer les processus ?

    La taille du génome chez l'un des procaryotes les mieux étudiés, E. coli, est de 4,6 millions de paires de bases (environ 1,1 mm, si coupé et étiré). Alors, comment cela s'intègre-t-il dans une petite cellule bactérienne? L'ADN est tordu par ce qu'on appelle le superenroulement. Le superenroulement signifie que l'ADN est soit sous-enroulé (moins d'un tour d'hélice pour 10 paires de bases) soit surenroulé (plus d'un tour pour 10 paires de bases) par rapport à son état normal de relaxation. Certaines protéines sont connues pour être impliquées dans le superenroulement, d'autres protéines et enzymes telles que l'ADN gyrase aident à maintenir la structure superenroulée.

    Les eucaryotes, dont les chromosomes sont chacun constitués d'une molécule d'ADN linéaire, utilisent un type différent de stratégie d'emballage pour adapter leur ADN à l'intérieur du noyau (Figure 2). Au niveau le plus élémentaire, l'ADN est enroulé autour de protéines appelées histones pour former des structures appelées nucléosomes. Les histones sont des protéines conservées au cours de l'évolution qui sont riches en acides aminés basiques et forment un octamère. L'ADN (qui est chargé négativement à cause des groupes phosphate) est étroitement enroulé autour du noyau d'histone. Ce nucléosome est lié au suivant à l'aide d'un ADN de liaison. Ceci est également connu sous le nom de structure “perles sur une chaîne”. Celui-ci est ensuite compacté en une fibre de 30 nm, qui correspond au diamètre de la structure. Au stade de la métaphase, les chromosomes sont les plus compacts, mesurent environ 700 nm de largeur et se trouvent en association avec des protéines d'échafaudage.

    En interphase, les chromosomes eucaryotes ont deux régions distinctes qui peuvent être distinguées par coloration. La région étroitement emballée est connue sous le nom d'hétérochromatine et la région la moins dense est connue sous le nom d'euchromatine. L'hétérochromatine contient généralement des gènes qui ne sont pas exprimés et se trouve dans les régions du centromère et des télomères. L'euchromatine contient généralement des gènes qui sont transcrits, avec de l'ADN emballé autour des nucléosomes mais pas davantage compacté.

    Figure 2. Ces figures illustrent le compactage du chromosome eucaryote.


    Contenu

    Exemple de répétition inversée Modifier

    En commençant par cette séquence initiale :
    5'-TTACG-3'

    Le complément créé par appariement de bases est :
    3'-AATGC-5'

    Le complément inverse est :
    5'-CGTAA-3'

    Et, la séquence de répétition inversée est :
    5'---TTACGnnnnnn CGTAA---3'

    "nnnnnn" représente un nombre quelconque de nucléotides intermédiaires.

    Vs. répétition directe Modifier

    Une répétition directe se produit lorsqu'une séquence est répétée avec le même motif en aval. [1] Il n'y a pas d'inversion ni de complément inverse associé à une répétition directe. La séquence nucléotidique écrite en caractères gras signifie la séquence répétée. Il peut ou non avoir des nucléotides intermédiaires.

    TTACGnnnnnnTTACG 3´ 3´ AATGCnnnnnnAATGC 5´

    Linguistiquement, une répétition directe typique est comparable à une rime, comme dans "ttemps un jourtemps".

    Vs. répétition en tandem Modifier

    Une reprise directe avec non les nucléotides intermédiaires entre la séquence initiale et sa copie en aval sont une répétition en tandem. La séquence nucléotidique écrite en caractères gras signifie la séquence répétée.

    TTACGTTACG 3´ 3´ AATGCAATGC 5'

    Linguistiquement, une répétition en tandem typique est comparable au bégaiement, ou à des mots délibérément répétés, comme dans « bye-bye ».

    Vs. palindrome Modifier

    Une séquence de répétition inversée avec non nucléotides intermédiaires entre la séquence initiale et son complément inverse en aval est un palindrome. [1]
    EXEMPLE:
    Étape 1 : commencez par une répétition inversée : 5' TTACGnnnnnnCGTAA 3'
    Étape 2 : supprimer les nucléotides intermédiaires : 5' TTACGCGTAA 3'
    Cette séquence résultante est palindromique car elle est le complément inverse d'elle-même. [1]

    5' TTACGCGTAA Séquence de test 3' (de l'étape 2 sans les nucléotides intermédiaires) 3' AATGCGCATT Complément 5' de la séquence de test 5' TTACGCGTAA Complément inverse 3' C'est la même que la séquence de test ci-dessus, et donc, c'est un palindrome.

    Conditions qui favorisent la synthèse Modifier

    Les diverses répétitions à l'échelle du génome sont dérivées d'éléments transposables, qui sont maintenant compris comme "sauter" sur différents emplacements génomiques, sans transférer leurs copies originales. [9] La navette ultérieure des mêmes séquences sur de nombreuses générations assure leur multiplicité dans tout le génome. [9] La recombinaison limitée des séquences entre deux éléments de séquence distincts connus sous le nom de recombinaison spécifique de site conservatrice (CSSR) entraîne des inversions du segment d'ADN, basées sur l'agencement des séquences de reconnaissance de recombinaison sur l'ADN donneur et l'ADN receveur. [9] Encore une fois, l'orientation de deux des sites de recombinaison dans la molécule d'ADN du donneur par rapport à l'asymétrie des séquences de clivage d'ADN intermédiaires, connue sous le nom de région de croisement, est essentielle à la formation de répétitions inversées ou de répétitions directes. [9] Ainsi, la recombinaison se produisant à une paire de sites inversés inversera la séquence d'ADN entre les deux sites. [9] Des chromosomes très stables ont été observés avec comparativement moins de nombres de répétitions inversées que de répétitions directes, suggérant une relation entre la stabilité chromosomique et le nombre de répétitions. [dix]

    Régions où la présence est obligatoire Modifier

    Des répétitions inversées terminales ont été observées dans l'ADN de divers transposons eucaryotes, même si leur source reste inconnue. [11] Les répétitions inversées se trouvent principalement aux origines de la réplication de l'organisme cellulaire et des organites qui vont des plasmides phagiques, des mitochondries et des virus eucaryotes aux cellules de mammifères. [12] Les origines de réplication du phage G4 et d'autres phages apparentés comprennent un segment de près de 139 bases nucléotidiques qui comprennent trois répétitions inversées essentielles pour l'amorçage de la réplication. [12]

    Dans le génome Modifier

    Dans une large mesure, des portions de répétitions nucléotidiques sont assez souvent observées dans le cadre de combinaisons d'ADN rares. [13] Les trois répétitions principales que l'on trouve en grande partie dans des constructions d'ADN particulières comprennent les répétitions inversées homopurine-homopyrimidine très précises, autrement appelées palindromes H, un phénomène courant dans les conformations H triple hélicoïdales qui peuvent comprendre soit le TAT soit le CGC triades nucléotidiques. Les autres pourraient être décrits comme de longues répétitions inversées ayant tendance à produire des épingles à cheveux et des répétitions cruciformes, et enfin des répétitions en tandem directes, qui existent couramment dans des structures décrites comme ADN-Z en boucle glissée, cruciforme et gaucher. [13]

    Commun dans différents organismes Modifier

    Des études antérieures suggèrent que les répétitions sont une caractéristique commune des eucaryotes contrairement aux procaryotes et aux archées. [13] D'autres rapports suggèrent qu'indépendamment de la pénurie comparative d'éléments répétés dans les génomes procaryotes, ils contiennent néanmoins des centaines voire des milliers de grandes répétitions. [14] L'analyse génomique actuelle semble suggérer l'existence d'un grand excès de répétitions inversées parfaites dans de nombreux génomes procaryotes par rapport aux génomes eucaryotes. [15]

    Pour la quantification et la comparaison des répétitions inversées entre plusieurs espèces, notamment sur les archées, voir [16]

    Répétitions inversées dans les pseudonœuds Modifier

    Les pseudo-nœuds sont des motifs structuraux communs trouvés dans l'ARN. Ils sont formés de deux tiges-boucles imbriquées de telle sorte que la tige d'une structure est formée à partir de la boucle de l'autre. Il existe de multiples topologies de pliage parmi les pseudo-nœuds et une grande variation dans les longueurs de boucle, ce qui en fait un groupe structurellement diversifié. [17]

    Les répétitions inversées sont un élément clé des pseudo-nœuds, comme on peut le voir dans l'illustration d'un pseudo-nœud naturel trouvé dans le composant ARN de la télomérase humaine. [18] Quatre ensembles différents de répétitions inversées sont impliqués dans cette structure. Les ensembles 1 et 2 sont la tige de la tige-boucle A et font partie de la boucle de la tige-boucle B. De même, les ensembles 3 et 4 sont la tige de la tige-boucle B et font partie de la boucle de la tige-boucle A.

    Les pseudo-nœuds jouent un certain nombre de rôles différents en biologie. Le pseudo-nœud de la télomérase dans l'illustration est essentiel à l'activité de cette enzyme. [18] Le ribozyme pour le virus de l'hépatite delta (VHD) se replie en une structure à double pseudo-nœud et auto-clive son génome circulaire pour produire un ARN d'une seule longueur de génome. Les pseudo-nœuds jouent également un rôle dans le changement de cadre ribosomique programmé trouvé dans certains virus et requis dans la réplication des rétrovirus. [17]

    Dans les riboswitchs Modifier

    Les répétitions inversées jouent un rôle important dans les riboswitches, qui sont des éléments régulateurs de l'ARN qui contrôlent l'expression des gènes qui produisent l'ARNm, dont ils font partie. [9] Un exemple simplifié du riboswitch flavine mononucléotide (FMN) est présenté dans l'illustration. Ce riboswitch existe dans le transcrit d'ARNm et possède plusieurs structures tige-boucle en amont de la région codante. Cependant, seules les tiges-boucles clés sont montrées dans l'illustration, qui a été considérablement simplifiée pour aider à montrer le rôle des répétitions inversées. Il y a plusieurs répétitions inversées dans ce riboswitch comme indiqué en vert (fond jaune) et bleu (fond orange).

    En l'absence de FMN, la structure anti-terminaison est la conformation préférée pour le transcrit d'ARNm. Il est créé par appariement de bases de la région de répétition inversée entourée en rouge. Lorsque FMN est présent, il peut se lier à la boucle et empêcher la formation de la structure anti-terminaison. Cela permet à deux ensembles différents de répétitions inversées de former une paire de bases et de former la structure de terminaison. [19] La tige-boucle à l'extrémité 3' est un terminateur transcriptionnel parce que la séquence qui la suit immédiatement est une chaîne d'uraciles (U). Si cette tige-boucle se forme (en raison de la présence de FMN) lorsque le brin d'ARN en croissance émerge du complexe d'ARN polymérase, cela créera une tension structurelle suffisante pour provoquer la dissociation du brin d'ARN et ainsi mettre fin à la transcription. La dissociation se produit facilement car l'appariement de bases entre les U de l'ARN et les A du brin matrice sont les plus faibles de tous les appariements de bases. [9] Ainsi, à des niveaux de concentration plus élevés, FMN régule à la baisse sa propre transcription en augmentant la formation de la structure de terminaison.

    Les répétitions inversées sont souvent décrites comme des "points chauds" d'instabilité génomique eucaryote et procaryote. [6] Les répétitions inversées longues sont réputées influencer grandement la stabilité du génome de divers organismes. [20] Ceci est illustré dans E. coli, où les séquences génomiques avec de longues répétitions inversées sont rarement répliquées, mais plutôt supprimées avec rapidité. [20] Encore une fois, les longues répétitions inversées observées chez la levure favorisent grandement la recombinaison au sein des mêmes chromosomes et des chromosomes adjacents, entraînant un taux de délétion également très élevé. [20] Enfin, un taux très élevé de délétion et de recombinaison a également été observé dans les régions chromosomiques de mammifères avec des répétitions inversées. [20] Les différences signalées dans la stabilité des génomes d'organismes interdépendants sont toujours une indication d'une disparité dans les répétitions inversées. [10] L'instabilité résulte de la tendance des répétitions inversées à se replier en structures d'ADN en épingle à cheveux ou en forme de croix. Ces structures spéciales peuvent entraver ou confondre la réplication de l'ADN et d'autres activités génomiques. [6] Ainsi, les répétitions inversées conduisent à des configurations spéciales à la fois dans l'ARN et l'ADN qui peuvent finalement provoquer des mutations et des maladies. [8]

    L'illustration montre une répétition inversée subissant une extrusion cruciforme. L'ADN dans la région de la répétition inversée se déroule puis se recombine, formant une jonction à quatre voies avec deux structures tige-boucle. La structure cruciforme se produit parce que les séquences répétées inversées s'auto-apparient les unes aux autres sur leur propre brin. [21]

    Les cruciformes extrudés peuvent entraîner des mutations de décalage du cadre de lecture lorsqu'une séquence d'ADN a des répétitions inversées sous la forme d'un palindrome combiné avec des régions de répétitions directes de chaque côté. Au cours de la transcription, le glissement et la dissociation partielle de la polymérase du brin matrice peuvent conduire à la fois à des mutations par délétion et par insertion. [8] La suppression se produit lorsqu'une partie du brin modèle déroulé forme une tige-boucle qui est "sautée" par la machinerie de transcription. L'insertion se produit lorsqu'une tige-boucle se forme dans une partie dissociée du brin naissant (nouvellement synthétisé), provoquant la transcription deux fois d'une partie du brin modèle. [8]

    Déficit en antithrombine dû à une mutation ponctuelle Modifier

    Des répétitions inversées imparfaites peuvent entraîner des mutations par commutation intrabrin et interbrin. [8] La région codante du gène de l'antithrombine III est un exemple de répétition inversée imparfaite, comme le montre la figure de droite. La structure tige-boucle se forme avec une bosse en bas car le G et le T ne s'apparient pas. Un événement de commutation de brin pourrait entraîner le remplacement du G (dans la bosse) par un A qui supprime "l'imperfection" dans la répétition inversée et fournit une structure tige-boucle plus solide. Cependant, le remplacement crée également une mutation ponctuelle convertissant le codon GCA en ACA. Si l'événement de commutation de brin est suivi d'un deuxième cycle de réplication de l'ADN, la mutation peut se fixer dans le génome et entraîner une maladie. Concrètement, la mutation faux-sens conduirait à un gène défectueux et à un déficit en antithrombine qui pourrait entraîner le développement d'une thromboembolie veineuse (caillots sanguins dans une veine). [8]

    Ostéogenèse imparfaite à partir d'une mutation de frameshift Modifier

    Des mutations dans le gène du collagène peuvent conduire à la maladie d'ostéogenèse imparfaite, qui se caractérise par des os fragiles. [8] Dans l'illustration, une tige-boucle formée à partir d'une répétition inversée imparfaite est muté avec une insertion de nucléotide thymine (T) à la suite d'un commutateur inter- ou intrabrin. L'ajout du T crée un "match up" d'appariement de bases avec l'adénine (A) qui était auparavant une "bosse" sur le côté gauche de la tige. Bien que cet ajout renforce la tige et perfectionne la répétition inversée, il crée également une mutation de décalage du cadre de lecture dans la séquence nucléotidique qui modifie le cadre de lecture et entraînera une expression incorrecte du gène. [8]

    La liste suivante fournit des informations et des liens externes vers divers programmes et bases de données pour les reprises inversées :


    Voir la vidéo: Pas de base en Step. Partie #5 (Décembre 2022).