Informations

Recommandation de livre : Caractéristiques complexes et architecture génétique complexe

Recommandation de livre : Caractéristiques complexes et architecture génétique complexe


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je suis à la recherche d'un livre (ou de toute bonne source d'information) qui propose une discussion approfondie et des modèles sur l'évolution et l'analyse de traits complexes et d'une architecture génétique complexe. Avez-vous des suggestions?

Je définirais les traits complexes comme les traits dont la variance dans la population s'explique par un grand nombre de loci génétiques et de facteurs environnementaux variés.


Suggestions:

Génétique évolutive : Concepts et études de cas : Concepts et études de cas

Édité par Lexington Charles W. Fox Département d'entomologie Université du Kentucky, Faculté des sciences de la vie Université de Manchester Jason B. Wolf Conférencier

La théorie mathématique de la sélection, de la recombinaison et de la mutation

par R Bürger (comme suggéré par @rg255 dans les commentaires)

Génétique de Lynch et Walsh et analyse des caractères quantitatifs

(comme suggéré par @kmm dans les commentaires)

PS : Dites-nous si vous en avez trouvé un meilleur.


Les analyses d'épigénomique et d'association génotype-phénotype révèlent une architecture génétique conservée de traits complexes chez les bovins et les humains

Le manque d'annotations fonctionnelles complètes sur un large éventail de tissus et de types de cellules entrave gravement les interprétations biologiques de la variation phénotypique, de l'évolution adaptative et de la domestication chez le bétail. Ici, nous avons utilisé une combinaison d'épigénomique comparative, d'étude d'association à l'échelle du génome (GWAS) et d'analyse de signature de sélection, pour faire la lumière sur l'évolution adaptative potentielle chez les bovins.

Résultats

Nous avons croisé 8 marques d'histones de 1 300 échantillons de l'homme au bétail, couvrant 178 types de tissus/cellules uniques. En analysant uniformément 723 RNA-seq et 40 ensembles de données de séquençage au bisulfite du génome entier (WGBS) chez les bovins, nous avons validé que les marques d'histones croisées capturaient l'expression et la méthylation spécifiques aux tissus, reflétant la biologie des tissus. Grâce à l'intégration de marques d'histones spécifiques aux tissus cartographiées avec des résultats de signature GWAS et de sélection à grande échelle, nous avons pour la première fois détecté des tissus et des types cellulaires pertinents pour 45 traits économiquement importants et une sélection artificielle chez les bovins. Par exemple, les tissus immunitaires sont significativement associés aux traits de santé et de reproduction, aux multiples tissus pour la production laitière et aux traits de conformation corporelle (reflétant leur architecture hautement polygénique) et la thyroïde pour la sélection différente entre les bovins de boucherie et les bovins laitiers. De même, nous avons détecté des tissus pertinents pour 58 traits et maladies complexes chez l'homme et observé que les traits immunitaires et de fertilité chez l'homme étaient significativement corrélés avec ceux des bovins en termes de tissus pertinents, ce qui a facilité l'identification des gènes causaux pour ces traits. Par exemple, PIK3CG, un gène hautement spécifiquement exprimé dans les cellules mononucléées, était significativement associé à la fois à l'âge à la ménopause chez l'homme et à la mortinatalité des filles chez les bovins. ICAM, un gène spécifique des cellules T, était significativement associé à la fois aux maladies allergiques chez l'homme et à la métrite chez les bovins.

Conclusion

Collectivement, nos résultats ont mis en évidence que l'épigénomique comparative en conjonction avec les analyses de signature GWAS et de sélection pourrait fournir des informations biologiques sur la variation phénotypique et l'évolution adaptative. Les bovins peuvent servir de modèle pour les traits complexes humains, en fournissant des informations supplémentaires au-delà des organismes modèles de laboratoire, en particulier lorsque de nouveaux phénotypes seront disponibles dans un proche avenir.


Modélisation de l'architecture génétique de caractères complexes avec des marqueurs moléculaires

Auteurs): Rongling Wu, Wei Hou, Yuehua Cui, Hongying Li, Tian Liu, Song Wu, Chang-Xing Ma, Yanru Zeng Department of Statistics, University of Florida, Gainesville, FL 32611 USA.

Affiliation :

Nom de la revue : Brevets récents sur la nanotechnologie

Volume 1 , Numéro 1 , 2007




Résumé:

Comprendre le contrôle génétique des caractères hérités quantitativement est fondamental pour la recherche génétique agricole, évolutive et biomédicale. Une image détaillée de l'architecture génétique des caractères quantitatifs peut être élucidée avec une carte génétique bien saturée de marqueurs moléculaires. Les paramètres qui quantifient l'architecture génétique d'un trait comprennent le nombre de loci de traits quantitatifs individuels (QTL), leurs positions génomiques, leurs actions et interactions génétiques et leur réactivité aux facteurs biotiques ou abiotiques. Une variété de conceptions génétiques et de modèles statistiques ont été développés pour estimer et tester ces paramètres de modélisation de l'architecture. Avec la disponibilité de marqueurs de polymorphisme à nucléotide unique très abondants, des variantes de séquence d'ADN, c'est-à-dire des nucléotides à traits quantitatifs (QTN), qui contribuent à la variation quantitative peuvent être identifiées. Un domaine actif nouvellement émergent - la cartographie fonctionnelle, a montré sa valeur pour démêler la machinerie génétique des traits dynamiques au niveau QTL ou QTN qui modifient leurs phénotypes avec le temps ou d'autres variables. La cartographie fonctionnelle fournit un cadre quantitatif pour tester l'interaction entre les effets génétiques et la formation et le développement de traits et, par conséquent, appelle à pousser l'analyse et la modélisation génétiques statistiques dans le contexte de la biologie du développement. Certaines des méthodes statistiques de cartographie génétique ont été brevetées.

Brevets récents sur la nanotechnologie

Titre: Modélisation de l'architecture génétique de caractères complexes avec des marqueurs moléculaires

LE VOLUME: 1 PROBLÈME: 1

Auteurs):Rongling Wu, Wei Hou, Yuehua Cui, Hongying Li, Tian Liu, Song Wu, Chang-Xing Ma et Yanru Zeng

Affiliation :Département de statistique, Université de Floride, Gainesville, FL 32611 États-Unis.


2 Comment devons-nous comprendre la causalité ?

Une grande partie de la littérature philosophique classique sur la causalité s'est concentrée sur la question fondamentale de ce qui compte comme cause, c'est-à-dire quelles conditions une relation doit satisfaire pour être qualifiée de relation de cause à effet. Les préoccupations centrales sont de savoir si la causalité peut être analysée de manière non circulaire, en termes de notions qui ne présupposent pas la causalité, ou quelles sont les relations de causalité. [ 2 ] La plupart de ces travaux ne sont pas immédiatement utiles pour des problèmes scientifiques spécifiques tels que ceux dont traite cette collection d'articles.

Au cours des dernières décennies, cependant, plusieurs nouveaux cadres de réflexion sur la causalité ont été développés et sont directement applicables dans notre contexte. Un exemple clé est l'approche de modélisation causale développée dans Spirtes et al., [ 3 ] qui fournit des outils formels pour déduire statistiquement des modèles causaux à partir de données. Une approche connexe dérive de la modélisation par équation structurelle, [ 4 ] et inclut le cadre interventionniste de Woodward [ 5 ] (voir également la réf. [ 6 ]). Nous nous concentrerons ici sur l'approche de Woodward.

L'approche interventionniste repose sur l'idée que les relations causales, contrairement aux simples corrélations statistiques, peuvent être exploitées à des fins de manipulation et de contrôle. Pour deux variables X et Oui pour être causalement lié, il doit exister une certaine intervention sur X qui change la valeur de Oui dans une gamme de conditions de fond. [ 5 ] Une intervention sur un gène - via des perturbations de surexpression, knock-down ou knock-out - entraîne souvent un changement phénotypique correspondant. À titre d'exemple classique de la génétique du développement, si nous supprimions une copie du gène de la brachyurie du génome d'une souris, cela entraînerait une réduction de la longueur de la queue et des défauts des vertèbres sacrées si nous supprimions les deux copies, cela conduirait à la létalité embryonnaire. [ 7 ] De telles déclarations « si-alors » concernant ce qui se produirait dans diverses conditions possibles sont appelées conditionnelles contrefactuelles ou contrefactuelles.

L'interventionnisme est considéré comme un type de « théorie contrefactuelle » de la causalité, [ 8-10 ] parce que les relations entre les variables qui sont manipulables au sens interventionniste génèrent de véritables énoncés contrefactuels. Les conceptions contrefactuelles de la causalité interprètent les causes comme des facteurs de différence. [ 8 ] Le contrefactuel suivant — si X n'avait pas eu la valeur X1, alors Oui n'aurait pas eu la valeur oui1- affirme que la valeur de X fait une différence dans la valeur de Oui. En biologie, les théories contrefactuelles ont été plus productives que les premiers comptes rendus de causalité basés sur des régularités/lois, [ 11, 12 ] ou le transfert de matière ou d'énergie. [ 13-15 ] Il existe peu de lois strictes, voire aucune, en biologie, et il n'est ni pratique ni souhaitable de toujours tracer des processus biologiques complexes en termes de flux dans les unités physiques sous-jacentes.


RÉSULTATS

Reconstruction de la carte génétique et QTL de semence pour M × N RIL

Une population RIL dérivée des génotypes parentaux de soja Minsoy et Noir 1 a été utilisée dans cette étude. Des études antérieures impliquant cette population M × N RIL reposaient sur des cartes génétiques construites à partir de données de marqueurs de polymorphisme de longueur de séquence simple et de fragments de restriction ( Lark et al., 1995 Mansur et al., 1993 ). Pour augmenter la précision de cette étude cartographique, nous avons obtenu des données de marqueurs SNP à partir de 1536 loci à travers le génome du soja séquencé ( Schmutz et al., 2010 ) et reconstruit une carte génétique du soja de 2500 cM à partir de 557 marqueurs (Suppl. Tableau S1) qui ont été trouvés pour séparer au sein de la population M × N RIL. Vingt-quatre LG avec une distance intermarqueur moyenne de 4,7 cM (Tableau S2 suppl.) ont formé la carte génétique de cette population, en utilisant la séquence du génome du soja ( Schmutz et al., 2010 ) pour l'alignement des marqueurs de référence.

Plusieurs QTL pour la composition des graines ont été identifiés dans les M × N RIL ( Lark et al., 1994 Mansur et al., 1993 Orf et al., 1999 ). Les plants de soja du génotype Minsoy produisent généralement des graines jaunes plus riches en huile et moins riches en protéines que le génotype Noir 1 à graines noires. Dans les essais au champ de 1992 à 2002, la teneur moyenne en huile des graines était de 17,43 ± 1,03 % de Minsoy et de 15,29 ± 0,34 % de Noir 1. Pour ces mêmes essais, la teneur moyenne en protéines des graines était de 35,16 ± 0,15% de Minsoy et de 37,35 ± 0,84 % de Noir 1. Au sein des RIL M × N, la teneur moyenne en huile des graines variait de 13,64 à 19,20 %. La teneur moyenne en protéines des graines dans les RIL M × N variait de 31,14 à 38,24 %. Nous avons calculé les positions des QTL sur la base de la carte génétique nouvellement affinée à l'aide de données sur l'huile de graines et les protéines collectées sur une période de deux décennies (tableau S3 supplémentaire).

Les analyses combinées des QTL de graines pour les M × N RIL ont mis en évidence un QTL pour l'huile de graines sur Chr 8 et deux QTL pour les protéines de graines sur Chr 4 et 6 qui ont été calculés pour expliquer 10 à 38% de la variation des caractères observée dans la population. L'existence de QTL d'huile de graine et de protéine coïncidents avec des effets alléliques opposés (Tableau Suppl. S3) pour le QTL sur Chr 6 et 8 confirme également la corrélation inverse qui a été observée entre ces caractères ( Brim et Burton, 1979 ). Sur la base de la carte génétique consensuelle (soybase.org, vérifiée le 13 décembre 2013) et des positions correspondantes des marqueurs SNP, les trois QTL semblent coïncider avec des preuves antérieures d'un QTL d'huile de graine ou de protéine dans le soja. L'intervalle QTL de protéine de graine sur Chr 4 coïncide avec le QTL de protéine de graine Prot 19-1 ( Stombaugh et al., 2004 ) et Prot 7-2 ( Orf et al., 1999 ). De même, la protéine de graine et l'huile QTL sur Chr 6 colocalisent avec l'huile 23-1 (Hyten et al., 2004), l'huile 4-6 et la protéine 21-3 (Kabelka et al., 2004) QTL de graine. Le QTL de l'huile et des protéines des graines sur Chr 8 coïncide avec les QTL des graines Oil 1-1 ( Mansur et al., 1993 ) et Prot 17–4 ( Tajuddin et al., 2003 ).

Accumulation de transcriptions de gènes à l'échelle du génome au cours de la maturation précoce des graines

En tant qu'évaluation initiale de la variation des caractères d'expression génique, Minsoy et Noir 1 ont été évalués pour les profils d'accumulation de transcrits de 30 681 gènes aux stades de maturation précoce et intermédiaire de la graine de soja en développement en utilisant l'ARN total traité pour l'hybridation avec la puce Affymetrix Soy. Un total de 200 gènes (Tableau Suppl. S4) se sont avérés être exprimés de manière significativement différentielle entre Minsoy et Noir 1 à un FDR de 5% et à un rapport de changement de deux ou plus. Les transcriptions des gènes impliqués dans la fonction de transport des lipides étaient parmi celles qui étaient exprimées de manière différentielle entre les deux génotypes.

Les données d'accumulation de transcription ont été recueillies à partir du stade de la graine verte immature (Suppl. Fig. S1, Suppl. Tableau S5) correspondant à la maturation précoce des graines au début de l'accumulation de réserve de 93 membres de la population M × N RIL. Il est intéressant de noter que les données d'accumulation de transcrits sur plus de 16 344 gènes ont soutenu une variation génétique non additive par ségrégation transgressive où les valeurs d'accumulation de transcrits géniques pour la population RIL s'étendaient au-delà de la plage des valeurs parentales. Des études antérieures ont signalé un phénomène similaire chez d'autres espèces ( Brem et Kruglyak, 2005 Hammond et al., 2011 Potokina et al., 2008 West et al., 2007 ). Au sein de la population M × N RIL, la ségrégation transgressive a décrit les schémas d'accumulation de transcrits de plus de 50 % des traits d'expression génique évalués au sein de la population. Des variations transgressives ont été précédemment observées pour les caractères reproducteurs, morphologiques et de semences, y compris le rendement en semences, évalué au sein de la population M × N RIL ( Mansur et al., 1993 ). Ces résultats contrastaient fortement avec le nombre de transcrits géniques (200) qui se sont avérés être exprimés de manière différentielle entre les parents Minsoy et Noir 1.

Détection des eQTL globaux dans la graine de soja immature

La cartographie d'intervalle composite a identifié 28 470 eQTL pour 15 568 gènes uniques exprimés dans la graine immature (Suppl. Fig. S1) de la population M × N RIL (Fig. 1A). De zéro à six eQTL ont été cartographiés pour chaque trait d'expression génique, et les scores LOD pour ces eQTL allaient de 3,38 à 89,37. Ces eQTL se sont avérés expliquer de quelques pour cent à presque 100 % de la variation observée dans un trait d'expression génique donné, cependant, la plage de variation attribuée s'est avérée se situer principalement entre 10 et 20 %. Une petite partie de l'eQTL cartographié (3824 ou 13,4%) a été classée comme cis-les régulateurs agissant en fonction de la proximité de l'emplacement physique du gène par rapport à la position génétique de l'eQTL, le reste de l'eQTL étant classé comme trans-les régulateurs agissant. Parce que ces eQTL n'ont pas encore été démontrés pour agir dans cis ou trans, ils peuvent être appelés de manière plus appropriée régulateurs locaux ou distants ( Rockman et Kruglyak, 2006 ), respectivement, mais les termes plus familiers cis-agir et trans-acting sont utilisés pour plus de clarté. Dans cette étude, l'eQTL d'un gène a été défini comme cis-agissant si le gène cartographié sur le même chromosome et était situé à moins de 1,575 Mb de l'emplacement physique du marqueur SNP près de l'eQTL. Cette distance était basée sur l'espacement intermarqueur moyen des marqueurs SNP utilisés pour la carte génétique. L'augmentation de la distance autorisée à 5 Mo ou 10 Mo a étendu le nombre de candidats cis-agissant eQTL à environ 19 ou 21% du nombre total d'eQTL. La proportion d'eQTL sur un chromosome donné qui s'est avérée être cis-le jeu variait de 10,5%, sur Chr 7, à 49,6%, sur Chr 3.

Loci de caractères quantitatifs d'expression à l'échelle du génome (eQTL) dans la graine immature de la population de soja de lignées consanguines recombinantes Minsoy × Noir 1. (A) Un nuage de points eQTL de l'emplacement physique des gènes dans le total des mégabases par rapport à l'emplacement génétique eQTL dans le total des centimorgans. Chaque point eQTL est codé par couleur pour représenter l'accumulation de transcrits régulée à la hausse par l'allèle Minsoy (rouge) ou l'allèle Noir 1 (bleu). Les flèches indiquent des exemples spécifiques de biais allélique. (B) La fréquence des eQTL mappés à chaque emplacement génétique est représentée graphiquement le long des 20 chromosomes du soja (Chr). Une ligne jaune en pointillé indique le seuil des points d'accès eQTL.

Modèles de régulation des gènes dans la graine de soja immature

Il a été observé qu'un certain nombre de loci génétiques contenaient significativement plus d'eQTL que prévu par une distribution aléatoire (Fig. 1B). Un seuil a été calculé sur la base du 95e centile du nombre maximal d'eQTL détectés à un locus donné lorsque 28 470 eQTL ont été répartis au hasard dans chaque intervalle. Les positions où le nombre de loci cartographiés a culminé au-dessus du seuil de 39 eQTL par locus génétique ont été identifiées et représentent des points chauds régulateurs putatifs de la transcription génique. Beaucoup d'entre eux ont été mappés à des positions adjacentes qui représentent probablement le même point chaud, et après avoir pris en compte le nombre de gènes par intervalle, 54 points chauds ont été considérés comme enrichis pour l'eQTL.

La position physique du gène et la position génétique des eQTL à l'échelle du génome pour chaque gène sont représentées sur un nuage de points eQTL (Fig. 1A). Cis-Les eQTL actifs sont représentés par la diagonale formée à travers le nuage de points eQTL. Tous les autres points du nuage de points représentent trans-agir eQTL. Le LOD moyen d'un cis-l'eQTL actif était plus élevé (11,65) que le LOD moyen d'un trans-eQTL par intérim (5,65) dans l'ensemble. Ce résultat confirme les rapports précédents selon lesquels cis-les eQTL actifs ont généralement un effet plus important (LOD plus élevé) que trans-eQTL dans les études pangénomiques ( Brem et Kruglyak, 2005 Brem et al., 2002 Drost et al., 2010 Keurentjes et al., 2007 Kirst et al., 2005 Morley et al., 2004 Schadt et al., 2003 Vuylsteke et al., 2005 West et al., 2007 ).

Dans l'ensemble, le nombre d'eQTL avec des effets alléliques influençant l'accumulation de transcrits dans les deux sens était approximativement égal, avec 50,18 % attribués à l'allèle Minsoy et 49,82 % à l'allèle Noir 1. Il était donc remarquable qu'un certain nombre de points chauds eQTL affichent un fort biais directionnel pour les effets alléliques d'un seul parent. Ce biais directionnel est illustré par les codes de couleur pour les effets alléliques sur la figure 1A. Sur Chr 12, par exemple, une ligne verticale de 147 eQTL cartographiés (rouge = Minsoy) au-dessus de la position génétique 1554 cM, par exemple, montre un biais directionnel pour l'allèle Minsoy (136 Minsoy, 11 Noir 1). Dans la direction opposée, à un autre point chaud eQTL sur Chr 8 à 1023 cM, un biais directionnel existe pour l'allèle Noir 1 (105 Noir 1, 20 Minsoy). Des exemples d'un tel biais directionnel ont été trouvés sur chaque chromosome.

Validation de l'ensemble de données eQTL mondial grâce à la cartographie eQTL des gènes impliqués dans la biosynthèse des flavonoïdes

La régulation transcriptionnelle de la voie de biosynthèse des flavonoïdes bien étudiée a lieu dans la graine immature. Lors de l'extraction de l'ensemble de données eQTL pour tous les gènes qui annotent la voie de biosynthèse des flavonoïdes dans la catégorie Gene Ontology, nous avons constaté que >20 % de l'eQTL identifié pour les gènes de cette voie (ajusté P valeur = 2,06 × 10 –4 ) mappé sur un intervalle Chr 8 (∼904 cM total, Fig. 2A, Suppl. Tableau S6). De plus, les eQTL des gènes de la voie de biosynthèse des flavonoïdes possédaient tous des effets additifs avec l'allèle Noir 1, le génotype avec la couleur de la graine noire (versus jaune). Parmi ces gènes, l'eQTL pour un seul gène candidat, le CHS1 gène (Glyma08g11610), a été identifié comme un cis-régulateur agissant. À l'aide d'une mesure quantitative de la pigmentation du tégument et de la carte génétique assemblée pour la population M × N RIL, un QTL de pigmentation du tégument a également été identifié sur l'intervalle Chr 8 (Suppl. Tableau S3) et représentait plus de 77% du tégument. trait de pigmentation (LOD > 40) (Fig. 2B). La position de ce QTL de pigmentation du tégument correspond à la localisation génomique d'un groupe répétitif de gènes CHS qui contrôle la pigmentation du tégument par la génération de petits ARN qui régulent à la baisse tous les membres de la famille des gènes CHS (Tuteja et al., 2009).

(A) Localisation des gènes par rapport aux loci de traits quantitatifs d'expression (eQTL) nuage de points de localisation génétique des eQTL pour les gènes annotant la voie de biosynthèse des flavonoïdes. Huit gènes impliqués dans la biosynthèse des flavonoïdes, en particulier les gènes de la chalcone synthase (CHS), cartographiés sur le locus du chromosome (Chr) 8 904 cM. Le Chr 8 cis-agir eQTL pour CHS1 a été identifié au locus inhibiteur pour la couleur du tégument. Chaque point eQTL est codé par couleur pour représenter l'accumulation de transcrits régulée à la hausse par l'allèle Minsoy (rouge) ou l'allèle Noir 1 (bleu). (B) Le QTL de pigmentation du tégument correspond à Chr 8 et colocalise avec le point chaud eQTL de la biosynthèse des flavonoïdes.

Régulation transcriptionnelle des gènes spécifiques aux semences

Pour identifier les points chauds eQTL spécifiques à la régulation des gènes des graines, des gènes qui accumulent des transcrits dans les seuls tissus des graines de soja ont été identifiés. Les données de séquençage de l'ARN (RNA-seq) ont été obtenues à partir de tissus de soja, notamment des graines, des coques de gousses, des feuilles, des fleurs, des racines et des nodules précédemment décrits dans un atlas d'expression des gènes du soja (Severin et al., 2010b) et combinés à des ARN non publiés. seq données d'une lignée proche-isogénique apparentée (séquence lire les données d'archives sous BioProject PRJNA208048). L'accumulation différentielle de transcrits géniques à partir de la paire de lignées quasi-isogéniques (HiPro et LoPro) a été décrite pour quatre stades de graines ( Bolon et al., 2010 ). HiPro est une lignée à haute teneur en protéines de graines et à faible teneur en huile de graines dont le génotype est presque identique à la lignée à faible teneur en protéines de graines et à haute teneur en huile de graines LoPro, à l'exception des régions d'introgression (Severin et al., 2010a) qui incluent le QTL principal de la protéine de graine LG I sur Chr 20 ( Bolon et al., 2010 ). Ici, les données des 14 tissus de soja (feuille, fleur, gousse, coquille [2 stades], graine [7 stades], racine et nodule) ont été utilisées pour les deux génotypes afin d'identifier les gènes avec une expression spécifique à la graine. Les eQTL pour ces gènes spécifiques aux graines ont été mis en évidence à partir de l'ensemble de données eQTL global (Suppl. Tableau S7). Des grappes de gènes eQTL spécifiques aux graines ont été trouvées aux points chauds sur Chr 20 (2498 cM total, figure 3A) et Chr 13 (1627 cM total, figure 3A). L'emplacement de ces points chauds eQTL spécifiques aux graines ne correspondait pas au point chaud eQTL avec le plus grand nombre d'eQTL (Chr 7, Fig. 1B) ou au hotspot eQTL pour la biosynthèse des flavonoïdes (Chr 8, Fig. 2A).

(Page précédente) Régulation des gènes spécifiques à la graine et de la voie de la graine à trois points chauds de loci de caractère quantitatif d'expression (eQTL). Chaque point eQTL est codé par couleur pour représenter l'accumulation de transcrits régulée à la hausse par l'allèle Minsoy (rouge) ou l'allèle Noir 1 (bleu). Les flèches colorées mettent en évidence les points chauds eQTL indiqués. A) Un nuage de points eQTL pour les gènes spécifiques aux graines montre un enrichissement des eQTL spécifiques aux graines qui colocalisent à un point chaud eQTL sur le chromosome (Chr) 20 et un autre sur Chr 13. B) Un nuage de points eQTL pour les gènes de photosynthèse révèle des points chauds eQTL sur Chr 7, 13 et 20. C) Un nuage de points eQTL pour les gènes qui annotent la biosynthèse des acides gras montre deux loci principaux enrichis en eQTL des gènes de biosynthèse des acides gras sur Chr 20 et Chr 7. D) La cartographie des eQTL pour les gènes d'oléosine montre que la majorité des gènes de l'oléosine sont influencés à l'un des deux loci, Chr 20 ou Chr 13, également avec des effets directionnels. Le point d'accès eQTL sur Chr 20 est commun à tous les ci-dessus. L'accumulation de transcrits de gènes avec eQTL dans ces catégories est principalement régulée à la hausse avec l'allèle Noir 1 aux points chauds eQTL Chr 7 et Chr 13 alors qu'elle est régulée à la hausse avec l'allèle Minsoy au point chaud eQTL Chr 20.

Régulation transcriptionnelle des voies fonctionnelles spécifiques des semences

Les gènes avec eQTL au hotspot eQTL spécifique aux graines (2498 cM au total) sur Chr 20 ont été examinés pour l'enrichissement dans des catégories fonctionnelles spécifiques. Sur la base des annotations de Gene Ontology, les catégories les plus enrichies du hotspot Chr 20 étaient pour la photosynthèse (ajustée P valeur = 4,65 × 10 –16 ) et le processus de biosynthèse des acides gras (ajusté P valeur = 7,1 × 10 –8 ) (Fig. Suppl. S2). Les eQTL pour tous les gènes avec des annotations de processus de photosynthèse ou de biosynthèse des acides gras ont ensuite été mis en évidence. Les eQTL du gène de la photosynthèse se sont regroupés dans trois régions du génome, y compris les points chauds sur Chr 7, 20 et 13 (Fig. 3B, Suppl. Tableau S8). Des points chauds pour les eQTL des gènes de biosynthèse des acides gras ont été trouvés sur Chr 20 et 7 (Fig. 3C, Suppl. Tableau S9 et S10). L'examen du hotspot sur Chr 7 a également montré qu'il était enrichi en eQTL du gène de la photosynthèse (ajusté P valeur = 3,5 × 10 –30 ) (Fig. S3). Il est à noter que la majorité des gènes spécifiques aux graines, à la photosynthèse et à la biosynthèse des acides gras avec eQTL mappés au point chaud sur Chr 20 (∼2498 cM) ont montré une régulation à la hausse de l'accumulation de transcrits avec la présence de l'allèle Minsoy (Fig. 3A- 3C, fig.S4-S5, tableaux S7-S9) supplémentaires malgré l'existence de plus d'eQTL de l'effet Noir 1 (137 versus 132) à ce locus. Étonnamment, huit eQTL pour les gènes d'oléosine ont également été spécifiquement mappés à cet intervalle sur Chr 20 (Fig. 3D, Suppl. Tableau S9). L'expression de ces gènes d'oléosine a été régulée à la hausse avec la présence de l'allèle Minsoy, le génotype avec une teneur plus élevée en huile de graines ( Orf et al., 1999 ), conformément aux preuves que les graines avec une teneur en huile plus élevée possèdent plus d'oléosines ( Parthibane et al., 2012a Siloto et al., 2006).

Régulation à multiples facettes de l'expression des gènes des semences et relations avec les points chauds eQTL

Des modèles complexes de biais directionnel ont été observés pour les gènes régulés par plusieurs eQTL. Nous avons créé un réseau (Fig. 4, Suppl. Tableau S11) à partir des données eQTL pour observer les connexions entre les trois points chauds eQTL sur Chr 20, 7 et 13 (Fig. 3) avec des gènes pour des voies fonctionnelles de semences spécifiques regroupés à ces points chauds. La majorité de ces gènes avec eQTL au hotspot Chr 20 se sont avérés être régulés à la hausse par l'allèle Minsoy au hotspot Chr 20 (Fig. 4, Suppl. Tableau S11). En revanche, la majorité de ces gènes avec eQTL aux points chauds Chr 7 et 13 se sont avérés être régulés à la hausse par l'allèle Noir 1 aux loci respectifs. Il est à noter que des modèles de biais directionnels opposés ont été observés pour certains gènes régulés par plus d'un eQTL. Un exemple de ce phénomène impliquait un sous-ensemble de gènes avec une cartographie eQTL sur l'intervalle cM total ∼2493 à 2498 sur Chr 20 et ∼797 cM sur Chr 7 (Fig. 4, Suppl. Fig. S5, Suppl. Tableau S12). Ce réseau a montré que les niveaux de transcription pour un sous-ensemble de gènes sont régulés à la hausse avec la présence de l'allèle Minsoy au locus 2493, et les niveaux de transcription des mêmes gènes ont été régulés à la hausse avec la présence de l'allèle Noir 1 au locus 797. Les gènes avec des niveaux de transcription régulés à la hausse avec l'allèle Minsoy comprenaient un certain nombre de gènes liés à la photosynthèse, y compris des gènes pour les plastocyanines, PsaN (Sous-unité du centre de réaction du photosystème I PSI-N), PsaF (Photosystème I sous-unité F), et LHCB3 et LHCB5 (protéines de fixation de la chlorophylle récoltant la lumière). Régulation à la hausse des niveaux de transcription pour les gènes liés à la biosynthèse des acides gras, y compris FAH1 (Hydroxylase d'acide gras 1) et MOD1 (Mosaic Death 1), une sous-unité de la protéine porteuse énoyl-acyl (ACP) réductase d'un complexe qui catalyse la synthèse de novo des acides gras ( Mou et al., 2000 ) correspondait également à la présence de l'allèle Minsoy. De plus, les 12 eQTL mappés sur l'intervalle de 2493 à 2498 cM pour les transcrits des gènes de biosynthèse des acides gras ont été régulés à la hausse avec la présence de l'allèle Minsoy, tandis que les neuf eQTL qui se sont mappés sur le locus 797 cM pour les gènes de biosynthèse des acides gras ont été régulés à la hausse avec la présence de l'allèle Noir 1. Ces résultats sont cohérents avec la présence d'une teneur en huile de graines plus élevée chez le parent Minsoy par rapport au parent Noir 1 et le rôle de la photosynthèse et de la biosynthèse des acides gras dans l'accumulation d'huile de graines.

Connexions entre trois principaux points chauds de loci de traits quantitatifs d'expression (eQTL) impliqués dans les principaux processus spécifiques aux semences et aux semences. Une représentation du réseau décrit les interactions entre la photosynthèse, la biosynthèse des acides gras (FA), l'oléosine et d'autres gènes spécifiques aux graines avec des eQTL partagés représentés séparément dans la figure 3. Le tableau supplémentaire S8 affiche les données de gènes et d'eQTL représentées dans ce diagramme. Les nœuds gris en haut représentent les trois principaux points chauds eQTL aux loci sur les chromosomes (Chr) 7 (∼797 cM total), 13 (∼1627 cM total) et 20 (2493–2498 cM total). Nœuds verts = gènes de photosynthèse. Noeuds roses = gènes de biosynthèse des acides gras. Noeuds oranges = gènes d'oléosine. Noeuds jaunes = gènes spécifiques aux graines autres que les gènes de l'oléosine. Les connexions pour les gènes avec une accumulation de transcrits régulée à la hausse par la présence de l'allèle Minsoy sont représentées par des lignes rouges. Les connexions pour les gènes avec une accumulation de transcrits régulée à la hausse par la présence de l'allèle Noir1 sont représentées par des lignes bleues. Les lignes ondulées indiquent les gènes qui sont à l'intérieur cis-distances d'action du locus hotspot.

Gènes candidats réglementaires au hotspot eQTL de la graine du chromosome 20

Deux eQTL ont été trouvés candidats cis-régulateurs agissant sur les 269 eQTL au locus 2498 (Suppl. Tableau S9) : un des gènes de l'oléosine (Glyma20g33850) et un BME3 (Blue Micropylar End 3) gène du facteur de transcription GATA (motif de liaison à l'ADN) (Glyma20g32050). Bien que plusieurs gènes de l'oléosine existent dans le soja, le gène de l'oléosine Glyma20g33850 aligné avec la plus grande homologie avec le OLE3 (Oléosine 3) gène dans l'arachide (Arachis hypogée L.). Il a récemment été démontré que l'oléosine 3 de la graine d'arachide immature possède une activité enzymatique de biosynthèse du diacylglycérol et d'hydrolyse de la phosphatidylcholine qui fournit des preuves d'un rôle direct dans l'augmentation de la teneur en huile par la biosynthèse du triacylglycérol à partir du monoacylglycérol (Parthibane et al., 2012a). Séquençage de la BME3 Le gène du soja dans les génotypes Minsoy versus Noir 1 a révélé des polymorphismes de séquence correspondant à des mutations faux-sens dans quatre acides aminés (T→A, Q→L, V→F, S→T) conservés entre les facteurs de transcription du soja et Arabidopsis BME3. Le motif de reliure pour BME3, WGATAR, a également été trouvé dans les régions promotrices de 251 des 257 gènes avec une cartographie eQTL vers le locus 2498.

L'examen des 319 gènes situés au point chaud Chr 20 eQTL a montré qu'il n'y avait que huit gènes spécifiques aux graines et 34 gènes de facteurs de transcription à cet endroit. Les données d'accumulation de transcrits géniques à partir de profils ARN-seq compilés à partir de lignées quasi-isogéniques HiPro et LoPro avec une teneur en protéines et en huile de graines contrastées ( Bolon et al., 2010 Severin et al., 2010b ) montrent que le gène spécifique à la graine avec l'expression la plus élevée à ce locus se trouve le gène de l'oléosine Glyma20g33850 (Fig. 5A, Suppl. Tableau S13). De plus, l'accumulation de transcrits géniques était la plus élevée dans le génotype avec une teneur en huile de graines plus élevée (LoPro, Fig. 5B, Suppl. Tableau S13). Parmi les gènes de facteurs de transcription à ce locus, l'accumulation de transcrits pour le BME3 gène du facteur de transcription Glyma20g32050 était également la plus élevée, avec une accumulation globale de transcrits légèrement plus élevée dans le génotype LoPro (Fig. 5C, Suppl. Tableau S13). Des niveaux élevés d'expression génique ont mis en évidence ces deux gènes parmi les 319 gènes montrés comme résidant au point chaud Chr 20 eQTL dans le génome du soja de référence. De plus, ces deux mêmes gènes (Glyma20g33850 et Glyma20g32050) étaient les seuls gènes de ce locus avec un eQTL de graine dans les RIL M × N qui correspondaient au locus eQTL Chr 20.

Preuve du séquençage de l'acide ribonucléique (ARN-seq) pour les gènes situés au point chaud des loci du trait quantitatif d'expression (eQTL) sur le chromosome (Chr) 20. (A) Le oui l'axe montre le nombre de RPKM (lectures par kilobase de transcrit par million de lectures cartographiées) d'ARN-seq pour chaque tissu représenté par une barre colorée. Les gènes spécifiques à la graine au locus sont montrés à travers le X axe avec des barres colorées représentant les différents stades de germination. Huit gènes spécifiques aux graines résident à ce locus, et le gène spécifique aux graines avec la preuve la plus élevée d'accumulation de transcrits est le gène de l'oléosine Glyma20g33850. (B) Le oui l'axe montre les comptes RPKM RNA-seq pour chaque génotype (LoPro = Red, HiPro = Blue) représentés par une barre colorée. Les X L'axe montre une chronologie des stades de développement des graines. Transcript accumulation of Glyma20g33850 is higher in LoPro than HiPro during seed development. (C) The oui axis shows RNA-seq RPKM counts for each tissue represented as a colored bar (leaf, flower, pod, shell [stages –1 and –2], seed [stages –2, –1, 0, 1, 2, 3, 4], root, and nodule tissues). Transcription factor genes at the locus are shown across the X axe. The transcription factor gene at this locus with the greatest evidence for transcript accumulation is the GATA (DNA binding motif) gene Glyma20g32050. Supplemental Table S13 shows the RNA-seq read evidence for genes in this region in LoPro vs. HiPro across this range of tissues.

EQTL that Colocalize with Seed Phenotypic QTL

To identify other potential genes and pathways that correlate with seed oil and protein accumulation in the immature seed, we also examined eQTL for colocalization with seed oil and protein QTL locations mapped in the M × N RIL population. Expression QTL for 1598 unique genes were found to map to seed oil and protein QTL intervals in this population (Suppl. Fig. S6, purple bars represent seed QTL intervals from Suppl. Table S3). A list of 129 unique genes with cis-acting eQTL that colocalized to the region of a seed protein or oil QTL was compiled and included genes with lipid-associated annotations (Suppl. Table S14). UNE cis-acting eQTL that overlaps an oil QTL on Chr 8 was also mapped for a gene with homology to the COMATOSE (CTS) ATP-binding cassette (ABC) transporter gene in Arabidopsis.


Mapping trigenic interactions quantitatively and surveying the global trigenic landscape

To explore the trigenic interaction landscape, we designed query strains that sampled three key quantitative features of our global digenic interaction network (7). We designed query strains carrying mutations in two genes spanning a range of the following features: (1) digenic interaction strength, (2) number of digenic interactions (average digenic interaction degree), and (3) digenic interaction profile similarity (Fig. 1A and table S1). Gene pairs were selected to fill bins of varying digenic interaction attributes and to cover all major biological processes in the cell, thus producing a sample that would provide a diverse survey of the trigenic interaction landscape. We largely focused on unambiguous singletons because duplicated genes represent a relatively small subset of genes and thus can only represent a small fraction of the global trigenic interaction network. For this survey, we constructed 151 double-mutant query strains and 302 single-mutant strains, encompassing 47 temperature-sensitive alleles of different essential genes and 255 deletion alleles of nonessential genes. The query strains in this set were selected to span the different digenic attribute bins according to predefined thresholds (table S1). An additional 31 double-mutant queries fell outside of the defined thresholds but were included for validation and comparison purposes (data S1 to S3) (16). The fitness of the resulting query strains was measured using a quantitative growth assay, and the behavior of the single- and double-mutant query strains showed strong agreement with our previously published data set (figs. S1 and S2 and data S4) (7, 15).

(UNE) Criteria for selecting query strains for sampling trigenic interaction landscape of singleton genes in yeast. The gene pairs were grouped into three general categories based on a range of features: (1) Digenic interaction strength. Gene pairs were directly connected by zero to very weak (digenic interaction score: 0 to –0.08, m = 74 strains), weak (–0.08 to –0.1, m = 32), or moderate (<–0.1, m = 45) negative digenic interactions. (2) Number of digenic interactions. Gene pairs had a low (10 to 45 interactions, m = 50), intermediate (46 to 70, m = 53), or high (>71, m = 48) average digenic interaction degree (denoted by the number of black edges of each node). (3) Digenic interaction profile similarity. Gene pairs had low (score: –0.02 to 0.03, m = 46 represented by genes A and B, which show a relatively low overlap of genetic interactions with genes K to R), intermediate (0.03 to 0.1, m = 59 represented by genes C and D, which display an intermediate overlap of genetic interactions), or high (>0.1, m = 46, represented by genes E and F, which display a relatively high level of overlap of genetic interactions) functional similarity, as measured by digenic interaction profile similarity and coannotation to the same GO term(s). Query mutant genes were either nonessential deletion mutant alleles (Δ) or conditional temperature-sensitive (ts) alleles of essential genes. (B) Diagram illustrating the triple-mutant SGA experimental strategy. To quantify a trigenic interaction, three types of screens are conducted in parallel. To estimate triple-mutant fitness, a double-mutant query strain carrying two desired mutated genes of interest (red and blue filled circles) is crossed into a diagnostic array of single mutants (black filled circle). Meiosis is induced in heterozygous triple mutants, and haploid triple-mutant progeny is selected in sequential replica pinning steps. In parallel, single-mutant control query strains are used to generate double mutants for fitness analysis. (C) Triple-mutant SGA quantitative scoring strategy. The top equation shows the quantification of a digenic interaction, where εje is the digenic interaction score, ƒje is the observed double-mutant fitness, and the expected double-mutant fitness is expressed as the product of single-mutant fitness estimates ƒje??j. In the bottom equation, the trigenic interaction score (τijk) is derived from the digenic interaction score, where ƒijk is the observed triple-mutant fitness and ƒje??j??k is the triple-mutant fitness expectation expressed as the product of three single-mutant fitness estimates. The influence of digenic interactions is subtracted from the expectation, and each digenic interaction is scaled by the fitness of the third mutation.

Trigenic interaction screening required development and implementation of three operational components. First, synthetic genetic array (SGA) analysis—an automated form of yeast genetics that is often used to cross a query gene mutation into an array of single mutants to generate a defined set of haploid double mutants (6)—was adapted such that a double-mutant query strain could be crossed into an array of single mutants to generate triple mutants for trigenic interaction analysis (Fig. 1B). Because the identification of a trigenic interaction requires comparison with the corresponding double mutants, we also conducted screens in which the individual mutants of the query gene pair were scored for digenic interactions (Fig. 1B). Second, for experimental feasibility, we assembled a diagnostic array of 1182 strains, comprising 990 nonessential gene deletion mutants and 192 essential gene mutants carrying temperature-sensitive alleles, which combine to span

20% of the yeast genome (data S5). The diagnostic array was designed to be highly representative of the rest of the genome in terms of exhibited genetic interaction profiles (fig. S3). Briefly, array strains were selected from a larger genetic interaction data set for their ability to represent different regions of the global network in a minimally redundant way. This was accomplished by iteratively selecting strains to maximize the performance of profile similarities when predicting coannotations to a functional gold standard (17). Third, we developed a scoring method, the τ-SGA score, which combines double- and triple-mutant fitness estimates derived from colony size measurements to identify trigenic interactions quantitatively (Fig. 1C). The τ-SGA score differs from the MinDC score reported previously (18), because it accounts for all cases in which two of the genes are not independent, resulting in an expectation that contains digenic interaction effects scaled by the fitness of the noninteracting genes (fig. S4) (16). The final trigenic τ-SGA interaction score then accounts for digenic effects but also enables detection of trigenic interactions in which digenic effects of insufficient explanatory power can be found.

We focused exclusively on the analysis of deleterious negative trigenic interactions for two reasons. First, quantitative scoring of negative genetic interactions is often more accurate than that for positive interactions because there is a greater signal-to-noise ratio for negative genetic interactions. Hence, negative genetic interactions are associated with lower false-positive and false-negative rates than positive interactions (8), a feature that is important for the robust statistical analysis necessary to differentiate true trigenic interactions from the extensive background digenic network. Second, negative digenic interactions are generally more functionally informative than positive digenic interactions (8), and thus the large-scale mapping of a negative trigenic interaction network is expected to provide the most mechanistic insight into gene function and pathway wiring.


The Jones Lab

We study the evolution of complex traits by simulating phenotypes determined by multiple loci and environmental effects. These traits harbor genetic variation, which is critical for evolution to occur. The genetic variance is often summarized in a matrix, called the g-matrix, which contains additive genetic variances and additive genetic covariances. Les g-matrix describes the genetic architecture of complex traits. The Jones Lab, in collaboration with Steve Arnold (Oregon State University) and Reinhard Bürger (University of Vienna), has been using individual-based simulations to study the evolution of the genetic architecture (and other related issues).

The software we have used for our papers is freely available on GitHub. To learn more about these packages, consult our program note:

Jones, A. G., R. Bürger, and S. J. Arnold. 2018. The g-matrix simulator family: software for research and teaching. Journal of Heredity 109:825-829.

To write your own g-matrix simulation software, consult Adam Jones’ book:

C++ for Biologists: Evolutionary Models

(A free pdf is available here, or a hard copy can be purchased from Amazon)

Here is a summary of the available software packages:

G-matrix Simulator 2014: A Windows-based simulator that contains the code to produce the results reported by Jones et al. 2003, 2004 and 2012. This simulator has a graphical user interface and only works on Windows-based machines. Relevant papers:

Jones, A. G., S. J. Arnold, and R. Bürger. 2003. Stability of the G-matrix in a population experiencing pleiotropic mutation, stabilizing selection, and genetic drift. Evolution 57:1747-1760.

Jones, A. G., S. J. Arnold, and R. Bürger. 2004. Evolution and stability of the G-matrix on a landscape with a moving optimum. Evolution 58:1639-1654.

Jones, A. G., R. Bürger, S. J. Arnold, P. A. Hohenlohe, and J. C. Uyeda. 2012. The effects of stochastic and episodic movement of the optimum on the evolution of the G-matrix and the response of the mean to selection. Journal of Evolutionary Biology 25:2210-2231.

G-matrix Home Version: This version of the simulator is similar to the 2014 version under the hood, but it has been streamlined to make it more usable in an instructional setting. This version is used in the Evolutionary Quantitative Genetics Workshop offered by Steve Arnold and Joe Felsenstein every summer.

G-matrix Command Line: A version of the simulator without a graphical user interface. The source code should compile for any operating system with a standard C++ compiler.

Local Adaptation and Epistasis: With this simulator, we explored the effects of pleiotropy and epistasis on the evolution of local adaptation. We also investigated the feasibility of detecting the loci affecting the trait in genome-wide scans of population differentiation. The results of this study are reported in the following paper:

Jones, A. G., S. J. Arnold, and R. Bürger. 2019. The effects of epistasis and pleiotropy on genome-wide scans for adaptive outlier loci. Journal of Heredity, in press.


Book Recommendation: Complex Traits and Complex Genetic Architecture - Biology

The research interest of our group is to understand the genetic architecture of complex quantitative traits important to modern agriculture, environmental quality, evolutionary biology, and biomedicine. We study fundamental genetic processes that underlie phenotypic variation and evolution across time and space scales and functional signals. The extraordinarily high complexity of such genetic processes has prompted and intrigued us to develop powerful experimental designs and statistical models for dissecting their underlying mechanisms with the aid of analytical tools from other disciplines, such as control theory and game theory.

In nature, no cell or organism can grow in isolation. Instead, they exist with other interacting members in a community or ecosystem. We have incorporated evolutionary game theory to model how such ecological interactions affect the phenotypic formation of any individual in a population. Mathematical equations have been established to quantify the independent growth of an individual (i.e., growth by assuming that it is in isolation) and its interactive growth with other conspecifics in the shared environment. Our group is interested in developing game-theoretic models for mapping ecological QTLs that mediate independent growth vs. interactive growth through competition and collaboration. These models are being generalized to ecological interactions that take place at a wide range of levels of organization from proteins and RNA to cells to complex organisms.

We have always enjoyed generating aggressive ideas for our genetic and genomic research. On one hand, we have developed new theory, designs, and methods simulated from the latest discoveries of quantitative genetics and biology, which are used for next-level hypothesis tests by other researchers. On the other hand, established theoretical ideas are further used to design new experiments and collect new experimental data from which to gain new insight into various genetic processes.

The Liu Lab

Statistical Genetics: We are interested in developing novel statistical methods and computational tools for analyzing large scale genomic datasets. We have developed methods for analyzing rare variant association studies using sequence data, approaches for integrating multiple omics datasets, as well as efficient tools for large scale data analysis. Our methods and tools are being actively applied in hundreds of genetic studies worldwide.

Addition Genetics: We are actively pursuing a better understanding on the genetic basis for nicotine addiction. To do so, we seek to aggregate very large datasets on tobacco use phenotypes (in collaboration with the GSCAN consortium), integrate phenotypes of nicotine metabolites, smoking topography and tobacco use (in collaboration with TCORS at Penn State), and develop powerful and scalable methods that enable these analyses.

Functional Biology of X-inactivation We aim to understand the genetic regulation of X-inactivation using integrative genomics approach and apply these methods to study lupus genetics.


Résumé

Core Ideas

  • Functional mapping uncovers the genetic architecture of shoot growth dynamics.
  • Gibberellic acid is an underlying component for natural variation for shoot growth dynamics in rice.
  • Genomic prediction is effective for improving early growth dynamics.

Early vigor is an important trait for many rice (Oryza sativa L.)-growing environments. However, genetic characterization and improvement for early vigor is hindered by the temporal nature of the trait and strong genotype × environment effects. We explored the genetic architecture of shoot growth dynamics during the early and active tillering stages by applying a functional modeling and genomewide association (GWAS) mapping approach on a diversity panel of ∼360 rice accessions. Multiple loci with small effects on shoot growth trajectory were identified, indicating a complex polygenic architecture. Natural variation for shoot growth dynamics was assessed in a subset of 31 accessions using RNA sequencing and hormone quantification. These analyses yielded a gibberellic acid (GA) catabolic gene, OsGA2ox7, which could influence GA levels to regulate vigor in the early tillering stage. Given the complex genetic architecture of shoot growth dynamics, the potential of genomic selection (GS) for improving early vigor was explored using all 36,901 single-nucleotide polymorphisms (SNPs) as well as several subsets of the most significant SNPs from GWAS. Shoot growth trajectories could be predicted with reasonable accuracy using the 50 most significant SNPs from GWAS (0.37–0.53) however, the accuracy of prediction was improved by including more markers, which indicates that GS may be an effective strategy for improving shoot growth dynamics during the vegetative growth stage. This study provides insights into the complex genetic architecture and molecular mechanisms underlying early shoot growth dynamics and provides a foundation for improving this complex trait in rice.

Abréviations

E arly vigor , defined as a plant's ability to accumulate shoot biomass rapidly during early developmental stages, is critical for stand establishment, resource acquisition, and, ultimately, yield. The rapid emergence of leaves leads to early canopy closure, which reduces soil evaporation, thereby improving seasonal water use efficiency and conserving water for later vegetative growth and grain production. In rice, early vigor is a particularly important trait for regions where rice is direct seeded ( Mahender et al., 2015 ). As the cost of labor rises, a shift from the labor-intensive practice of transplanted rice to direct-seeded rice is the expected solution to solve this problem ( Mahender et al., 2015 ).

Several studies have examined seedling vigor in rice and elucidated the underlying genetic basis using conventional phenotyping strategies under field and greenhouse conditions ( Redoña and Mackill, 1996 Lu et al., 2007 Cairns et al., 2009 Rebolledo et al., 2012a 2012b , 2015 Liu et al., 2014 ). In a recent study by Rebolledo et al (2015) , multiple vigor-related traits such as plant morphology and nonstructural carbohydrates were quantified in a rice diversity panel of 123 japonica varieties ( Rebolledo et al., 2015 ). The authors integrated multiple phenotypic metrics in a functional–structural plant model, called Ecomeristem, and performed GWAS mapping using phenotypic metrics and model parameters as trait values ( Luquet et al., 2012 Rebolledo et al., 2015 ). Such multitrait approaches provide a more comprehensive understanding of the biochemical and genetic basis of early vigor than conventional single trait approaches.

Early vigor is a function of time. The timing of developmental switches that initiate tiller formation and rapid exponential growth are a crucial component of this trait. However, despite this temporal dimension, most studies have assessed the genetic basis of early vigor at one or a few discrete time points ( Redoña and Mackill, 1996 Lu et al., 2007 Cairns et al., 2009 Rebolledo et al., 2012a 2012b , 2015 Liu et al., 2014 ). Such approaches are overly simplistic and may only provide a snapshot of the genetic determinants that cumulatively influence the final biomass. However, sampling for biomass at high frequencies over a developmental window for mapping populations using conventional destructive phenotyping approaches would require tens to hundreds of thousands of plants and be highly labor-intensive. With the advent of high-throughput image-based phenomic platforms, plants can be phenotyped nondestructively more frequently throughout their growth cycle to examine the temporal dynamics of physiological and morphological traits ( Berger et al., 2010 Golzarian et al., 2011 Busemeyer et al., 2013 Topp et al., 2013 Moore et al., 2013 Würschum et al., 2014 Hairmansis et al., 2014 Slovak et al., 2014 Yang et al., 2014 Honsdorf et al., 2014 Chen et al., 2014 Bac-Molenaar et al., 2015 ).

Mathematical equations that describe a developmental or physiological process can be applied to this high-resolution temporal data to describe temporal growth trajectories using mathematical parameters. Several models, such as logistic, exponential, and power-law functions, have been used to describe plant growth ( Paine et al., 2012 ). These approaches enhance the temporal resolution of phenotyping and, when combined with association or linkage mapping, improve the power to detect genetic associations for complex traits compared with traditional cross-sectional approaches ( Wu and Lin, 2006 Xu et al., 2014 Campbell et al., 2015 ). However, despite the recent advances in phenotyping technologies, the genetic basis of early growth dynamics in rice or other cereals remains largely unexplored.

Multiple and sometimes uncorrelated phenotypes determine the rate and extent of vegetative growth in crops. We hypothesize that capturing growth dynamics at a higher temporal resolution can help elucidate the genetic basis of this trait. To this end, we sought to examine the genetic architecture of temporal shoot growth dynamics during the early and active tillering stages (8–27 d after transplanting (DAT) and 19–41 DAT) in rice. A panel of ∼360 diverse rice accessions was phenotyped using a nondestructive image-based platform and temporal trends in shoot growth were modeled with a power-law function ( Zhao et al., 2011 ). We provide insights into the genetic basis of shoot growth by using GWAS analysis. The underlying molecular mechanisms were explored using RNA sequencing on a subset of the diversity panel during the early tillering stage. Genomic selection of the model parameters and daily estimates of shoot biomass suggest that GS may be an effective strategy for improving early vigor in rice.


Book Recommendation: Complex Traits and Complex Genetic Architecture - Biology

How does genetic variation impact phenotypic traits, both at the organismal and cellular level (including an emphasis on gene regulation)? What are the molecular pathways from genetic variation to cellular and organismal phenotypes? Why does so much of the genome contribute to the genetic basis of complex traits?

Our lab includes people trained in a variety of different fields using computational and experimental approaches to tackle these problems. We often work on problems where there are no off-the-shelf statistical methods. Thus, an important part of our work is in developing appropriate statistical and computational approaches that can yield new insights into biological data.

Useful links

Lab News

And welcome to our new PhD students Alyssa Fortier et Roshni Patel and new postdocs: Sahin Naqvi, Jeff Spence, Hakhamanesh Mostafavi et Clemens Weiss!

May: New papers include our latest work on understanding genetic architecture of complex traits (the "Omnigenic 2" paper) with Xuanyao Liu and Yang Li: [Link] and our paper with the Criswell, Marson and Greenleaf labs on the chromatin structure of immune cells (led by Diégo in our lab, with Michelle Nguyen and Anja Mezger): [Link] Congratulations to Diego, Xuanyao, Yang and the rest of the teams!

January: Bienvenue à Shaila Musharoff who is joining us this month!

Décembre: Farewell to David et Emilie! They will both be greatly missed. David will be starting his own lab at NY Genome Center, and Emily is taking her genomics expertise into the consulting world.

9/18/2018. News roundup:

Comings and goings:
August: Welcome to our new postdocs Jake Freimer et Yuval Simons!

Eilon took a job as one of the first scientists at the new firm Insitro, founded by Daphne Koller. Bon Voyage to Eilon!

Emilie defended her thesis! Congratulations Emily! She will stay in the lab through the end of the year to finish papers.

félicitations à Natalie et Ben, both lab alumni, on their lovely wedding.

July: Lab alumna Alexis Battle was awarded early tenure in Biomedical Engineering at Johns Hopkins. Wonderful news!

Juin: Hannah M received the Robert Baynard Textor award from the Department of Anthropology, for 'creativity in anthropology'. Well done, and well-deserved, Hannah!

May: Arbel graduated and moved to a postdoc position in Molly Przeworski's lab at Columbia. In August he and his wife Maya welcomed twin baby boys! Toutes nos félicitations! This is the third twin pair in the lab in the last 7 years. Is this a significant enrichment?

Jonathan's plenary talk from PEQG on the Omnigenic model (with Evan, Yang and Xuanyao) is online here.

March: Natalie graduated and moved to a position as a staff scientist at Ancestry. Congratulations Natalie! We miss you!

January: Kelley has moved to start her own lab in the Department of Genome Sciences at University of Washington. We are excited to follow her progress in Washington!

10/25/2017. News roundup:

October: ASHG: Natalie gave a well-received plenary talk to 7000 people on her side-project on conference gender dynamics and Nasa, Yang, Emily and David also gave very nice platform presentations. Well done everyone!

Mettre à jour: Nasa won ASHG's best student talk (for work with Melina Claussnitzer). Well done!!

We have several papers out or about to come out in journals: Eilon on using cfDNA to measure transplant rejection Yang and David on LeafCutter (splicing) Diégo on estimating cell types driving complex traits Arbel on NAGC in gene duplicates Jessica on triclosan and microbiomes (working with Ami's lab).

félicitations à Ziyue on her wedding!

September: Yang et Xun moved on to start their own labs. Bon voyage!!

félicitations à Harold who has been awarded a prestigious Hannah Gray postdoc-faculty fellowship from HHMI.

Juin: Bienvenue Nasa, Hannah and Margaret to the lab!

6/22/2017. News roundup for the last few months:

Juin: release of our perspective piece on the 'omnigenic' model of complex traits, with lead authors Evan Boyle et Yang Li [PDF Link]. Our paper stimulated a lot of discussion on social media and elsewhere, including Ed Yong's article in the Atlantic and in Stanford news.

May: Congratulations to 3 of our postdocs who have accepted assistant professor faculty positions for the coming academic year: Kelley Harris (U Washington, Genome Sciences), Yang Li (U Chicago, Genetic Medicine), and Xun Lan (Tsinghua U, Basic Medical Sciences).

Et Kelley also received a prestigious faculty transition award through the CASI program at Burroughs Wellcome Fund.

Natalie et Arbel received graduate fellowships from CEHG. Well done! Et Jonathan will become co-director of CEHG starting in June.

Diégo's paper on inferring cell types that drive disease is up on bioRxiv.

April: Kelley had a very nice paper building on striking results from her PhD work: Rapid evolution of the human mutation spectrum, out this month in eLife [Link].

Harold, Evan et David each have new papers out about their work with other labs: Sleuth [Harold] and Cas9 Binding [Evan] and ASE for detecting GxE [David].

March: Anand has moved to a data scientist position at Facebook. We'll miss his amazing technical expertise and informal contributions to many projects in the lab! Bon Voyage, Anand!

December 2016. Arbel et Anand's work on how recurrent mutation alters the site frequency spectrum in large samples is now out in PLOS Genetics: [Link]. Toutes nos félicitations!

Natalie had a fun article in which she applied computational methods to study the history of the journal La génétique since 1917 [Link]. [Timelapse plot of author locations]

Novembre. Yair, Evan, et Natalie's paper on SDS and polygenic adaptation: Detection of human adaptation during the past 2000 years is out now in Science [Link]. Toutes nos félicitations!

9/20/2016. Bienvenue à Harold Pimentel who joined the lab last month!

Aussi, Eilon has a paper out in Nature Genetics showing trans-interactions (i.e., trans-eQTLs) between MHC protein alleles and the expression of T cell receptor genes. With help from Leah Sibener and Chris Garcia we were able to interpret these in terms of physical interactions in the protein structure [Link]

6/1/2016. Lots of exciting news to report from April and May:

Anil's paper on using ribosome profiling data to detect novel open reading frames is now online at eLife [Link].

Xun's paper on the evolution of gene duplicates was published in Science [Link]. This received some nice attention, including in a blog post by Francis Collins.

Yair, Evan and Natalie's paper on very recent polygenic adapation is now out on bioRxiv [Link]. This got lots of attention, including news pieces in Nature and Science.

Yair et Yang both gave talks at Cold Spring's Biology of Genomes Meeting. It was also great to see talks from lab alumni Alexis Battle, Joe Pickrell et Dan Gaffney, and to get to hang out with many other colleagues, friends, and other lab alumni.

Here you can see a pair of great sketches of Yang and Yair, drawn by Alex Cagan.

4/28/2016. Well done Yang, whose paper RNA splicing is a primary link between genetic variation and disease is out today [Link]. This paper uses data from 7 years of joint projects between our lab and Yoav's lab to provide a detailed accounting of the links between genetic variation, variation in gene regulation and disease.

3/29/2016. Congrats to Evan (NSF predoc!). Also to Yang et David K on their Leafcutter paper on quantification of RNA splicing, out now on bioRxiv.

1/4/2016. Farewell and best wishes to Bryce (postdoc, Alkes Price lab, Harvard) and to Graham et Kyle, starting their own labs at the Salk Institute and UCSD, respectively.

11/20/2015. félicitations à Bryce for his masterful PhD defense in Chicago. It was a bittersweet occasion, marking the end of the U Chicago era.

9/14/2015. Bryce and Graham's WASP paper (QTL mapping with allele-specific reads) is out today in Nature Methods.

8/18/2015. We enjoyed a farewell dinner at the Counter on Friday for Audrey et Towfique (starting their own labs at U of Idaho and Mt Sinai, respectively). Bon voyage!

A big welcome to Kelley Harris et Ziyue Gao who are joining us as new postdocs from Rasmus Nielsen and Molly Przeworski's labs!

Welcome to short term visitor Dan Lawson and also Alexis Battle who is back to visit us briefly this month.

Congrats to Eilon and Michal on birth of their son Yuval!

In the grants department, well done to Kelley (NRSA), David G (EMBO/LLHF), Yang (CEHG), Jessica (NSF predoc)! And Natalie and Evan got a pair of internal research grants, one from Genetics and one from Systems Biology. Gloire.

5/22/2015. JKP nearly done teaching. Catching up on news: Congratulations to Graham who is taking a faculty job at the Salk Institute!!

And congratulations to Towfique who is taking a faculty job at Mt Sinai.

And more congrats to Yang who has been awarded a CEHG postdoc fellowship for next year!

Et Xun's paper on evolution of gene duplications is out on bioRxiv.

4/2/2015. félicitations à David G. who has won a Dan David Prize scholarship!

3/31/2015. Congratulations to former lab member Melissa Hubisz, now at Cornell, for winning an NSF predoc award! Also well done to Jessica, Emily and Evan for honorable mentions.

12/18/2014. Alexis, Zia and Sidney's paper on the relationship between genetic variation and phenotypic variation in RNA, ribosomes, and proteins is out today. Félicitations!

12/16/2014. félicitations à Cristina who completed her Ph.D defense in CS yesterday!!

12/04/2014. Anil and Heejung's paper on using multi-scale approaches to model DNase data at TF binding sites is out on bioRxiv.

11/11/2014. Our new website SciReader for scientific recommendations is out in beta release. You can check it out here: SciReader.org. Well done Priya, Natalie, Yonggan!

11/11/2014. Bryce and Graham's paper and software on unbiased allele-specific read mapping and powerful QTL mapping is out on bioRxiv and the corresponding WASP software is on GitHub.

9/22/2014. Lots of new arrivals this month: David, Yang, Anand and Emily visiting scholars: Audrey, Towfique and Kyle. Bienvenue!

8/07/2014. This week we are moving into our long-term lab space in the Clark Center! We are very happy to be in the new space. In other news, Anand has been awarded a CEHG fellowship for next year. Well done, Anand!

6/24/2014. Alexis will be starting her own lab next month at Johns Hopkins in the departments of CS and Biostats [Link]. We wish her all the very best in her new position!!

6/24/2014. Well done to Eilon on winning the prestigious EMBO fellowship! David Golan, who will be joining in September has been awarded the Rothschild and Fulbright fellowships. Congrats to both!!

6/24/2014. Xun and Nick's paper on genetic influences on DNA methylation is out on bioRxiv [Link].

4/29/2014. Anil's fastSTRUCTURE paper is now out in Genetics: Link.

Alexis will be speaking next week at Biology of Genomes about her work with Zia and Sydney on understanding the effects of genetic variation on mRNA, translation and proteins.

4/2/2014. Darren Cusanovich's paper on knockdown of TFs in LCLs (with Yoav's lab) is out now in PLOS Genetics: Link. Choongwon Jeong's paper on adaptive introgression of high altitude adaptations from Sherpa into Tibetans (collaboration with Anna Di Rienzo's lab), is out now in Nature Communications: Link.

4/1/2014. Bon voyage to Heejung Kim she spent the winter term visiting us from Matthew's lab in Chicago.

3/1/2014. Welcome to Yair who has now arrived from Chicago with his family!

2/10/2014. Our paper on genetic load in human populations, joint with Guy Sella's lab, is out now in Nature Genetics. Well done to Yuval Simons (in Guy's lab) and Michael Turchin (now in Matthew Stephens' lab)! Link.

2/10/2014. Welcome to our new postdoc Eilon Sharon, who has moved here from Eran Segal's lab. Eilon will be joint with Hunter Fraser's lab. Welcome also to this term's rotation students: Peyton Greenside, Natalie Telis, Diego Calderon, Arbel Harpak and Emily Glassberg!

12/6/2013. Joe Davis has written a great blog post about Graham and Bryce's recent paper on genetic variation and histone modification.

12/4/2013. fastSTRUCTURE is out! Links to Anil's manuscript and beta-release software are here.

12/4/2013. Thanks to Christine Vogel for her perspective on Zia's evolution of mRNA/protein paper.

11/12/2013. Welcome to Yonggan and Priya who are joining the lab this month!

11/12/2013. Congrats to Jack/Athma/Roger whose paper on DNase QTLs was chosen as one of the top papers of 2012 in Regulatory and Systems Genomics at the RECOMB/ISCB meeting.

11/1/2013. There's a nice perspective in NRG by Hannah Storey on 4 recent papers--including one by Graham and Bryce--that studied the effects of genetic variation on histone mods.

10/30/2013. Kudos to Shyam for winning the prestigious Charles Epstein Trainee Research Award (postdoc division) for his talk at ASHG on historical inference for African populations. Graham Coop is a previous winner from our lab (in 2007).

10/22/2013. Congratulations to lab alum Joe Pickrell who has just accepted a position as one of the first faculty at the New York Genome Center. En outre, Zia Khan is now in transit to his first faculty position--in CS at U. Maryland. Good luck to both!

10/22/2013. Darren's paper on knockdown experiments targeting 59 TFs is out on ArXiv.

10/17/2013. Zia and Graham/Bryce have a pair of papers out in Science today: evolution of protein expression in primates and effects of genetic variation on histone modifications. Congrats to Zia, Graham and Bryce!

10/17/2013. Ben Voight's 2006 paper on selection was highlighted in a nice blog article by Emma Ganley as part of the 10th anniversary celebrations at PLOS Biology.

10/11/2013. Welcome to our first two Stanford rotation students: Ilana Arbisser from the Biology department and Michael Sikora from Genetics!

8/1/2013. We are delighted to be moving to Stanford University. This will be a fantastic academic environment and a great place to live. That said, we will miss our many friends at the University of Chicago, where the lab was based for 12 years.

8/1/2013. Welcome to our newest postdoc Alexis Battle! It's great to have her onboard.

8/1/2013. Welcome to Anil, Stoyan and Xun, who are arriving at Stanford this month. The rest of the lab will follow soon or work from Chicago during the transitional period.

Hello World. The lab moves to Stanford on 8/1/2013, after 12 years at the University of Chicago.


Voir la vidéo: Architecture et ingénierie des systèmes complexes (Décembre 2022).