Le chromosome
MaisonMaison > Blog > Le chromosome

Le chromosome

May 17, 2023

Horticulture Research volume 8, Article number: 129 (2021) Citer cet article

4454 accès

18 Citations

1 Altmétrique

Détails des métriques

La stévia (Stevia rebaudiana Bertoni) est bien connue pour ses glycosides de stéviol (SG) très sucrés constitués d'un squelette de stéviol diterpénoïde tétracyclique commun et d'une glycone variable. Les glycosides de stéviol sont 150 à 300 fois plus sucrés que le saccharose et sont utilisés comme édulcorants naturels sans calorie. Cependant, les composés les plus prometteurs sont biosynthétisés en petites quantités. Sur la base du séquençage Illumina, PacBio et Hi-C, nous avons construit un assemblage au niveau chromosomique de Stevia couvrant 1416 Mb avec une valeur contig N50 de 616,85 kb et une valeur échafaudage N50 de 106,55 Mb. Plus des quatre cinquièmes du génome de Stevia étaient constitués d'éléments répétitifs. Nous avons annoté 44 143 gènes codant pour des protéines de haute confiance dans le génome de haute qualité. L'analyse de l'évolution du génome a suggéré que la stévia et le tournesol ont divergé il y a environ 29,4 millions d'années (Mya), peu de temps après l'événement de duplication du génome entier (WGD) (WGD-2, ~32,1 Mya) qui s'est produit chez leur ancêtre commun. Une analyse génomique comparative a révélé que les gènes étendus de Stevia étaient principalement enrichis pour la biosynthèse de métabolites spécialisés, en particulier la biosynthèse des squelettes terpénoïdes, et pour une oxydation et une glycosylation supplémentaires de ces composés. Nous avons en outre identifié tous les gènes candidats impliqués dans la biosynthèse de SG. Collectivement, nos découvertes actuelles sur le génome de référence de Stevia seront très utiles pour disséquer l'histoire évolutive de Stevia et pour découvrir de nouveaux gènes contribuant à la biosynthèse de SG et d'autres traits agronomiques importants dans les futurs programmes de sélection.

Les régimes riches en sucre sont connus pour causer de graves problèmes de santé tels que l'obésité et le diabète1. Certains pays ont prélevé des taxes sur le sucre pour réduire la consommation de sucres riches en calories, une stratégie recommandée pour réduire la consommation de sucre en encourageant la substitution par des édulcorants sans calories2. Les glycosides de stéviol, extraits des feuilles de stévia, ne contiennent aucune calorie et ont un goût sucré naturel recherché3. Stevia rebaudiana (2n = 22) est une herbe douce originaire du Paraguay, et son extrait de feuille est utilisé comme édulcorant naturel depuis des siècles en Amérique du Sud4. En plus de la douceur, les deux composants abondants des SG, le stévioside et le rebaudioside A (Reb A), peuvent également apporter des avantages thérapeutiques pour le diabète de type 2, car ces composés peuvent directement améliorer la sécrétion d'insuline en potentialisant l'activité du canal TRPM5 dans des modèles animaux5,6. La stévia est largement cultivée en Asie, en Amérique du Nord et en Europe pour son utilisation comme édulcorant naturel et médecine traditionnelle.

Le genre Stevia appartient à la tribu des Eupatorieae au sein de la famille des Astéracées. Parmi les ~230 espèces du genre Stevia, S. rebaudiana est la seule à contenir des SG3,7. Les SG ont un squelette principal diterpénoïde de stéviol (aglycone) décoré de différents modèles de glycosylation aux positions C-13 et C-193,8. Ces glycosides diterpénoïdes se trouvent presque exclusivement dans les feuilles de Stevia, représentant jusqu'à ~ 20% du poids sec9,10. Le stévioside et le Reb A sont les deux principaux composants des SG, suivis du Reb C, du Reb F, du dulcoside A, du Reb D et du Reb M. Des expériences de marquage ont révélé que le squelette des SG est biosynthétisé à partir d'unités isoprénoïdes à 5 carbones, qui sont principalement dérivé de la voie du phosphate de méthylérythritol (MEP)11. Les voies de biosynthèse de la SG et de l'acide gibbérellique (GA) partagent quatre étapes, et le dernier substrat commun de ces deux diterpénoïdes de type labdane est l'acide ent-kaurénoïque12,13,14. Dans la voie de biosynthèse du SG, l'acide ent-kaurénoïque hydroxylase (ent-KAH) catalyse la 13-hydroxylation de l'acide ent-kaurénoïque pour former l'acide ent-13-hydroxy kaurénoïque (stéviol), qui sert de squelette à tous les SG14,15. Ensuite, une série de processus de glycosylation de l'aglycone (stéviol) catalysés par un ensemble de glycosyltransférases cytosoliques UDP-dépendantes (UGT) conduit à la production de divers types de SG. Le glucose est une fraction glucidique majeure dans tous les SG, tandis que le rhamnose et le xylose ne sont présents que dans quelques SG, tels que Reb C et le dulcoside A3.

La stévia est unique dans son accumulation de SG, qui sont des métabolites secondaires des diterpénoïdes et ont des étapes de biosynthèse initiales similaires à celles des GA. Les GA sont essentiels à la croissance et au développement normaux des plantes, et les gènes impliqués dans la voie de biosynthèse des GA sont conservés et strictement régulés chez les plantes supérieures16,17. Il semble que la biosynthèse des SG et des GA doit être séparée spatialement ou temporellement pour ne pas perturber le métabolisme normal des GAs12 ; cependant, l'évolution de l'accumulation de SG et les mécanismes de séparation de la biosynthèse de SG et de GA dans la Stevia restent insaisissables. Après la formation des diterpènes tétracycliques centraux (GA12 et stéviol), une oxydation et une glycosylation ont lieu pour donner les composés bioactifs finaux : GA et SG, respectivement. Contrairement aux gènes d'oxydase impliqués dans la biosynthèse des GA, les gènes UGT participant à la glycosylation des diterpénoïdes ont rarement été documentés18,19. La stévia est une plante modèle idéale pour l'étude de la glycosylation des diterpénoïdes, non seulement parce que ses feuilles accumulent plus de 30 types de SG mais aussi en raison de son cycle de croissance court et de sa reproduction facile. En raison de l'absence de la séquence du génome de Stevia, la plupart des études identifiant les gènes UGT impliqués dans la glycosylation des SG ont été basées sur des étiquettes de séquence exprimées ou des séquences transcriptomiques, et seuls trois UGT ont été caractérisés pour contribuer à la biosynthèse des SG jusqu'à présent20,21 . Cette lacune a entravé la recherche sur la biosynthèse de SG et, par conséquent, a entravé la compréhension globale de l'évolution de Stevia chez les Asteraceae.

Dans la présente étude, nous avons généré une séquence génomique de référence de haute qualité pour Stevia (cv. 'Zhongshan No. 7') grâce à une combinaison de séquençage PacBio et d'approches Hi-C. Sur la base de cette séquence génomique, nous avons effectué une analyse évolutive de Stevia dans la famille des Astéracées. En outre, des ensembles de gènes candidats impliqués dans la biosynthèse de SG ont été identifiés. Ce génome de référence sera très utile pour la compréhension évolutive de la biosynthèse de SG et pour l'amélioration de la qualité de Stevia à l'avenir.

Les feuilles du cultivar chinois Stevia 'Zhongshan No. 7' ont été collectées pour le séquençage et l'assemblage du génome de novo. Sur la base de l'analyse K-mer, nous avons estimé une taille de génome de 1, 16 Gb pour Stevia, avec des taux d'hétérozygotie de 0, 43% et 73, 13% de répétitions (tableau supplémentaire 1 et figure supplémentaire 1). Pour assembler avec précision ce génome complexe avec un taux élevé de séquences répétées, nous avons utilisé une combinaison d'approches de séquençage Illumina à lecture courte, de séquençage PacBio à lecture longue et de séquence Hi-C. Nous avons obtenu 114,96 Go de sous-lectures de séquençage PacBio, offrant une couverture d'environ 99,5 fois du génome de Stevia (tableau supplémentaire 2). Ces sous-lectures ont été assemblées en un génome de 1405 Mo contenant 6978 contigs, avec une valeur de contig N50 de 616,85 kb, et le contig le plus long mesurait 26,27 Mo (tableau supplémentaire 3). Un total de 76,86 Go de données propres Hi-C ont été générées, dont 90,42 % de lectures ont été mappées sur les contigs assemblés (tableau supplémentaire 4). Sous la direction des données Hi-C, nous avons regroupé avec succès 6358 contigs en 11 pseudochromosomes et orienté 91,28% de l'assemblage selon une stratégie de regroupement hiérarchique22 (tableau supplémentaire 5 et figure supplémentaire 2). L'assemblage final de Stevia au niveau du chromosome avait une longueur de 1416 Mo, avec une taille d'échafaudage N50 de 106,55 Mo (tableau 1).

Nous avons utilisé une combinaison de trois sources de données pour évaluer l'exhaustivité de l'assemblage du génome de Stevia. Tout d'abord, nous avons aligné nos données Illumina sur le génome assemblé et 98,14 % des lectures nettes ont été cartographiées (tableau supplémentaire 6). Un total de 451 des 458 principaux gènes eucaryotes (CEG) ont été identifiés dans notre assemblage actuel du génome de Stevia (tableau supplémentaire 7). De plus, l'analyse BUSCO23 a révélé que 86,04% des BUSCO complets étaient présents dans l'assemblage Stevia (tableau supplémentaire 8). Toutes ces découvertes suggèrent que le génome de Stevia assemblé était très complet et précis.

Nous avons annoté les éléments répétitifs du génome de Stevia par des méthodes basées sur l'homologie et la prédiction in silico, et 80,11 % de l'assemblage a été déterminé comme étant composé d'éléments répétitifs. Parmi eux, les rétrotransposons représentaient 69,45% et les transposons d'ADN représentaient 5,83%. Plus de 65% du génome de Stevia était constitué de rétrotransposons à répétition terminale longue (LTR-RT), dont 32,30% appartenaient à la lignée Copia et 66,76% à la lignée Gypsy (tableau supplémentaire 9). Il n'était pas surprenant qu'une teneur aussi élevée en LTR-RT soit présente dans le génome de Stevia puisque les LTR-RT sont également présentes en grande proportion chez d'autres espèces d'Asteraceae, telles que Helianthus annuus (tournesol)24, Lactuca sativa (laitue)25, et Chrysanthemum nankingense26. Pour l'annotation des gènes codant pour les protéines, nous avons utilisé une combinaison de trois méthodes : les méthodes de prédiction basées sur l'homologie, ab initio et assistées par RNA Seq. Enfin, 44 143 gènes codant pour les protéines ont été prédits dans notre assemblage actuel de Stevia, avec une longueur moyenne de gène de 3 493 pb (tableau 1). L'analyse du transcriptome a montré que 37 489 gènes prédits (84,93 %) étaient pris en charge par au moins un des sept organes (racine, tige et feuilles à cinq stades de développement différents). Dans l'ensemble, 41 801 gènes codant pour des protéines (94, 69%) se sont vu attribuer des fonctions dans au moins une des cinq bases de données (NR, TrEMBL, KOG, KEGG et GO) (tableau supplémentaire 10) et 40 355 ont été ancrés sur les 11 pseudochromosomes. Les figures 1b à e montrent la densité de Copia, la densité de Gypsy, la densité de gènes et le niveau de transcription de chaque pseudochromosome.

a Représentation circulaire des pseudomolécules (Mb). b Densité des Copia LTR-RT. c Densité des Gypsy LTR-RT. d Densité génétique. e Niveaux de transcription moyens, log2(RPKM). f Teneur en GC. g Blocs synténiques à travers les pseudomolécules de Stevia. Lectures RPKM par Ko par million de lectures

Pour comprendre la relation évolutive entre la Stevia et d'autres plantes Asteraceae, nous avons effectué une analyse génomique comparative à l'aide de Vitis vinifera, Solanum lycopersicum, Daucus carota et de cinq plantes Asteraceae (L. sativa, C. nankingense, Artemisia annua, H. annuus et S .rebaudiana). L'analyse phylogénétique basée sur 799 gènes orthologues à copie unique identifiés dans ces huit espèces a confirmé la relation étroite entre la stévia et le tournesol (alliance Heliantheae) et entre C. nankingense et A. annua (tribu Anthemideae) (Fig. 2a). Le temps de divergence estimé de la stévia et du tournesol était d'environ 28 à 31 millions d'années (Mya). L'ancêtre commun le plus récent (MRCA) de Stevia et de tournesol a divergé du MRCA de C. nankingense et A. annua ~37–38 Mya, ce qui est cohérent avec les conclusions de Song et al.26. Le MRCA de Stevia et C. nankingense a divergé de la laitue ~ 39–40 Mya (Fig. 2a).

un arbre phylogénétique de Stevia et de sept autres plantes basé sur 799 gènes orthologues à copie unique. b Distributions Ks. Axe y gauche, orthologues Stevia-tournesol (bleu), orthologues Stevia-laitue (orange); axe y droit, paralogues de stévia (vert), paralogues de tournesol (vert foncé), paralogues de laitue (violet). c Blocs synténiques de Stevia-laitue-tournesol

Nous avons en outre étudié les événements de duplication du génome entier (WGD) au cours de l'évolution de la stévia puisque le WGD a été considéré comme une source importante de nouveauté phytogénétique, biochimique et évolutive27,28,29. Nous avons identifié 5209 paires de gènes paralogues qui représentaient 20,69 % des gènes Stevia prédits à l'aide du package MCScanX30. La distribution Ks de ces paires de gènes dupliquées a culminé à 0, 53, reflétant la survenue d'un événement WGD ~ 32, 1 Mya (Fig. 2b). Sur la base de la distribution Ks des paires de gènes orthologues entre la stévia et le tournesol, nous avons estimé que leur temps de divergence était d'environ 29,4 Mya, ce qui indique qu'ils ont divergé peu de temps après l'événement WGD (WGD-2) vécu par leur ancêtre commun24. La distribution Ks des paires de gènes homologues illustrait clairement que la triplication du génome entier (WGT-1, ~ 45, 5–51, 5 Mya) s'est produite chez la laitue (Fig. 2b), ce qui aurait également eu lieu dans l'ascendance de la plupart des Asteraceae 24, 25, 26,31. Cette analyse a montré que la Stevia a connu une histoire évolutive compliquée caractérisée par un WGD-2 récent partagé avec le tournesol, le WGT-1 basal chez les Asteraceae et l'événement de paléohexaploïdie ancestrale (WGT-γ) qui s'est produit chez tous les eudicots32. Ainsi, pour toute région ancestrale de la MRCA d'Asteraceae (post-WGT-1), deux régions héritées devraient actuellement exister dans les génomes de Stevia et de tournesol par rapport au génome de la laitue (Fig. 2c). Bien que la stévia et le tournesol aient connu les mêmes événements de paléopolyploïdie (WGT-γ, WGT-1 et WGD-2) et qu'il existait de nombreuses régions colinéaires entre leurs génomes (Fig. 3 supplémentaire), ces deux espèces peuvent avoir subi des schémas de réarrangement chromosomiques différents et perte de gène dupliqué après divergence, entraînant des nombres de chromosomes et des tailles de génome différents.

Sur la base de l'homologie de séquence, un total de 41 701 familles de gènes contenant 276 277 gènes ont été identifiés à l'aide des gènes prédits des huit plantes ci-dessus (sept d'astérides et V. vinifera en tant que groupe externe) (Fig. 3a et tableau supplémentaire 11). Parmi celles-ci, 5 749 familles de gènes composées de 68 964 gènes étaient partagées entre les huit plantes et 12 326 étaient partagées entre les cinq plantes d'Asteraceae (Fig. 3b). Nous avons attribué 40 214 gènes de stévia à 20 147 familles et avons découvert que 1 057 familles de gènes contenaient 4 281 gènes uniques à la stévia. L'analyse d'enrichissement de Gene Ontology (GO) a révélé que ces familles de gènes uniques étaient principalement impliquées dans l'activité de l'ADN polymérase dirigée par l'ARN (GO: 0003964), l'activité de l'endopeptidase de type aspartique (GO: 0004190) et la liaison à l'ARN (GO: 0003723) (Supplémentaire figure 4).

a Les nombres rouges et bleus cartographiés sur l'arbre phylogénétique des espèces indiquent les familles de gènes qui ont respectivement subi une expansion et une contraction. b Diagramme de Venn des familles de gènes partagés chez Stevia et quatre autres plantes d'Asteraceae. c Arbre phylogénétique de la famille des gènes de la terpène synthase (TPS) chez Stevia. Les sous-familles TPS sont étiquetées

Une analyse plus approfondie de la famille de gènes a démontré que 323 familles de gènes ont été étendues dans le génome de Stevia, tandis que 346 ont été contractées (Fig. 3a). L'analyse d'enrichissement GO des familles de gènes élargies de Stevia a révélé qu'elles étaient enrichies pour l'activité transférase (GO: 0016758), l'activité monooxygénase (GO: 0004497), la liaison ADP (GO: 0043531), l'activité catalytique (GO: 0003824), et terpène activité synthase (GO: 0010333) (Fig. 5 supplémentaire). L'analyse d'enrichissement KEGG a révélé que les familles de gènes élargies de Stevia étaient enrichies principalement pour la biosynthèse des phénylpropanoïdes (ko00940), la biosynthèse du squelette des terpénoïdes (ko00900), la biosynthèse des flavonoïdes (ko00941), la biosynthèse des monoterpénoïdes (ko00902), le métabolisme des acides cyanoaminés (ko00460) et les sesquiterpénoïdes et biosynthèse des triterpénoïdes (ko00909) (Fig. 6 supplémentaire). Les analyses d'enrichissement GO et KEGG ont démontré qu'un nombre considérable de ces familles de gènes élargies participaient à la biosynthèse de métabolites spécialisés. Comme la voie de biosynthèse des terpénoïdes a été enrichie plusieurs fois, nous avons étudié plus en détail le modèle d'expansion de la famille des gènes de la terpène synthase (TPS), qui entraîne la diversification des terpénoïdes. Quatre-vingt-deux gènes TPS ont été identifiés dans le génome de Stevia, qui pourraient être divisés en cinq sous-familles. Plus des trois quarts des gènes Stevia TPS ont été classés dans les sous-familles TPS-a et TPS-b, indiquant une expansion significative de ces deux sous-familles (Fig. 3c).

L'accumulation de grandes quantités de SG dans les feuilles est la caractéristique la plus notable de Stevia. Bien que la voie de biosynthèse de la SG ait été largement étudiée au cours des deux dernières décennies et que certains des gènes UGT critiques aient été bien caractérisés, nous avons obtenu de nouvelles informations sur la biosynthèse de la SG en combinant des analyses génomiques et transcriptomiques. Tous les terpènes sont dérivés d'unités isoprénoïdes à 5 carbones produites soit par la voie MEP, soit par la voie du mévalonate (MVA)34. Les gènes candidats dans les voies MEP et MVA ont été identifiés à l'aide de méthodes de recherche d'homologues et d'annotations fonctionnelles. L'analyse du transcriptome a révélé que presque tous les gènes candidats de la voie MEP étaient exprimés dans sept tissus sélectionnés, y compris des feuilles à différents stades de développement, avec une forte accumulation de SG (Fig. 4). Cependant, les niveaux d'expression de HMGR et MK dans la voie MVA étaient déficients dans les feuilles, indiquant que l'unité isoprénoïde à 5 carbones pour la biosynthèse de SG provient principalement de la voie MEP au lieu de la voie MVA, ce qui est cohérent avec les conclusions tirées de les résultats des expériences de marquage11.

un diagramme illustrant la voie de biosynthèse des SG. À l'intérieur de la boîte en pointillés se trouve la voie de biosynthèse unique des SG dans la stévia. b Modèles d'expression des gènes candidats de la voie de biosynthèse des SG. Racine RS au stade plantule, tige SS au stade plantule, feuille LS au stade plantule, feuille LV au stade végétatif, feuille LB au stade bouton, feuille LIF au stade de floraison initiale, feuille LPF au stade de floraison maximale

Étant donné que la biosynthèse des SG partage quatre étapes avec la biosynthèse des GA avant la génération de l'acide ent-kaurénoïque, nous avons identifié tous les gènes candidats impliqués dans cette voie commune, y compris 14 gènes de géranylgéranyl diphosphate (GGPP) synthase (GGPPS), sept gènes ent-copalyl gènes de la diphosphate synthase (ent-CPS), cinq gènes de l'ent-kaurène synthase (ent-KS) et six gènes de l'ent-kaurène oxydase (ent-KO) (Fig. 4). Les quatre types de gènes étaient des gènes multicopies dans le génome de Stevia, et les gènes homologues présentaient une différenciation d'expression (Fig. 4b), reflétant une sous-fonctionnalisation ou une néofonctionnalisation de ces gènes dupliqués. La stévia a évolué pour biosynthétiser les SG sur la base des premières étapes conservées de la voie de biosynthèse des GA dans les plantes vasculaires.

La biosynthèse des glycosides de stéviol diverge de la biosynthèse des GA avec la 13-hydroxylation de l'acide ent-kaurénoïque par l'ent-KAH. L'évolution de ent-KAH à partir de nombreux P450 a été l'étape clé de la biosynthèse de SG dans Stevia; cependant, le clonage de son gène codant n'a pas encore réussi3,35. Plusieurs gènes potentiels ent-KAH de Stevia ont été déposés dans la base de données NCBI, et la plupart appartiennent à la famille CYP716. En revanche, il a été rapporté que le CYP714A2, un membre de la famille CYP714 d'Arabidopsis thaliana, catalyse la 13-hydroxylation de l'acide ent-kaurénoïque lorsqu'il est exprimé dans la levure36. Ainsi, nous avons identifié tous les membres putatifs des familles CYP716 et CYP714 dans le génome de Stevia. Il y a eu une expansion significative des gènes CYP716 et quatre gènes dupliqués en tandem (Streb.1G007430, Streb.1G007460, Streb.1G007470 et Streb.1G007480) étaient constamment fortement exprimés dans les feuilles avec biosynthèse de SG (Fig. 7 supplémentaire). En revanche, il n'y avait qu'un seul membre de la famille CYP714 dans le génome de Stevia (Streb.8G019490), et il était à peine exprimé dans les feuilles (Fig. 4b). Après la formation de stéviol, des processus de glycosylation continus catalysés par un ensemble d'UGT conduisent à différents types de SG (Fig. 4a). Les gènes UGT étaient fortement enrichis (GO:0016758, P < 0,001) parmi les familles de gènes élargies de Stevia. Au total, nous avons identifié 259 gènes UGT putatifs dans le génome de Stevia, et 86 gènes UGT ont été exprimés dans au moins deux des cinq tissus foliaires sélectionnés (Fig. 8 supplémentaire), dont trois gènes UGT qui ont été signalés comme étant impliqués dans SG biosynthèse (UGT85C2, UGT74G1 et UGT76G1). La découverte de ces gènes UGT candidats par des analyses génomiques et transcriptomiques accélérera l'identification des gènes UGT impliqués dans la glycosylation spécifique de SG.

L'obésité est un grave problème de santé mondial qui touche des millions de personnes, une alimentation riche en sucre étant l'une des principales causes d'obésité. Réduire l'apport en sucre en les remplaçant par des édulcorants sans calorie est un moyen efficace de réduire la consommation énergétique alimentaire. Bien que des édulcorants artificiels tels que la saccharine, l'aspartame et le sucralose soient largement ajoutés à divers produits alimentaires d'usage quotidien, l'absorption à long terme de ces substituts du sucre peut poser des risques pour la santé37,38. Il existe une forte demande pour les édulcorants naturels à zéro calorie, et les SG pourraient être les candidats les plus prometteurs. Les glycosides de stéviol ont été approuvés par les principales autorités réglementaires mondiales pour une utilisation dans les aliments et les boissons. Des rendements élevés et des améliorations dans les niveaux des SG les plus savoureuses, telles que Reb A, Reb D et Reb M, sont actuellement les principaux objectifs de la sélection de Stevia.

Jusqu'à présent, il n'y a pas eu d'analyses complètes combinant des méthodes génomiques et transcriptomiques pour fournir des informations approfondies sur les diterpènes uniques (SG) de Stevia. Il est encore très difficile de construire un assemblage du génome de Stevia de haute qualité basé uniquement sur le séquençage de deuxième génération en raison de la grande taille et de la grande complexité du génome ainsi que du pourcentage de répétitions39. Ici, nous proposons un assemblage du génome au niveau des chromosomes de Stevia. Le génome de Stevia couvrant 1416 Mb a été obtenu, avec un contig N50 de 616,85 kb et un échafaudage N50 de 106,55 Mb. Nous avons prédit 44 143 gènes codant pour des protéines dans notre assemblage actuel à l'aide de méthodes de prédiction basées sur l'homologie, ab initio et assistées par ARN Seq ; ce nombre est presque le double de celui du génome précédent assemblé à l'aide de séquences courtes de deuxième génération (24 994), probablement parce que seulement 411 Mb du génome avaient été assemblés auparavant39. Par conséquent, le génome assemblé en utilisant de longues séquences et des approches Hi-C dans cette étude est supérieur au génome précédemment assemblé en utilisant uniquement des séquences courtes.

Plus des quatre cinquièmes du génome de Stevia étaient constitués d'éléments répétitifs, dont 21,02 % appartenaient à la lignée Copia et 43,44 % appartenaient à la lignée Gypsy. Chez le tournesol, plus des trois quarts du génome étaient composés de LTR-RT dont 59,9 % appartenaient à la lignée Gypsy et 25,8 % à la lignée Copia24. Chez C. nankingense, les éléments répétitifs représentaient 69,6 % du génome, parmi lesquels les LTR-RT (Gypsy et Copia) étaient les plus abondants26. Le fait d'avoir de nombreuses séquences répétitives, en particulier des LTR-RT, pourrait être une caractéristique importante de la famille des Astéracées, contribuant à la taille du génome de ses membres.

Des analyses génomiques comparatives de Stevia et d'autres plantes d'Asteraceae ont fourni des indices cruciaux concernant l'évolution du génome de Stevia chez les Asteraceae. Nos résultats ont montré que la stévia et le tournesol ont divergé d'environ 29,4 Mya, peu de temps après l'événement WGD (WGD-2, ~32,1 Mya) qui s'est produit dans leur MRCA (Fig. 2a, b). La stévia, membre de la famille des astéracées, a également connu un événement basal WGT-1 chez les astéracées, et un événement WGT-γ s'est produit chez tous les eudicots24,25,32. La plupart des blocs synténiques présents dans le génome de Stevia étaient dérivés du récent événement WGD-2, tandis que les blocs synténiques dérivés d'anciens événements WGT-1 étaient rarement préservés (Fig. 2b). Après avoir divergé d'un ancêtre partagé avec le tournesol, la stévia a évolué pour synthétiser des SG, des métabolites uniques que l'on ne trouve pas dans d'autres plantes. L'expansion de familles de gènes spécifiques peut jouer un rôle important dans la promotion de la diversification phénotypique ainsi que dans l'évolution de nouveaux caractères chez les plantes40,41. Les gènes étendus de Stevia ont été principalement enrichis pour la biosynthèse de métabolites spécialisés, en particulier la biosynthèse des squelettes terpénoïdes, et pour une oxydation et une glycosylation supplémentaires de ces composés (Figs. 5, 6 supplémentaires). Nous avons en outre identifié tous les gènes candidats dans la voie de la biosynthèse du SG sur la base des séquences du génome et avons découvert que les gènes essentiels responsables de la biosynthèse du stéviol étaient des gènes à copies multiples (Fig. 4b). Ces gènes dupliqués pourraient être des contributeurs importants à la capacité de Stevia à synthétiser les SG. Ainsi, cet assemblage génomique de haute qualité au niveau des chromosomes profitera sans aucun doute aux chercheurs dans l'exploration des caractéristiques de la stévia.

Les jeunes feuilles fraîches présentes au stade de semis de 'Zhongshan No. 7', une espèce de stévia diploïde cultivée, ont été collectées au laboratoire de ressources génétiques de stévia situé au jardin botanique de Nanjing Mem. Sun Yat-Sen. L'ADN génomique a été isolé pour le séquençage Illumina et PacBio. Pour le séquençage Illumina, une bibliothèque à lecture courte (270 bp) a été construite et séquencée sur une plateforme Illumina HiSeq (Illumina, CA, USA), et 141,90 Gb de lectures propres ont été obtenues. Pour le séquençage PacBio, l'ADN génomique a été fragmenté à ~ 20 kb pour construire une bibliothèque à lecture longue conformément aux instructions du fabricant (Pacific Biosciences, CA, USA), puis la bibliothèque a été séquencée sur une plate-forme PacBio Sequel. Après avoir filtré les lectures de mauvaise qualité et les adaptateurs de séquence, nous avons obtenu 114,95 Go de sous-lectures propres avec une valeur N50 de 12,82 Ko.

Pour l'assemblage du génome de novo, nous avons d'abord utilisé Canu (v1.5)42 pour corriger les erreurs potentielles dans les sous-lectures PacBio. Ensuite, les sous-lectures PacBio de haute qualité ont été assemblées indépendamment à l'aide de WTDBG (v1.2.8), FALCON (v0.7)43 et Canu (v1.5). Ces trois stratégies d'assemblage ont donné des assemblages de 1, 36, 3, 25 et 2, 03 Go, et les tailles contig N50 de ces trois assemblages étaient respectivement de 205, 51, 59, 71 et 277, 70 ko. Nous avons ensuite fusionné les assemblages WTGDB et Canu bien assemblés à l'aide de Quickmerge44. Pour corriger les erreurs indel et SNP dans la séquence d'assemblage, nous avons mappé les lectures Illumina appariées à l'assemblage fusionné à l'aide de Pilon45. Enfin, la taille du génome assemblé à l'aide de lectures longues PacBio était de 1, 40 Gb avec une valeur contig N50 de 616, 85 kb (tableau supplémentaire 3). Pour évaluer la qualité de l'assemblage, nous avons utilisé BWA46 pour mapper les lectures appariées courtes aux contigs optimisés, puis nous avons effectué des analyses CEGMA47 et BUSCO23.

Le séquençage Hi-C pour l'assemblage du génome au niveau des chromosomes a été effectué comme décrit précédemment48. En bref, de jeunes feuilles fraîches présentes au stade plantule de 'Zhongshan No. 7' ont été collectées et fixées dans une solution de formaldéhyde. HindIII a été utilisé pour digérer la chromatine extraite des feuilles fixées. Les fragments d'ADN ont ensuite été ligaturés ensemble pour former des jonctions chimériques après biotinylation. Ensuite, les jonctions chimériques enrichies ont été physiquement cisaillées en fragments d'ADN de 300 à 700 pb de longueur. Des fragments d'ADN contenant de la biotine ont été enrichis par pulldown de streptavidine, puis soumis à un séquençage Illumina HiSeq. Enfin, ~76,86 Go de lectures Hi-C propres ont été générées.

HiC-Pro49 a été utilisé pour évaluer les données de séquençage Hi-C. Les données de séquençage Hi-C ont été mappées sur des contigs assemblés à l'aide de BWA-aln46. Les échafaudages préassemblés ont été divisés en segments de 50 kb en moyenne et associés à des lectures cartographiées uniques pour l'assemblage à l'aide du logiciel LACHESIS22. Pour évaluer les assemblages chromosomiques finaux, nous les avons divisés en bacs de longueurs égales (100 kb) et visualisé la matrice d'interaction dans une carte thermique.

Des recherches de novo et des alignements basés sur l'homologie ont été utilisés pour prédire les séquences répétitives à travers le génome de Stevia. Nous avons d'abord utilisé PILER-DF (v2.4)50, RepeatScout (v1.0.5)51 et LTR_FINDER (v1.05)52 pour prédire les séquences répétitives de novo et les avons classées en familles à l'aide de PASTEClassifier53. Nous avons ensuite utilisé RepeatMasker (v4.0.6)54 pour scanner la base de données intégrée des séquences répétitives de novo et la bibliothèque Repbase55 TE connue.

Nous avons utilisé des approches basées sur l'homologie, ab initio et assistées par RNA Seq pour prédire les gènes codant pour les protéines dans l'assemblage du génome de Stevia. Augustus56, GlimmerHMM57, SNAP58 et GeneID59 ont été utilisés pour les programmes ab initio. Dans les prédictions homologues, les séquences protéiques de A. thaliana, H. annuus, L. sativa et Oryza sativa de Phytozome ont été téléchargées et alignées sur le génome de Stevia assemblé à l'aide de TBLASTN60. Nous avons ensuite aligné les séquences génomiques homologues contre des protéines correspondantes pour construire les modèles exacts de gènes codant pour les protéines à l'aide de GeMoMa61. Pour les prédictions assistées par ARN Seq, les lectures de séquençage d'ARN de différents organes de Stevia ont été cartographiées sur l'assemblage, et les transcriptions de ces résultats de cartographie ont été identifiées à l'aide de GeneMarkS-T62 et TransDecoder (https://github.com). Nous avons intégré tous les modèles de gènes obtenus à partir des trois procédures d'annotation ci-dessus avec EVM63 pour construire un ensemble de consensus final, puis nous l'avons filtré avec PASA (v2.0.2)64. Ces gènes codant pour les protéines prédits ont ensuite été attribués à BLAST par rapport à des bases de données publiques, y compris les bases de données de protéines non redondantes TrEMBL65 et NCBI. Blast2GO66 a été utilisé pour déterminer les fonctions et les voies basées sur les bases de données GO67 et KEGG68.

Des groupes orthologues parmi les huit plantes (V. vinifera, S. lycopersicum, D. carota, L. sativa, C. nankingense, A. annua, H. annuus et S. rebaudiana) ont été identifiés à l'aide d'OrthoMCL69. Des comparaisons tous contre tous ont été effectuées à l'aide de BLASTP (valeur E : 1e-05) et les groupes orthologues ont été regroupés à l'aide d'OrthoMCL. Nous avons utilisé MAFFT70 pour aligner les séquences protéiques de 799 gènes à copie unique, supprimé les régions mal alignées avec Gblocks71 et concaténé les résultats d'alignement pour l'analyse phylogénétique à l'aide de RAxML (v8.0.0)72. Nous avons estimé les temps de divergence des espèces à l'aide de MCMCTREE (v4.0) dans le package PAML73. Les temps de divergence estimés pour V. vinifera-H. annuus (111–131 Ma), S. lycopersicum-D. carota (95–106 Mya) et L. sativa-A. annua (34–40 Mya) dans TimeTree (http://www.timetree.org) ont été utilisés pour calibrer l'arbre. L'expansion et la contraction des familles de gènes regroupées par OrthoMCL dans les huit plantes ont été déterminées avec CAFÉ (v4.2)74.

Des comparaisons de séquences de protéines tous contre tous ont été effectuées à l'aide de BLASTP (valeur E : 1e-05) pour identifier les paires de gènes homologues. Les blocs synténiques au sein et entre les espèces ont été déterminés à l'aide de MCScanX30. Le script Perl 'add_ka_and_ks_to_collinearity.pl'. mis en œuvre dans le package MCScanX a été utilisé pour calculer les valeurs Ks des paires de gènes homologues colinéaires. Pour cinq espèces d'Asteraceae, le taux de substitution neutre des astérides (r = 8,25E−9) a été appliqué pour calculer la date de divergence des événements WGD ou de spéciation24. Un schéma fonctionnel synténique Stevia-laitue-tournesol et un diagramme en points des gènes codant entre la Stevia et le tournesol ont été dessinés avec TBtools75. Une image des blocs synténiques et des caractéristiques génomiques du génome de Stevia a été produite avec Circos (v0.69)76.

Les lectures courtes Illumina et les lectures longues PacBio ont été déposées dans la base de données NCBI SRA sous BioProject ID PRJNA684944. Les données du transcriptome ont été déposées dans la base de données NCBI SRA sous BioProject ID PRJNA705537. Les données finales d'assemblage et d'annotation du génome à l'échelle du chromosome ont été déposées dans la base de données Figshare (https://doi.org/10.6084/m9.figshare.14169491.v1).

Wu, D. et al. La phosphorylation régulée par le glucose de TET2 par l'AMPK révèle une voie reliant le diabète au cancer. Nature 559, 637–641 (2018).

Article CAS PubMed PubMed Central Google Scholar

Yang, T. et al. La reconnaissance hydrophobe permet à la glycosyltransférase UGT76G1 de catalyser son substrat dans deux orientationsScience des sucres cristallisants. Nat. Commun. 10, 3214 (2019).

Ceunen, S. & Geuns, JM Glycosides de stéviol : diversité chimique, métabolisme et fonction. J. Nat. Prod. 76, 1201-1228 (2013).

Article CAS PubMed Google Scholar

Yadav , AK , Singh , S. , Dhyani , D. & Ahuja , PS Une revue sur l'amélioration de la stévia [Stevia rebaudiana (Bertoni)]. Peut. J. Usine Sci. 91, 1–27 (2011).

Article Google Scholar

Chatsudthipong, V. & Muanprasat, C. Stevioside et composés apparentés : avantages thérapeutiques au-delà de la douceur. Pharmacol. Là. 121, 41–54 (2009).

Article CAS PubMed Google Scholar

Philippaert, K. et al. Les glycosides de stéviol améliorent la fonction des cellules bêta pancréatiques et la sensation gustative en potentialisant l'activité du canal TRPM5. Nat. Commun. 8, 14733 (2017).

Article CAS PubMed PubMed Central Google Scholar

Ceunen, S. et al. Glycosides diterpéniques de Stevia phlebophylla A. Gray. Glucides. Rés. 379, 1–6 (2013).

Article CAS PubMed Google Scholar

Brandle, JE, Starratt, AN & Gijzen, M. Stevia rebaudiana : Ses propriétés agricoles, biologiques et chimiques. Peut. J. Usine Sci. 78, 527-536 (1998).

Article CAS Google Scholar

Geuns, JMC Stévioside. Phytochimie 64, 913–921 (2003).

Article CAS PubMed Google Scholar

Lemus-Mondaca , R. , Vega-Galvez , A. , Zura-Bravo , L. & Ah-Hen , K. Stevia rebaudiana Bertoni , source d'un édulcorant naturel à haute puissance : une revue complète sur les propriétés biochimiques, nutritionnelles et fonctionnelles aspects. Chimie alimentaire. 132, 1121-1132 (2012).

Article CAS PubMed Google Scholar

Wolwer-Rieck, U., May, B., Lankes, C. & Wust, M. Contributions de la voie du méthylérythritol et du mévalonate à la biosynthèse des mono-, sesqui- et diterpènes dans les trichomes glandulaires et les feuilles de Stevia rebaudiana Bertoni. J. Agric. Chimie alimentaire. 62, 2428-2435 (2014).

Article PubMed CAS Google Scholar

Richman, AS et al. Synthèse de diterpènes chez Stevia rebaudiana : recrutement et régulation à la hausse d'enzymes clés de la voie de biosynthèse de la gibbérelline. Plant J. 19, 411–421 (1999).

Article CAS PubMed Google Scholar

Humphrey, TV, Richman, AS, Menassa, R. & Brandle, JE Organisation spatiale de quatre enzymes de Stevia rebaudiana impliquées dans la synthèse des glycosides de stéviol. Plante Mol. Biol. 61, 47–62 (2006).

Article CAS PubMed Google Scholar

Brandle, JE & Telmer, PG Biosynthèse des glycosides de stéviol. Phytochimie 68, 1855–1863 (2007).

Article CAS PubMed Google Scholar

Kim, KK, Sawa, Y. & Shibata, H. Hydroxylation de l'acide ent-kaurénoïque en stéviol dans Stevia rebaudiana Bertoni-purification et caractérisation partielle de l'enzyme. Cambre. Biochimie. Biophys. 332, 223-230 (1996).

Article CAS PubMed Google Scholar

Zi, JC, Mafu, S. & Peters, RJ Aux gibbérellines et au-delà ! Etude de l'évolution du métabolisme des (di)terpénoïdes. Annu. Rév. Plant Biol. 65, 259-286 (2014).

Article CAS PubMed PubMed Central Google Scholar

Yamaguchi, S. Métabolisme de la gibbérelline et sa régulation. Annu. Rév. Plant Biol. 59, 225-251 (2008).

Article CAS PubMed Google Scholar

Nagatoshi, M. et al. UGT75L6 et UGT94E5 interviennent dans la glucosylation séquentielle de la crocétine en crocine chez Gardenia jasminoides. FEBS Lett. 586, 1055-1061 (2012).

Article CAS PubMed Google Scholar

Sun, Y. et al. Les diterpénoïdes UDP-glycosyltransférases du thé sucré chinois et de l'ashitaba complètent la biosynthèse du rubusoside. Mol. Usine 11, 1308–1311 (2018).

Article CAS PubMed Google Scholar

Brandle, JE, Richman, A., Swanson, AK & Chapman, BP Leaf Ests de Stevia rebaudiana : une ressource pour la découverte de gènes dans la synthèse des diterpènes. Plante Mol. Biol. 50, 613–622 (2002).

Article CAS PubMed Google Scholar

Richman, A. et al. La génomique fonctionnelle met au jour trois glucosyltransférases impliquées dans la synthèse des principaux glucosides sucrés de Stevia rebaudiana. Plant J. 41, 56–67 (2004).

Article CAS Google Scholar

Burton, JN et al. Échafaudage à l'échelle des chromosomes d'assemblages de génomes de novo basés sur les interactions de la chromatine. Nat. Biotechnol. 31, 1119-1125 (2013).

Article CAS PubMed PubMed Central Google Scholar

Simao, FA et al. BUSCO : évaluation de l'assemblage du génome et de l'intégralité des annotations avec des orthologues à copie unique. Bioinformatique 31, 3210–3212 (2015).

Article PubMed CAS Google Scholar

Badouin, H. et al. Le génome du tournesol fournit des informations sur le métabolisme de l'huile, la floraison et l'évolution des astérides. Nature 546, 148-152 (2017).

Article CAS PubMed Google Scholar

Reyes-Chin-Wo, S. et al. Assemblage du génome avec données de ligature de proximité in vitro et triplication du génome entier chez la laitue. Nat. Commun. 8, 14953 (2017).

Article CAS PubMed PubMed Central Google Scholar

Song, C. et al. Le génome du chrysanthème nankingense donne un aperçu de l'évolution et de la diversification des fleurs et des traits médicinaux du chrysanthème. Mol. Usine 11, 1482–1491 (2018).

Article CAS PubMed Google Scholar

Soltis, PS, Marchant, DB, Van de Peer, Y. & Soltis, DE Polyploïdie et évolution du génome chez les plantes. Courant. Avis. Genet. Dév. 35, 119–125 (2015).

Article CAS PubMed Google Scholar

Soltis, PS & Soltis, DE Anciens événements WGD en tant que moteurs d'innovations clés dans les angiospermes. Courant. Avis. Usine. Biol. 30, 159-165 (2016).

Article PubMed Google Scholar

Soltis, DE et al. Polyploïdie et diversification des angiospermes. Suis. J. Bot. 96, 336–348 (2009).

Article PubMed Google Scholar

Wang, Y. et al. MCScanX : une boîte à outils pour la détection et l'analyse évolutive de la synténie et de la colinéarité des gènes. Nucleic Acids Res. 40, e49 (2012).

Article CAS PubMed PubMed Central Google Scholar

Barker, MS et al. La plupart des Compositae (Asteraceae) sont des descendants d'un paléohexaploïde et partagent tous un ancêtre paléotétraploïde avec les Calyceraceae. Suis. J. Bot. 103, 1203-1211 (2016).

Article CAS PubMed Google Scholar

Jiao, Y. et al. Une triplication du génome associée à une diversification précoce des eudicots de base. Génome Biol. 13, R3 (2012).

Article PubMed PubMed Central Google Scholar

Kumar, H. et al. Une analyse complète de quinze gènes de la voie de biosynthèse des glycosides de stéviol chez Stevia rebaudiana (Bertoni). Gène 492, 276-284 (2012).

Article CAS PubMed Google Scholar

Sapir-Mir, M. et al. La localisation peroxysomale des isopentényl diphosphate isomérases d'Arabidopsis suggère qu'une partie de la voie de l'acide mévalonique isoprénoïde de la plante est compartimentée aux peroxysomes. Physique Végétale. 148, 1219-1228 (2008).

Article CAS PubMed PubMed Central Google Scholar

Wang, J., Li, S., Xiong, Z. et Wang, Y. Intégration basée sur l'exploitation minière de voies de parties d'enzymes critiques pour la biosynthèse de novo de l'édulcorant steviolglycosides dans Escherichia coli. Cell Res. 26, 258-261 (2016).

Article PubMed Google Scholar

Nomura, T. et al. L'analyse fonctionnelle d'Arabidopsis CYP714A1 et CYP714A2 révèle qu'il s'agit d'enzymes distinctes de modification de la gibbérelline. Cellule végétale Physiol. 54, 1837–1851 (2013).

Article CAS PubMed Google Scholar

Tandel, KR Substituts du sucre : controverse sur la santé au sujet des avantages perçus. J. Pharmacol. Pharmacologue. 2, 236 (2011).

Article CAS PubMed PubMed Central Google Scholar

Swithers, SE Les édulcorants artificiels produisent l'effet contre-intuitif d'induire des dérèglements métaboliques. Tendances Endocrinol. Métab. 24, 431-441 (2013).

Article CAS PubMed PubMed Central Google Scholar

O'Neill, K. & Pirro, S. La séquence complète du génome de Stevia rebaudiana, la Sweetleaf. F1000Recherche. 9, 751 (2020).

Article PubMed PubMed Central Google Scholar

Renny-Byfield, S. & Wendel, JF Doubler les génomes : polyploïdie et plantes cultivées. Suis. J. Bot. 101, 1711-1725 (2014).

Article PubMed Google Scholar

Panchy, N., Lehti-Shiu, M. & Shiu, SH Évolution de la duplication de gènes chez les plantes. Physique Végétale. 171, 2294-2316 (2016).

Article CAS PubMed PubMed Central Google Scholar

Koren, S. et al. Canu : assemblage à lecture longue évolutif et précis via une pondération k-mer adaptative et une séparation répétée. Génome Res. 27, 722–736 (2017).

Article CAS PubMed PubMed Central Google Scholar

Chin, CS et al. Assemblage phasé du génome diploïde avec séquençage en temps réel d'une seule molécule. Nat. Méthodes 13, 1050–1054 (2016).

Article CAS PubMed PubMed Central Google Scholar

Chakraborty, M., Baldwin-Brown, JG, Long, AD & Emerson, JJ Assemblage contigu et précis de novo de génomes de métazoaires avec une couverture de lecture longue et modeste. Nucleic Acids Res. 44, e147 (2016).

PubMed PubMed Central CAS Google Scholar

Walker, BJ et al. Pilon : un outil intégré pour la détection complète des variants microbiens et l'amélioration de l'assemblage du génome. PLoS ONE 9, e112963 (2014).

Article PubMed PubMed Central CAS Google Scholar

Li, H. & Durbin, R. Alignement de lecture rapide et précis avec la transformée de Burrows-Wheeler. Bioinformatique 25, 1754–1760 (2009).

Article CAS PubMed PubMed Central Google Scholar

Parra, G., Bradnam, K. & Korf, I. CEGMA : un pipeline pour annoter avec précision les gènes de base dans les génomes eucaryotes. Bioinformatique 23, 1061-1067 (2007).

Article CAS PubMed Google Scholar

Belton, JM et al. Hi-C : Une technique complète pour capturer la conformation des génomes. Méthodes 58, 268–276 (2012).

Article CAS PubMed Google Scholar

Serviteur, N. et al. HiC-Pro : un pipeline optimisé et flexible pour le traitement des données Hi-C. Génome Biol. 16, 259 (2015).

Article PubMed PubMed Central CAS Google Scholar

Edgar, RC & Myers, EW PILER : identification et classification des répétitions génomiques. Bioinformatique 21, 152–158 (2005).

Article Google Scholar

Price, AL, Jones, NC et Pevzner, PA Identification de novo de familles répétées dans de grands génomes. Bioinformatique 21, 351–358 (2005).

Article Google Scholar

Xu, Z. & Wang, H. LTR_FINDER : un outil efficace pour la prédiction des rétrotransposons LTR pleine longueur. Nucleic Acids Res. 35, W265–W268 (2007).

Article PubMed PubMed Central Google Scholar

Wicker, T. et al. Un système de classification unifié pour les éléments transposables eucaryotes. Nat. Révérend Genet. 8, 973–982 (2007).

Article CAS PubMed Google Scholar

Tarailo-Graovac, M. & Chen, N. Utilisation de RepeatMasker pour identifier les éléments répétitifs dans les séquences génomiques. Courant. Protocole Bioinforma. 25, 4.10.1–4.10.14 (2009).

Article Google Scholar

Jurka, J. et al. Repbase Update, une base de données d'éléments répétitifs eucaryotes. Cytogenet Génome Res. 110, 462–467 (2005).

Article CAS PubMed Google Scholar

Stanke, M., Steinkamp, ​​R., Waack, S. & Morgenstern, B. AUGUSTUS : un serveur Web pour la recherche de gènes chez les eucaryotes. Nucleic Acids Res. 32, W309–W312 (2004).

Article CAS PubMed PubMed Central Google Scholar

Majoros, WH, Pertea, M. & Salzberg, SL TigrScan et GlimmerHMM : deux détecteurs de gènes eucaryotes ab initio open source. Bioinformatique 20, 2878–2879 (2004).

Article CAS PubMed Google Scholar

Bromberg, Y. & Rost, B. SNAP : prédire l'effet des polymorphismes non synonymes sur la fonction. Nucleic Acids Res. 35, 3823–3835 (2007).

Article CAS PubMed PubMed Central Google Scholar

Blanco, E., Parra, G. & Guigó, R. Utilisation de geneid pour identifier les gènes. Courant. Protocole Bioinforma. 18, 4.3.1–4.3.28 (2007).

Article Google Scholar

Altschul, SF et al. Outil de recherche d'alignement local de base. J. Mol. Biol. 215, 403–410 (1990).

Article CAS PubMed Google Scholar

Keilwagen, J. et al. Utilisation de la conservation de la position des introns pour la prédiction des gènes basée sur l'homologie. Nucleic Acids Res. 44, e89 (2016).

Article PubMed PubMed Central CAS Google Scholar

Tang, S., Lomsadze, A. & Borodovsky, M. Identification des régions codant pour les protéines dans les transcrits d'ARN. Nucleic Acids Res. 43, e78 (2015).

Article PubMed PubMed Central CAS Google Scholar

Haas, BJ et al. Annotation automatisée de la structure des gènes eucaryotes à l'aide d'EVidenceModeler et du programme d'assemblage d'alignements épissés. Génome Biol. 9, R7 (2008).

Article PubMed PubMed Central CAS Google Scholar

Campbell, MA et al. Analyse complète de l'épissage alternatif chez le riz et analyses comparatives avec Arabidopsis. BMC Genomics 7, 327 (2006).

Article PubMed PubMed Central CAS Google Scholar

Boeckmann, B. et al. La base de connaissances sur les protéines SWISS-PROT et son supplément TrEMBL en 2003. Nucleic Acids Res. 31, 365–370 (2003).

Article CAS PubMed PubMed Central Google Scholar

Conesa, A. et al. Blast2GO : un outil universel d'annotation, de visualisation et d'analyse dans la recherche en génomique fonctionnelle. Bioinformatique 21, 3674–3676 (2005).

Article CAS PubMed Google Scholar

Ashburner, M. et al. L'ontologie des gènes : outil d'unification de la biologie. Le Consortium d'ontologie génétique. Nat. Genet. 25, 25-29 (2000).

Article CAS PubMed PubMed Central Google Scholar

Kanehisa, M. & Goto, S. KEGG : encyclopédie kyoto des gènes et des génomes. Nucleic Acids Res. 28, 27-30 (2000).

Article CAS PubMed PubMed Central Google Scholar

Li, L., Stoeckert, CJ & Roos, DS OrthoMCL : identification de groupes orthologues pour les génomes eucaryotes. Génome Res. 13, 2178-2189 (2003).

Article CAS PubMed PubMed Central Google Scholar

Katoh, K. & Standley, DM Logiciel d'alignement de séquences multiples MAFFT version 7 : améliorations des performances et de la convivialité. Mol. Biol. Évol. 30, 772–780 (2013).

Article CAS PubMed PubMed Central Google Scholar

Castresana, J. Sélection de blocs conservés à partir d'alignements multiples pour leur utilisation dans l'analyse phylogénétique. Mol. Biol. Évol. 17, 540-552 (2000).

Article CAS PubMed Google Scholar

Stamatakis, A. RAxML-VI-HPC : analyses phylogénétiques basées sur le maximum de vraisemblance avec des milliers de taxons et des modèles mixtes. Bioinformatique 22, 2688–2690 (2006).

Article CAS PubMed Google Scholar

Yang, Z. PAML 4 : analyse phylogénétique par maximum de vraisemblance. Mol. Biol. Évol. 24, 1586-1591 (2007).

Article CAS PubMed Google Scholar

De Bie, T. et al. CAFE : un outil informatique pour l'étude de l'évolution des familles de gènes. Bioinformatique 22, 1269-1271 (2006).

Article CAS PubMed Google Scholar

Chen, C. et al. TBtools : une boîte à outils intégrative développée pour les analyses interactives de mégadonnées biologiques. Mol. Usine 13, 1194-1202 (2020).

Article CAS PubMed Google Scholar

Krzywinski, M. et al. Circos : Une esthétique de l'information pour la génomique comparative. Génome Res. 19, 1639–1645 (2009).

Article CAS PubMed PubMed Central Google Scholar

Télécharger les références

La recherche a été soutenue par la Fondation nationale des sciences naturelles de Chine (31701497 et 31601371), la Fondation des sciences naturelles de la province du Jiangsu (BK20160600 et BK20180312) et le Laboratoire clé du Jiangsu pour la recherche et l'utilisation des ressources végétales (JSPKLB201801 et JSPKLB201832).

Ces auteurs ont contribué à parts égales : Xiaoyang Xu, Haiyan Yuan

Institute of Botany, Jiangsu Province and Chinese Academy of Sciences/Jiangsu Provincial Platform for Conservation and Utilization of Agricultural Germplasm, Nanjing, 210014, Jiangsu, Chine

Xiaoyang Xu, Haiyan Yuan, Suzhen Huang, Yuming Sun, Ting Zhang, Qingquan Liu, Haiying Tong, Yongxia Zhang, Yinjie Wang, Menglan Hou et Yongheng Yang

Collège d'horticulture, Université agricole de Nanjing, Nanjing, 210095, Jiangsu, Chine

Xiaqing Yu

Institut de pomologie, Académie des sciences agricoles du Jiangsu/Laboratoire clé du Jiangsu pour l'amélioration génétique des cultures horticoles, Nanjing, 210014, Jiangsu, Chine

Chunxiao Liu

Biomarker Technologies Corporation, Pékin, 101300, Chine

Lei Wu

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

XX, YY et HY ont conçu l'étude ; HT, YW et YZ ont prélevé des échantillons ; LW et XX ont effectué le séquençage du génome ; XX, XY, SH, YS, CL, TZ, QL et MH ont effectué les analyses de données ; XX et HY ont écrit le manuscrit ; et YY ont révisé le manuscrit. Tous les auteurs ont lu et approuvé le manuscrit final.

Correspondance à Yongheng Yang.

Les auteurs ne déclarent aucun intérêt concurrent.

Figures supplémentaires 1-8Notre article ne contient que deux fichiers supplémentaires, les tableaux supplémentaires 1-11 et les figures supplémentaires 1-8. Veuillez supprimer les fichiers supplémentaires en double, merci.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Xu, X., Yuan, H., Yu, X. et al. Le génome de Stevia au niveau chromosomique donne un aperçu de la biosynthèse des glycosides de stéviol. Hortic Res 8, 129 (2021). https://doi.org/10.1038/s41438-021-00565-4

Télécharger la citation

Reçu : 23 novembre 2020

Révisé : 07 mars 2021

Accepté : 14 mars 2021

Publié: 01 juin 2021

DOI : https://doi.org/10.1038/s41438-021-00565-4

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

BMC Biologie Végétale (2023)

Ressources génétiques et évolution des cultures (2023)

Culture de cellules, de tissus et d'organes végétaux (PCTOC) (2022)