Das Chromosom
HeimHeim > Blog > Das Chromosom

Das Chromosom

Apr 05, 2023

Horticulture Research Band 8, Artikelnummer: 129 (2021) Diesen Artikel zitieren

4466 Zugriffe

18 Zitate

1 Altmetrisch

Details zu den Metriken

Stevia (Stevia rebaudiana Bertoni) ist bekannt für seine sehr süßen Steviolglykoside (SGs), die aus einem gemeinsamen tetrazyklischen Diterpenoid-Steviol-Grundgerüst und einem variablen Glykon bestehen. Steviolglykoside sind 150–300-mal süßer als Saccharose und werden als natürliche kalorienfreie Süßstoffe verwendet. Die vielversprechendsten Verbindungen werden jedoch in geringen Mengen biosynthetisiert. Basierend auf Illumina-, PacBio- und Hi-C-Sequenzierung haben wir eine Stevia-Anordnung auf Chromosomenebene konstruiert, die 1416 MB mit einem Contig-N50-Wert von 616,85 kb und einem Gerüst-N50-Wert von 106,55 MB abdeckt. Mehr als vier Fünftel des Stevia-Genoms bestanden aus repetitiven Elementen. Wir haben 44.143 proteinkodierende Gene mit hoher Zuverlässigkeit im hochwertigen Genom annotiert. Die Analyse der Genomentwicklung legte nahe, dass sich Stevia und Sonnenblume vor ca. 29,4 Millionen Jahren (Mya) trennten, kurz nach dem Ereignis der Duplikation des gesamten Genoms (WGD-2, ca. 32,1 Mya), das bei ihrem gemeinsamen Vorfahren auftrat. Eine vergleichende Genomanalyse ergab, dass die erweiterten Gene in Stevia hauptsächlich für die Biosynthese spezialisierter Metaboliten, insbesondere die Biosynthese von Terpenoid-Grundgerüsten, und für die weitere Oxidation und Glykosylierung dieser Verbindungen angereichert waren. Wir haben außerdem alle Kandidatengene identifiziert, die an der SG-Biosynthese beteiligt sind. Insgesamt werden unsere aktuellen Erkenntnisse zum Stevia-Referenzgenom sehr hilfreich sein, um die Evolutionsgeschichte von Stevia zu analysieren und neue Gene zu entdecken, die zur SG-Biosynthese und anderen wichtigen agronomischen Merkmalen in zukünftigen Züchtungsprogrammen beitragen.

Es ist bekannt, dass eine zuckerreiche Ernährung schwerwiegende Gesundheitsprobleme wie Fettleibigkeit und Diabetes verursacht1. Einige Länder haben Zuckersteuern erhoben, um den Konsum von kalorienreichem Zucker zu reduzieren. Dies ist eine empfohlene Strategie zur Reduzierung des Zuckerkonsums durch Förderung der Substitution durch kalorienfreie Süßstoffe2. Steviolglykoside, die aus den Blättern von Stevia gewonnen werden, enthalten keine Kalorien und haben die gewünschte natürliche Süße3. Stevia rebaudiana (2n = 22) ist ein in Paraguay beheimatetes Süßkraut, dessen Blattextrakt in Südamerika seit Jahrhunderten als natürlicher Süßstoff verwendet wird4. Neben der Süße können die beiden reichlich vorhandenen Bestandteile von SGs, Steviosid und Rebaudiosid A (Reb A), auch therapeutische Vorteile bei Typ-2-Diabetes bieten, da diese Verbindungen die Insulinsekretion durch Potenzierung der TRPM5-Kanalaktivität in Tiermodellen direkt steigern können5,6. Stevia wird in Asien, Nordamerika und Europa häufig als natürlicher Süßstoff und in der traditionellen Medizin angebaut.

Die Gattung Stevia gehört zum Stamm der Eupatorieae innerhalb der Familie der Korbblütler (Asteraceae). Unter den etwa 230 Arten der Gattung Stevia ist S. rebaudiana die einzige, die SGs3,7 enthält. SGs haben ein diterpenoides Steviol-Grundgerüst (Aglycon), das an den Positionen C-13 und C-19 mit unterschiedlichen Glykosylierungsmustern verziert ist3,8. Diese Diterpenoidglykoside kommen fast ausschließlich in Steviablättern vor und machen bis zu ~20 % des Trockengewichts aus9,10. Steviosid und Reb A sind die beiden Hauptbestandteile von SGs, gefolgt von Reb C, Reb F, Dulcosid A, Reb D und Reb M. Markierungsexperimente haben gezeigt, dass das Rückgrat von SGs aus 5-Kohlenstoff-Isoprenoideinheiten biosynthetisiert wird überwiegend aus dem Methylerythritolphosphat (MEP)-Weg abgeleitet11. Die Biosynthesewege von SG und Gibberellinsäure (GA) teilen sich vier Schritte, und das letzte gemeinsame Substrat dieser beiden Diterpenoide vom Labdan-Typ ist ent-Kaurensäure12,13,14. Im SG-Biosyntheseweg katalysiert ent-Kaurensäurehydroxylase (ent-KAH) die 13-Hydroxylierung von ent-Kaurensäure unter Bildung von ent-13-Hydroxykaurensäure (Steviol), die als Rückgrat für alle SGs dient14,15. Anschließend führt eine Reihe von Glykosylierungsprozessen des Aglykons (Steviol), die durch eine Reihe zytosolischer UDP-abhängiger Glykosyltransferasen (UGTs) katalysiert werden, zur Produktion verschiedener Arten von SGs. Glucose ist ein wichtiger Zuckeranteil in allen SGs, während Rhamnose und Xylose nur in wenigen SGs vorhanden sind, wie z. B. Reb C und Dulcosid A3.

Stevia ist einzigartig in seiner Anreicherung von SGs, die sekundäre Metaboliten von Diterpenoiden sind und ähnliche anfängliche Biosyntheseschritte wie GAs aufweisen. GAs sind für das normale Pflanzenwachstum und die normale Entwicklung von wesentlicher Bedeutung, und Gene, die am GA-Biosyntheseweg beteiligt sind, sind in höheren Pflanzen konserviert und streng reguliert16,17. Es scheint, dass die Biosynthese von SGs und GAs räumlich oder zeitlich getrennt sein sollte, um eine Störung des normalen Metabolismus von GAs zu vermeiden12; Die Entwicklung der SG-Akkumulation und die Trennungsmechanismen der SG- und GA-Biosynthese in Stevia sind jedoch noch unklar. Nach der Bildung der tetrazyklischen Kernditerpene (GA12 und Steviol) finden Oxidation und Glykosylierung statt, um die endgültigen bioaktiven Verbindungen zu ergeben: GAs bzw. SGs. Im Gegensatz zu den an der GA-Biosynthese beteiligten Oxidase-Genen wurden UGT-Gene, die an der Diterpenoid-Glykosylierung beteiligt sind, selten dokumentiert18,19. Stevia ist ein ideales Pflanzenmodell für die Untersuchung der Diterpenoid-Glykosylierung, nicht nur, weil seine Blätter mehr als 30 Arten von SGs ansammeln, sondern auch wegen seines kurzen Wachstumszyklus und seiner einfachen Reproduktion. Aufgrund des Fehlens der Genomsequenz von Stevia basierten die meisten Studien zur Identifizierung von UGT-Genen, die an der Glykosylierung von SGs beteiligt sind, auf exprimierten Sequenz-Tags oder transkriptomischen Sequenzen, und bisher wurde nur drei UGTs charakterisiert, die zur Biosynthese von SGs beitragen20,21 . Dieser Mangel hat die Forschung zur SG-Biosynthese behindert und folglich ein umfassendes Verständnis der Entwicklung von Stevia in Asteraceae behindert.

In der vorliegenden Studie haben wir durch eine Kombination aus PacBio-Sequenzierung und Hi-C-Ansätzen eine hochwertige Referenzgenomsequenz für Stevia (Sorte „Zhongshan Nr. 7“) generiert. Basierend auf dieser Genomsequenz führten wir eine evolutionäre Analyse von Stevia in der Familie der Asteraceae durch. Darüber hinaus wurden Kandidatengensätze identifiziert, die an der SG-Biosynthese beteiligt sind. Dieses Referenzgenom wird für das evolutionäre Verständnis der SG-Biosynthese und für die zukünftige Qualitätsverbesserung von Stevia sehr hilfreich sein.

Die Blätter der chinesischen Stevia-Sorte „Zhongshan No. 7“ wurden für die De-novo-Genomsequenzierung und -assemblierung gesammelt. Basierend auf der K-mer-Analyse schätzten wir eine Genomgröße von 1,16 Gb für Stevia mit Heterozygotieraten von 0,43 % und 73,13 % Wiederholungen (Ergänzungstabelle 1 und Ergänzungsabbildung 1). Um dieses komplexe Genom mit einer hohen Rate an Wiederholungssequenzen genau zusammenzusetzen, verwendeten wir eine Kombination aus Short-Read-Illumina-Sequenzierung, Long-Read-PacBio-Sequenzierung und Hi-C-Sequenzansätzen. Wir haben 114,96 GB PacBio-Sequenzierungs-Subreads erhalten, was eine ~99,5-fache Abdeckung des Stevia-Genoms bietet (Ergänzungstabelle 2). Diese Subreads wurden zu einem 1405-MB-Genom zusammengesetzt, das 6978 Contigs mit einem Contig-N50-Wert von 616,85 kb enthielt, und der längste Contig war 26,27 MB lang (Ergänzungstabelle 3). Insgesamt wurden 76,86 GB saubere Hi-C-Daten generiert, von denen 90,42 % der Lesevorgänge den zusammengestellten Contigs zugeordnet wurden (Ergänzungstabelle 4). Unter Anleitung der Hi-C-Daten haben wir 6358 Contigs erfolgreich in 11 Pseudochromosomen geclustert und 91, 28% der Anordnung gemäß einer hierarchischen Clustering-Strategie 22 ausgerichtet (Ergänzungstabelle 5 und ergänzende Abbildung 2). Die endgültige Stevia-Anordnung auf Chromosomenebene hatte eine Länge von 1416 MB und eine N50-Gerüstgröße von 106,55 MB (Tabelle 1).

Wir verwendeten eine Kombination aus drei Datenquellen, um die Vollständigkeit der Stevia-Genomassemblierung zu beurteilen. Zuerst haben wir unsere Illumina-Daten an das zusammengesetzte Genom angepasst und 98,14 % der sauberen Lesevorgänge wurden kartiert (Ergänzungstabelle 6). In unserer aktuellen Stevia-Genomassemblierung wurden insgesamt 451 der 458 eukaryotischen Kerngene (CEGs) identifiziert (Ergänzungstabelle 7). Darüber hinaus ergab die BUSCO23-Analyse, dass 86,04 % der vollständigen BUSCOs in der Stevia-Anordnung vorhanden waren (Ergänzungstabelle 8). Alle diese Ergebnisse legen nahe, dass das zusammengesetzte Stevia-Genom eine hohe Vollständigkeit und Genauigkeit aufwies.

Wir haben die repetitiven Elemente des Stevia-Genoms durch homologiebasierte Methoden und In-silico-Vorhersage annotiert und festgestellt, dass 80,11 % der Gesamtheit aus repetitiven Elementen bestehen. Davon entfielen 69,45 % auf Retrotransposons und 5,83 % auf DNA-Transposons. Mehr als 65 % des Stevia-Genoms bestanden aus langen terminalen Wiederholungsretrotransposons (LTR-RTs), von denen 32,30 % zur Copia-Linie und 66,76 % zur Gypsy-Linie gehörten (Ergänzungstabelle 9). Es war nicht überraschend, dass ein so hoher Gehalt an LTR-RTs im Stevia-Genom vorhanden war, da LTR-RTs auch in großen Anteilen in anderen Asteraceae-Arten vorhanden sind, wie z. B. Helianthus annuus (Sonnenblume)24, Lactuca sativa (Salat)25, und Chrysantheme Nankingense26. Für die Annotation proteinkodierender Gene verwendeten wir eine Kombination aus drei Methoden: homologiebasierte, Ab-initio- und RNA-Seq-unterstützte Vorhersagemethoden. Schließlich wurden in unserer aktuellen Stevia-Zusammenstellung 44.143 proteinkodierende Gene mit einer durchschnittlichen Genlänge von 3493 bp vorhergesagt (Tabelle 1). Die Transkriptomanalyse ergab, dass 37.489 vorhergesagte Gene (84,93 %) von mindestens einem der sieben Organe (Wurzel, Stamm und Blätter in fünf verschiedenen Entwicklungsstadien) unterstützt wurden. Insgesamt wurden 41.801 proteinkodierenden Genen (94,69 %) Funktionen in mindestens einer der fünf Datenbanken (NR, TrEMBL, KOG, KEGG und GO) zugewiesen (Ergänzungstabelle 10), und 40.355 waren auf den 11 Pseudochromosomen verankert. Abb. 1b – e zeigt die Copia-Dichte, die Gypsy-Dichte, die Gendichte und das Transkriptionsniveau jedes Pseudochromosoms.

a Kreisförmige Darstellung der Pseudomoleküle (Mb). b Dichte von Copia LTR-RTs. c Dichte von Gypsy-LTR-RTs. d Gendichte. e Durchschnittliche Transkriptniveaus, log2(RPKM). f GC-Gehalt. g Syntenische Blöcke über Stevia-Pseudomoleküle hinweg. RPKM-Lesevorgänge pro KB pro Million Lesevorgänge

Um die evolutionäre Beziehung zwischen Stevia und anderen Asteraceae-Pflanzen zu verstehen, führten wir eine vergleichende Genomanalyse mit Vitis vinifera, Solanum lycopersicum, Daucus carota und fünf Asteraceae-Pflanzen (L. sativa, C. nankingense, Artemisia annua, H. annuus und S . rebaudiana). Die phylogenetische Analyse basierend auf 799 in diesen acht Arten identifizierten orthologen Einzelkopie-Genen bestätigte die enge Beziehung zwischen Stevia und Sonnenblume (Heliantheae-Allianz) sowie zwischen C. nankingense und A. annua (Anthemideae-Stamm) (Abb. 2a). Die geschätzte Divergenzzeit von Stevia und Sonnenblume lag vor etwa 28–31 Millionen Jahren (Mya). Der jüngste gemeinsame Vorfahre (MRCA) von Stevia und Sonnenblume weicht vor ca. 37–38 Millionen Jahren vom MRCA von C. nankingense und A. annua ab, was mit den Erkenntnissen von Song et al.26 übereinstimmt. Die MRCA von Stevia und C. nankingense weicht von der von Salat um ca. 39–40 Mya ab (Abb. 2a).

ein phylogenetischer Baum von Stevia und sieben anderen Pflanzen, der auf 799 orthologen Einzelkopie-Genen basiert. b Ks-Verteilungen. Linke y-Achse, Stevia-Sonnenblumen-Orthologe (blau), Stevia-Salat-Orthologe (orange); rechte Y-Achse: Stevia-Paraloge (grün), Sonnenblumen-Paraloge (dunkelgrün), Salat-Paraloge (lila). c Synteny-Blöcke aus Stevia-Salat-Sonnenblume

Wir haben die Ereignisse der Duplikation des gesamten Genoms (WGD) während der Stevia-Evolution weiter untersucht, da WGD als bedeutende Quelle pflanzengenetischer, biochemischer und evolutionärer Neuheiten angesehen wird27,28,29. Mit dem MCScanX-Paket30 identifizierten wir 5209 paraloge Genpaare, die 20,69 % der vorhergesagten Stevia-Gene ausmachten. Die Ks-Verteilung dieser duplizierten Genpaare erreichte ihren Höhepunkt bei 0,53, was das Auftreten eines WGD-Ereignisses ~32,1 Mya widerspiegelt (Abb. 2b). Basierend auf der Ks-Verteilung der orthologen Genpaare zwischen Stevia und Sonnenblume schätzten wir, dass ihre Divergenzzeit ~29,4 Millionen Jahre betrug, was darauf hindeutet, dass sie kurz nach dem WGD-Ereignis (WGD-2) auseinander gingen, das ihr gemeinsamer Vorfahre erlebte24. Die Ks-Verteilung homologer Genpaare verdeutlichte deutlich, dass bei Salat eine Verdreifachung des gesamten Genoms (WGT-1, ~45,5–51,5 Mya) auftrat (Abb. 2b), von der man annimmt, dass sie auch in der Abstammung der meisten Korbblütler aufgetreten ist24,25, 26,31. Diese Analyse zeigte, dass Stevia eine komplizierte Evolutionsgeschichte durchlief, die durch ein kürzlich mit Sonnenblumen geteiltes WGD-2, das basale WGT-1 bei Asteraceae und das ancestrale Paläohexaploidie-Ereignis (WGT-γ) gekennzeichnet war, das bei allen Eudikotyledonen auftrat32. Daher wird derzeit erwartet, dass für jede angestammte Region aus dem MRCA von Asteraceae (nach WGT-1) im Stevia- und Sonnenblumengenom im Vergleich zum Salatgenom zwei vererbte Regionen existieren (Abb. 2c). Obwohl Stevia und Sonnenblume die gleichen Paläopolyploidie-Ereignisse erlebten (WGT-γ, WGT-1 und WGD-2) und es viele kollineare Regionen zwischen ihren Genomen gab (ergänzende Abbildung 3), haben diese beiden Arten möglicherweise unterschiedliche Muster der Chromosomenumlagerung durchlaufen doppelter Genverlust nach Divergenz, was zu unterschiedlichen Chromosomenzahlen und Genomgrößen führt.

Basierend auf der Sequenzhomologie wurden unter Verwendung der vorhergesagten Gene der oben genannten acht Pflanzen (sieben von Asteriden und V. vinifera als Außengruppe) insgesamt 41.701 Genfamilien mit 276.277 Genen identifiziert (Abb. 3a und Ergänzungstabelle 11). Davon wurden 5749 Genfamilien, bestehend aus 68.964 Genen, von allen acht Pflanzen und 12.326 von den fünf Asteraceae-Pflanzen geteilt (Abb. 3b). Wir ordneten 40.214 Stevia-Gene 20.147 Familien zu und fanden heraus, dass 1057 Genfamilien 4281 für Stevia einzigartige Gene enthielten. Die Anreicherungsanalyse der Genontologie (GO) ergab, dass diese einzigartigen Genfamilien hauptsächlich an der RNA-gesteuerten DNA-Polymeraseaktivität (GO:0003964), der Endopeptidaseaktivität vom Asparagintyp (GO:0004190) und der RNA-Bindung (GO:0003723) beteiligt waren (Ergänzung). Abb. 4).

a Die roten und blauen Zahlen, die dem phylogenetischen Stammbaum der Art zugeordnet sind, zeigen Genfamilien an, die einer Expansion bzw. Kontraktion unterzogen wurden. b Venn-Diagramm gemeinsamer Genfamilien in Stevia und vier anderen Pflanzen der Asteraceae. c Phylogenetischer Baum der Terpen-Synthase (TPS)-Genfamilie in Stevia. Die TPS-Unterfamilien sind gekennzeichnet

Eine weitere Genfamilienanalyse zeigte, dass 323 Genfamilien im Stevia-Genom erweitert wurden, während 346 kontrahiert wurden (Abb. 3a). Die GO-Anreicherungsanalyse der erweiterten Genfamilien von Stevia ergab, dass sie hinsichtlich Transferaseaktivität (GO:0016758), Monooxygenaseaktivität (GO:0004497), ADP-Bindung (GO:0043531), katalytischer Aktivität (GO:0003824) und Terpen angereichert waren Synthaseaktivität (GO:0010333) (Ergänzende Abbildung 5). Die KEGG-Anreicherungsanalyse ergab, dass die erweiterten Genfamilien von Stevia hauptsächlich für die Phenylpropanoid-Biosynthese (ko00940), die Terpenoid-Rückgrat-Biosynthese (ko00900), die Flavonoid-Biosynthese (ko00941), die Monoterpenoid-Biosynthese (ko00902), den Cyanoaminosäure-Metabolismus (ko00460) und Sesquiterpenoid angereichert waren Triterpenoid-Biosynthese (ko00909) (Ergänzende Abbildung 6). Die GO- und KEGG-Anreicherungsanalysen zeigten, dass eine beträchtliche Anzahl dieser erweiterten Genfamilien an der Biosynthese spezialisierter Metaboliten beteiligt war. Da der Terpenoid-Biosyntheseweg mehrfach bereichert wurde, untersuchten wir weiter das Expansionsmuster der Terpen-Synthase (TPS)-Genfamilie, das die Diversifizierung von Terpenoiden vorantreibt. Im Stevia-Genom wurden 82 TPS-Gene identifiziert, die in fünf Unterfamilien unterteilt werden konnten. Mehr als drei Viertel der Stevia-TPS-Gene wurden in die TPS-a- und TPS-b-Unterfamilien eingeteilt, was auf eine signifikante Erweiterung dieser beiden Unterfamilien hinweist (Abb. 3c).

Die Ansammlung großer Mengen an SGs in den Blättern ist das bemerkenswerteste Merkmal von Stevia. Obwohl der SG-Biosyntheseweg in den letzten zwei Jahrzehnten umfassend untersucht wurde und einige der entscheidenden UGT-Gene gut charakterisiert wurden21,33, haben wir durch die Kombination von Genom- und Transkriptomanalysen neue Erkenntnisse über die SG-Biosynthese gewonnen. Alle Terpene leiten sich von 5-Kohlenstoff-Isoprenoideinheiten ab, die entweder über den MEP-Weg oder den Mevalonat-Weg (MVA) produziert werden34. Kandidatengene in den MEP- und MVA-Signalwegen wurden mithilfe von Homologensuche und funktionellen Annotationsmethoden identifiziert. Die Transkriptomanalyse ergab, dass fast alle Kandidatengene im MEP-Signalweg in sieben ausgewählten Geweben exprimiert wurden, darunter Blätter in verschiedenen Entwicklungsstadien, mit hoher Anhäufung von SGs (Abb. 4). Allerdings waren die Expressionsniveaus von HMGR und MK im MVA-Weg in den Blättern unzureichend, was darauf hindeutet, dass die 5-Kohlenstoff-Isoprenoideinheit für die SG-Biosynthese hauptsächlich vom MEP-Weg und nicht vom MVA-Weg stammt, was mit den daraus abgeleiteten Schlussfolgerungen übereinstimmt die Ergebnisse von Markierungsexperimenten11.

ein Diagramm, das den Weg der SG-Biosynthese darstellt. In der gestrichelten Box ist der einzigartige SG-Biosyntheseweg in Stevia dargestellt. b Expressionsmuster von Kandidatengenen des SGs-Biosynthesewegs. RS-Wurzel im Sämlingsstadium, SS-Stamm im Sämlingsstadium, LS-Blatt im Sämlingsstadium, LV-Blatt im vegetativen Stadium, LB-Blatt im Knospenstadium, LIF-Blatt im Anfangsblütenstadium, LPF-Blatt im Spitzenblütenstadium

Da die Biosynthese von SGs vier Schritte mit der Biosynthese von GAs vor der Bildung von ent-Kaurensäure teilt, haben wir alle an diesem gemeinsamen Weg beteiligten Kandidatengene identifiziert, darunter 14 Geranylgeranyldiphosphat (GGPP)-Synthase (GGPPS)-Gene und sieben ent-Copalyl Diphosphat-Synthase-Gene (ent-CPS), fünf Ent-Kauren-Synthase-Gene (ent-KS) und sechs Ent-Kauren-Oxidase-Gene (ent-KO) (Abb. 4). Alle vier Arten von Genen waren Multikopie-Gene im Stevia-Genom, und die homologen Gene zeigten eine Expressionsdifferenzierung (Abb. 4b), was eine Subfunktionalisierung oder Neofunktionalisierung dieser duplizierten Gene widerspiegelt. Stevia hat sich zur Biosynthese von SGs entwickelt, basierend auf den konservierten frühen Schritten des GA-Biosynthesewegs in Gefäßpflanzen.

Die Biosynthese von Steviolglykosiden unterscheidet sich von der GA-Biosynthese durch die 13-Hydroxylierung von ent-Kaurensäure durch ent-KAH. Die Entwicklung von ent-KAH aus zahlreichen P450 war der Schlüsselschritt der SG-Biosynthese in Stevia; Allerdings war die Klonierung des kodierenden Gens bisher nicht erfolgreich3,35. In der NCBI-Datenbank wurden mehrere potenzielle ent-KAH-Gene von Stevia hinterlegt, von denen die meisten zur CYP716-Familie gehören. Im Gegensatz dazu wurde berichtet, dass CYP714A2, ein Mitglied der CYP714-Familie von Arabidopsis thaliana, die 13-Hydroxylierung von ent-Kaurensäure katalysiert, wenn es in Hefe exprimiert wird36. Somit identifizierten wir alle mutmaßlichen Mitglieder der CYP716- und CYP714-Familien im Stevia-Genom. Es kam zu einer signifikanten Erweiterung der CYP716-Gene, und vier tandemartig duplizierte Gene (Streb.1G007430, Streb.1G007460, Streb.1G007470 und Streb.1G007480) wurden in Blättern mit SG-Biosynthese durchweg stark exprimiert (ergänzende Abbildung 7). Im Gegensatz dazu gab es im Stevia-Genom nur ein Mitglied der CYP714-Familie (Streb.8G019490) und es wurde kaum in den Blättern exprimiert (Abb. 4b). Nach der Bildung von Steviol führen kontinuierliche Glykosylierungsprozesse, die durch eine Reihe von UGTs katalysiert werden, zu verschiedenen Arten von SGs (Abb. 4a). UGT-Gene waren in den erweiterten Genfamilien von Stevia stark angereichert (GO:0016758, P <0,001). Insgesamt identifizierten wir 259 mutmaßliche UGT-Gene im Stevia-Genom und 86 UGT-Gene wurden in mindestens zwei der fünf ausgewählten Blattgewebe exprimiert (ergänzende Abbildung 8), darunter drei UGT-Gene, von denen berichtet wurde, dass sie an SG beteiligt sind Biosynthese (UGT85C2, UGT74G1 und UGT76G1). Die Entdeckung dieser UGT-Kandidatengene durch Genom- und Transkriptomanalysen wird die Identifizierung von UGT-Genen beschleunigen, die an der spezifischen SG-Glykosylierung beteiligt sind.

Fettleibigkeit ist ein ernstes globales Gesundheitsproblem, von dem Millionen Menschen betroffen sind. Eine zuckerreiche Ernährung ist eine der Hauptursachen für Fettleibigkeit. Die Reduzierung der Zuckeraufnahme durch Ersatz durch kalorienfreie Süßstoffe ist eine wirksame Möglichkeit, den Energieverbrauch über die Nahrung zu senken. Obwohl künstliche Süßstoffe wie Saccharin, Aspartam und Sucralose im täglichen Gebrauch häufig verschiedenen Lebensmitteln zugesetzt werden, kann die langfristige Aufnahme dieser Zuckerersatzstoffe gesundheitliche Risiken bergen37,38. Es besteht eine starke Nachfrage nach natürlichen kalorienfreien Süßungsmitteln, und SGs könnten die vielversprechendsten Kandidaten sein. Steviolglykoside wurden von den wichtigsten Regulierungsbehörden weltweit für die Verwendung in Lebensmitteln und Getränken zugelassen. Hohe Erträge und Verbesserungen der Gehalte der am besten schmeckenden SGs, wie Reb A, Reb D und Reb M, sind derzeit die Hauptziele für die Züchtung von Stevia.

Bisher gab es keine umfassenden Analysen, die genomische und transkriptomische Methoden kombinierten, um detaillierte Einblicke in die einzigartigen Diterpene (SGs) von Stevia zu gewinnen. Aufgrund der Größe und der hohen Komplexität des Genoms sowie des Prozentsatzes an Wiederholungen ist es immer noch eine große Herausforderung, eine qualitativ hochwertige Stevia-Genomassemblierung zu konstruieren, die nur auf der Sequenzierung der zweiten Generation basiert39. Hier schlagen wir eine Genomassemblierung von Stevia auf Chromosomenebene vor. Es wurde ein Stevia-Genom mit einer Größe von 1416 MB erhalten, mit einem Contig-N50 von 616,85 kb und einem Gerüst-N50 von 106,55 MB. Wir haben 44.143 proteinkodierende Gene in unserer aktuellen Zusammenstellung mithilfe homologiebasierter, Ab-initio- und RNA-Seq-unterstützter Vorhersagemethoden vorhergesagt; Diese Zahl ist fast doppelt so hoch wie die des vorherigen Genoms, das mit kurzen Sequenzen der zweiten Generation zusammengestellt wurde (24.994), wahrscheinlich weil zuvor nur 411 MB des Genoms zusammengestellt worden waren39. Daher ist das Genom, das in dieser Studie unter Verwendung langer Sequenzen und Hi-C-Ansätzen zusammengestellt wurde, dem Genom überlegen, das zuvor nur unter Verwendung kurzer Sequenzen zusammengestellt wurde.

Mehr als vier Fünftel des Stevia-Genoms bestanden aus repetitiven Elementen, von denen 21,02 % zur Copia-Linie und 43,44 % zur Gypsy-Linie gehörten. Bei Sonnenblumen bestanden mehr als drei Viertel des Genoms aus LTR-RTs, von denen 59,9 % zur Gypsy-Linie und 25,8 % zur Copia-Linie gehörten24. Bei C. nankingense machten repetitive Elemente 69,6 % des Genoms aus, wobei LTR-RTs (Gypsy und Copia) am häufigsten vorkamen26. Viele repetitive Sequenzen, insbesondere LTR-RTs, könnten ein wesentliches Merkmal der Asteraceae-Familie sein und zur Genomgröße ihrer Mitglieder beitragen.

Vergleichende Genomanalysen von Stevia und anderen Asteraceae-Pflanzen haben entscheidende Hinweise auf die Evolution des Stevia-Genoms bei Asteraceae geliefert. Unsere Ergebnisse zeigten, dass Stevia und Sonnenblume kurz nach dem WGD-Ereignis (WGD-2, ~32,1 Mya), das in ihrem MRCA auftrat, um ca. 29,4 Millionen Jahre voneinander abwichen (Abb. 2a, b). Bei Stevia, einem Mitglied der Asteraceae-Familie, kam es auch bei Asteraceae zu einem basalen WGT-1-Ereignis, und bei allen Eudikotyledonen trat ein WGT-γ-Ereignis auf24,25,32. Die meisten der im Stevia-Genom vorhandenen Syntenblöcke stammen aus dem jüngsten WGD-2-Ereignis, während Syntenblöcke, die aus alten WGT-1-Ereignissen stammen, selten erhalten blieben (Abb. 2b). Nachdem es sich von einem mit der Sonnenblume gemeinsamen Vorfahren abgespalten hatte, entwickelte sich Stevia zur Synthese von SGs, einzigartigen Metaboliten, die in anderen Pflanzen nicht vorkommen. Die Erweiterung spezifischer Genfamilien könnte eine wichtige Rolle bei der Förderung der phänotypischen Diversifizierung sowie bei der Entwicklung neuer Merkmale in Pflanzen spielen40,41. Die erweiterten Gene in Stevia wurden hauptsächlich für die Biosynthese spezialisierter Metaboliten, insbesondere für die Biosynthese von Terpenoid-Rückgraten, und für die weitere Oxidation und Glykosylierung dieser Verbindungen angereichert (Ergänzende Abbildungen 5, 6). Wir haben außerdem alle Kandidatengene im Weg der SG-Biosynthese anhand der Genomsequenzen identifiziert und festgestellt, dass die wesentlichen Gene, die für die Steviol-Biosynthese verantwortlich sind, Mehrfachkopie-Gene sind (Abb. 4b). Diese duplizierten Gene könnten einen wichtigen Beitrag zur Fähigkeit von Stevia leisten, SGs zu synthetisieren. Somit wird diese hochwertige Genomassemblierung auf Chromosomenebene den Forschern bei der Erforschung der Stevia-Eigenschaften zweifellos zugute kommen.

Frische junge Blätter, die im Sämlingsstadium von „Zhongshan Nr. 7“, einer kultivierten diploiden Stevia-Art, vorhanden waren, wurden im Stevia-Keimplasma-Ressourcenlabor im Nanjing Botanical Garden Mem gesammelt. Sun Yat-sen. Genomische DNA wurde für die Illumina- und PacBio-Sequenzierung isoliert. Für die Illumina-Sequenzierung wurde eine Short-Read-Bibliothek (270 bp) erstellt und auf einer Illumina HiSeq-Plattform (Illumina, CA, USA) sequenziert, und es wurden 141,90 GB saubere Lesevorgänge erhalten. Für die PacBio-Sequenzierung wurde genomische DNA auf ~20 kb fragmentiert, um eine Long-Read-Bibliothek gemäß den Anweisungen des Herstellers (Pacific Biosciences, CA, USA) zu erstellen, und dann wurde die Bibliothek auf einer PacBio Sequel-Plattform sequenziert. Nachdem wir die minderwertigen Lesevorgänge und Sequenzadapter herausgefiltert hatten, erhielten wir 114,95 GB saubere Subreads mit einem N50-Wert von 12,82 kb.

Für die De-novo-Genomassemblierung haben wir zunächst Canu (v1.5)42 verwendet, um mögliche Fehler in den PacBio-Subreads zu korrigieren. Anschließend wurden die hochwertigen PacBio-Subreads unabhängig voneinander mit WTDBG (v1.2.8), FALCON (v0.7)43 und Canu (v1.5) zusammengestellt. Diese drei Montagestrategien ergaben Baugruppen mit 1,36, 3,25 und 2,03 GB, und die Contig-N50-Größen dieser drei Baugruppen betrugen 205,51, 59,71 bzw. 277,70 kb. Wir haben die gut zusammengesetzten WTGDB- und Canu-Baugruppen mithilfe von Quickmerge44 weiter zusammengeführt. Um die Indel- und SNP-Fehler in der Assembly-Sequenz zu korrigieren, haben wir mithilfe von Pilon45 Paired-End-Illumina-Lesevorgänge der zusammengeführten Assembly zugeordnet. Schließlich betrug die Größe des mithilfe von PacBio-Long-Reads zusammengestellten Genoms 1,40 GB mit einem Contig-N50-Wert von 616,85 kb (Ergänzungstabelle 3). Um die Qualität der Baugruppe zu bewerten, haben wir BWA46 verwendet, um die kurzen Paired-End-Lesevorgänge den optimierten Contigs zuzuordnen, und anschließend CEGMA47- und BUSCO23-Analysen durchgeführt.

Die Hi-C-Sequenzierung für die Genomassemblierung auf Chromosomenebene wurde wie zuvor beschrieben durchgeführt . Kurz gesagt, frische junge Blätter, die im Sämlingsstadium von „Zhongshan Nr. 7“ vorhanden waren, wurden gesammelt und in Formaldehydlösung fixiert. HindIII wurde verwendet, um das aus den fixierten Blättern extrahierte Chromatin zu verdauen. Die DNA-Fragmente wurden dann zusammenligiert, um nach der Biotinylierung chimäre Verbindungen zu bilden. Anschließend wurden die angereicherten chimären Verbindungen physikalisch in DNA-Fragmente mit einer Länge von 300–700 bp zerschnitten. Biotinhaltige DNA-Fragmente wurden durch Streptavidin-Pulldown angereichert und dann einer Illumina HiSeq-Sequenzierung unterzogen. Schließlich wurden ~76,86 GB saubere Hi-C-Lesevorgänge generiert.

HiC-Pro49 wurde zur Auswertung der Hi-C-Sequenzierungsdaten verwendet. Die Hi-C-Sequenzierungsdaten wurden mithilfe von BWA-aln46 auf zusammengesetzte Contigs abgebildet. Die vormontierten Gerüste wurden in durchschnittlich 50-kb-Segmente aufgeteilt und mit eindeutigen zugeordneten Lesevorgängen für den Zusammenbau mithilfe der LACHESIS-Software22 verbunden. Um die endgültigen Chromosomenanordnungen auszuwerten, haben wir sie in Behälter gleicher Länge (100 kb) unterteilt und die Interaktionsmatrix in einer Heatmap visualisiert.

De-novo-Suchen und homologiebasierte Alignments wurden verwendet, um repetitive Sequenzen im gesamten Stevia-Genom vorherzusagen. Wir verwendeten zunächst PILER-DF (v2.4)50, RepeatScout (v1.0.5)51 und LTR_FINDER (v1.05)52, um repetitive De-novo-Sequenzen vorherzusagen, und klassifizierten sie mithilfe von PASTEClassifier53 in Familien. Anschließend verwendeten wir RepeatMasker (v4.0.6)54, um die integrierte Datenbank der repetitiven De-novo-Sequenzen und die bekannte Repbase55-TE-Bibliothek zu scannen.

Wir verwendeten homologiebasierte, Ab-initio- und RNA-Seq-unterstützte Ansätze, um proteinkodierende Gene im Stevia-Genomaufbau vorherzusagen. Augustus56, GlimmerHMM57, SNAP58 und GeneID59 wurden für Ab-initio-Programme verwendet. In homologen Vorhersagen wurden die Proteinsequenzen von A. thaliana, H. annuus, L. sativa und Oryza sativa aus Phytozome heruntergeladen und mithilfe von TBLASTN60 mit dem zusammengesetzten Stevia-Genom abgeglichen. Anschließend haben wir die homologen Genomsequenzen mit passenden Proteinen abgeglichen, um mithilfe von GeMoMa61 die genauen Protein-kodierenden Genmodelle zu erstellen. Für die RNA-Seq-unterstützten Vorhersagen wurden RNA-Sequenzierungsablesungen aus verschiedenen Stevia-Organen der Baugruppe zugeordnet und Transkripte aus diesen Kartierungsergebnissen wurden mithilfe von GeneMarkS-T62 und TransDecoder (https://github.com) identifiziert. Wir haben alle aus den oben genannten drei Annotationsverfahren erhaltenen Genmodelle mit EVM63 integriert, um einen endgültigen Konsenssatz zu erstellen, und ihn dann mit PASA (v2.0.2)64 gefiltert. Diese vorhergesagten proteinkodierenden Gene wurden dann BLAST anhand öffentlicher Datenbanken zugeordnet, einschließlich der nichtredundanten Proteindatenbanken TrEMBL65 und NCBI. Blast2GO66 wurde verwendet, um die Funktionen und Pfade basierend auf den Datenbanken GO67 und KEGG68 zu bestimmen.

Orthologe Gruppen unter den acht Pflanzen (V. vinifera, S. lycopersicum, D. carota, L. sativa, C. nankingense, A. annua, H. annuus und S. rebaudiana) wurden mithilfe von OrthoMCL69 identifiziert. Alle-gegen-alle-Vergleiche wurden mit BLASTP (E-Wert: 1e−05) durchgeführt und orthologe Gruppen wurden mit OrthoMCL geclustert. Wir verwendeten MAFFT70, um die Proteinsequenzen von 799 Single-Copy-Genen auszurichten, entfernten die schlecht ausgerichteten Regionen mit Gblocks71 und verketteten die Alignment-Ergebnisse für die phylogenetische Analyse mit RAxML (v8.0.0)72. Wir haben die Artendivergenzzeiten mithilfe von MCMCTREE (v4.0) im PAML-Paket73 geschätzt. Die geschätzten Divergenzzeiten für V. vinifera-H. annuus (111–131 Mya), S. lycopersicum-D. carota (95–106 Mya) und L. sativa-A. Annua (34–40 Mya) in TimeTree (http://www.timetree.org) wurden zur Kalibrierung des Baums verwendet. Die Expansion und Kontraktion der von OrthoMCL in den acht Pflanzen geclusterten Genfamilien wurde mit CAFÉ (v4.2)74 bestimmt.

Mithilfe von BLASTP (E-Wert: 1e−05) wurden Vergleiche aller Proteinsequenzen durchgeführt, um homologe Genpaare zu identifizieren. Syntenische Blöcke innerhalb und zwischen Arten wurden mit MCScanX30 bestimmt. Das Perl-Skript „add_ka_and_ks_to_collinearity.pl“. Die im MCScanX-Paket implementierte Methode wurde zur Berechnung der Ks-Werte der kollinearen homologen Genpaare verwendet. Für fünf Asteraceae-Arten wurde die neutrale Substitutionsrate von Asteriden (r = 8,25E−9) angewendet, um das Divergenzdatum der WGD oder Artbildungsereignisse zu berechnen24. Mit TBtools75 wurden ein syntenisches Stevia-Salat-Sonnenblumen-Blockdiagramm und ein Punktdiagramm der kodierenden Gene zwischen Stevia und Sonnenblume erstellt. Mit Circos (v0.69)76 wurde ein Bild der syntenischen Blöcke und genomischen Merkmale im Stevia-Genom erstellt.

Die Illumina Short Reads und PacBio Long Reads wurden in der NCBI SRA-Datenbank unter der BioProject ID PRJNA684944 hinterlegt. Die Transkriptomdaten wurden in der NCBI SRA-Datenbank unter der BioProject ID PRJNA705537 hinterlegt. Die endgültigen Genomassemblierungs- und Annotationsdaten im Chromosomenmaßstab wurden in der Figshare-Datenbank (https://doi.org/10.6084/m9.figshare.14169491.v1) hinterlegt.

Wu, D. et al. Die durch Glukose regulierte Phosphorylierung von TET2 durch AMPK zeigt einen Weg auf, der Diabetes mit Krebs verbindet. Natur 559, 637–641 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Yang, T. et al. Die hydrophobe Erkennung ermöglicht es der Glycosyltransferase UGT76G1, ihr Substrat in zwei Orientierungen zu katalysieren. Kristallisierende Zuckerwissenschaft. Nat. Komm. 10, 3214 (2019).

Ceunen, S. & Geuns, JM Steviolglycoside: chemische Vielfalt, Stoffwechsel und Funktion. J. Nat. Prod. 76, 1201–1228 (2013).

Artikel CAS PubMed Google Scholar

Yadav, AK, Singh, S., Dhyani, D. & Ahuja, PS Ein Überblick über die Verbesserung von Stevia [Stevia rebaudiana (Bertoni)]. Dürfen. J. Plant Sci. 91, 1–27 (2011).

Artikel Google Scholar

Chatsudthipong, V. & Muanprasat, C. Steviosid und verwandte Verbindungen: therapeutische Vorteile über die Süße hinaus. Pharmakol. Dort. 121, 41–54 (2009).

Artikel CAS PubMed Google Scholar

Philippaert, K. et al. Steviolglykoside verbessern die Betazellfunktion der Bauchspeicheldrüse und das Geschmacksempfinden durch Potenzierung der TRPM5-Kanalaktivität. Nat. Komm. 8, 14733 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Ceunen, S. et al. Diterpenglycoside aus Stevia phlebophylla A. Gray. Kohlenhydrat. Res. 379, 1–6 (2013).

Artikel CAS PubMed Google Scholar

Brandle, JE, Starratt, AN & Gijzen, M. Stevia rebaudiana: Seine landwirtschaftlichen, biologischen und chemischen Eigenschaften. Dürfen. J. Plant Sci. 78, 527–536 (1998).

Artikel CAS Google Scholar

Geuns, JMC Steviosid. Phytochemistry 64, 913–921 (2003).

Artikel CAS PubMed Google Scholar

Lemus-Mondaca, R., Vega-Galvez, A., Zura-Bravo, L. & Ah-Hen, K. Stevia rebaudiana Bertoni, Quelle eines hochwirksamen natürlichen Süßstoffs: eine umfassende Übersicht über biochemische, ernährungsphysiologische und funktionelle Aspekte Aspekte. Lebensmittelchem. 132, 1121–1132 (2012).

Artikel CAS PubMed Google Scholar

Wolwer-Rieck, U., May, B., Lankes, C. & Wust, M. Methylerythritol und Mevalonat-Wegbeiträge zur Biosynthese von Mono-, Sesqui- und Diterpenen in Drüsentrichomen und Blättern von Stevia rebaudiana Bertoni. J. Agrar. Lebensmittelchem. 62, 2428–2435 (2014).

Artikel PubMed CAS Google Scholar

Richman, AS et al. Diterpensynthese in Stevia rebaudiana: Rekrutierung und Hochregulierung von Schlüsselenzymen aus dem Gibberellin-Biosyntheseweg. Plant J. 19, 411–421 (1999).

Artikel CAS PubMed Google Scholar

Humphrey, TV, Richman, AS, Menassa, R. & Brandle, JE Räumliche Organisation von vier Enzymen aus Stevia rebaudiana, die an der Steviolglycosidsynthese beteiligt sind. Pflanzenmol. Biol. 61, 47–62 (2006).

Artikel CAS PubMed Google Scholar

Brandle, JE & Telmer, PG Steviolglycosid-Biosynthese. Phytochemistry 68, 1855–1863 (2007).

Artikel CAS PubMed Google Scholar

Kim, KK, Sawa, Y. & Shibata, H. Hydroxylierung von ent-Kaurensäure zu Steviol in Stevia rebaudiana Bertoni-Reinigung und teilweise Charakterisierung des Enzyms. Bogen. Biochem. Biophys. 332, 223–230 (1996).

Artikel CAS PubMed Google Scholar

Zi, JC, Mafu, S. & Peters, RJ Für Gibberelline und darüber hinaus! Untersuchung der Entwicklung des (Di-)Terpenoidstoffwechsels. Annu. Rev. Plant Biol. 65, 259–286 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Yamaguchi, S. Gibberellin-Stoffwechsel und seine Regulierung. Annu. Rev. Plant Biol. 59, 225–251 (2008).

Artikel CAS PubMed Google Scholar

Nagatoshi, M. et al. UGT75L6 und UGT94E5 vermitteln die sequentielle Glucosylierung von Crocetin zu Crocin in Gardenia jasminoides. FEBS Lett. 586, 1055–1061 (2012).

Artikel CAS PubMed Google Scholar

Sun, Y. et al. Diterpenoid-UDP-Glycosyltransferasen aus chinesischem Süßtee und Ashitaba vervollständigen die Biosynthese von Rubusosid. Mol. Werk 11, 1308–1311 (2018).

Artikel CAS PubMed Google Scholar

Brandle, JE, Richman, A., Swanson, AK & Chapman, BP Blattabfälle von Stevia rebaudiana: eine Ressource für die Genentdeckung in der Diterpensynthese. Pflanzenmol. Biol. 50, 613–622 (2002).

Artikel CAS PubMed Google Scholar

Richman, A. et al. Funktionelle Genomik deckt drei Glucosyltransferasen auf, die an der Synthese der wichtigsten süßen Glucoside von Stevia rebaudiana beteiligt sind. Pflanze J. 41, 56–67 (2004).

Artikel CAS Google Scholar

Burton, JN et al. Aufbau von De-novo-Genomanordnungen auf Chromosomenebene basierend auf Chromatin-Wechselwirkungen. Nat. Biotechnologie. 31, 1119–1125 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Simão, FA et al. BUSCO: Beurteilung der Vollständigkeit der Genomassemblierung und Annotation mit Einzelkopie-Orthologen. Bioinformatik 31, 3210–3212 (2015).

Artikel PubMed CAS Google Scholar

Badouin, H. et al. Das Sonnenblumengenom bietet Einblicke in den Ölstoffwechsel, die Blüte und die Entwicklung der Asteriden. Natur 546, 148–152 (2017).

Artikel CAS PubMed Google Scholar

Reyes-Chin-Wo, S. et al. Genomassemblierung mit In-vitro-Proximity-Ligationsdaten und Verdreifachung des gesamten Genoms in Salat. Nat. Komm. 8, 14953 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Song, C. et al. Das Genom von Chrysanthemum nankingense bietet Einblicke in die Entwicklung und Diversifizierung von Chrysanthemenblüten und medizinischen Eigenschaften. Mol. Werk 11, 1482–1491 (2018).

Artikel CAS PubMed Google Scholar

Soltis, PS, Marchant, DB, Van de Peer, Y. & Soltis, DE Polyploidie und Genomentwicklung in Pflanzen. Curr. Meinung. Genet. Entwickler 35, 119–125 (2015).

Artikel CAS PubMed Google Scholar

Soltis, PS & Soltis, DE Alte WGD-Ereignisse als Treiber wichtiger Innovationen bei Angiospermen. Curr. Meinung. Anlage. Biol. 30, 159–165 (2016).

Artikel PubMed Google Scholar

Soltis, DE et al. Polyploidie und Angiospermendiversifizierung. Bin. J. Bot. 96, 336–348 (2009).

Artikel PubMed Google Scholar

Wang, Y. et al. MCScanX: ein Toolkit zur Erkennung und evolutionären Analyse der Syntenie und Kollinearität von Genen. Nukleinsäuren Res. 40, e49 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Barker, MS et al. Die meisten Korbblütler (Asteraceae) sind Nachkommen einer paläohexaploiden Gattung und alle haben mit den Calyceraceae einen gemeinsamen paläotetraploiden Vorfahren. Bin. J. Bot. 103, 1203–1211 (2016).

Artikel CAS PubMed Google Scholar

Jiao, Y. et al. Eine Genomverdreifachung, die mit einer frühen Diversifizierung der Kern-Eudikotyledonen verbunden ist. Genombiol. 13, R3 (2012).

Artikel PubMed PubMed Central Google Scholar

Kumar, H. et al. Eine umfassende Analyse von fünfzehn Genen des Steviolglykosid-Biosynthesewegs in Stevia rebaudiana (Bertoni). Gene 492, 276–284 (2012).

Artikel CAS PubMed Google Scholar

Sapir-Mir, M. et al. Die peroxisomale Lokalisierung von Arabidopsis-Isopentenyldiphosphat-Isomerasen legt nahe, dass ein Teil des pflanzlichen Isoprenoid-Mevalonsäure-Stoffwechselwegs in Peroxisomen unterteilt ist. Pflanzenphysiologie. 148, 1219–1228 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, J., Li, S., Xiong, Z. & Wang, Y. Pathway-Mining-basierte Integration kritischer Enzymteile für die De-novo-Biosynthese von Steviolglycosiden-Süßstoffen in Escherichia coli. Zellauflösung 26, 258–261 (2016).

Artikel PubMed Google Scholar

Nomura, T. et al. Die Funktionsanalyse von Arabidopsis CYP714A1 und CYP714A2 zeigt, dass es sich um unterschiedliche Gibberellin-Modifikationsenzyme handelt. Pflanzenzellphysiologie. 54, 1837–1851 (2013).

Artikel CAS PubMed Google Scholar

Tandel, KR Zuckerersatzstoffe: Gesundheitskontroverse über wahrgenommene Vorteile. J. Pharmacol. Pharmakotherapeut. 2, 236 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Swithers, SE Künstliche Süßstoffe erzeugen den kontraintuitiven Effekt, Stoffwechselstörungen hervorzurufen. Trends Endokrinol. Metab. 24, 431–441 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

O'Neill, K. & Pirro, S. Die vollständige Genomsequenz von Stevia rebaudiana, dem Süßblatt. F1000Forschung. 9, 751 (2020).

Artikel PubMed PubMed Central Google Scholar

Renny-Byfield, S. & Wendel, JF Verdoppelung der Genome: Polyploidie und Nutzpflanzen. Bin. J. Bot. 101, 1711–1725 (2014).

Artikel PubMed Google Scholar

Panchy, N., Lehti-Shiu, M. & Shiu, SH Evolution der Genduplikation in Pflanzen. Pflanzenphysiologie. 171, 2294–2316 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Koren, S. et al. Canu: Skalierbare und genaue Long-Read-Assemblierung durch adaptive K-Mer-Gewichtung und Wiederholungstrennung. Genomres. 27, 722–736 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Chin, CS et al. Phasenweise diploide Genomassemblierung mit Einzelmolekül-Echtzeitsequenzierung. Nat. Methoden 13, 1050–1054 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Chakraborty, M., Baldwin-Brown, JG, Long, AD & Emerson, JJ Zusammenhängende und genaue De-novo-Assemblierung von Metazoengenomen mit bescheidener Long-Read-Abdeckung. Nukleinsäuren Res. 44, e147 (2016).

PubMed PubMed Central CAS Google Scholar

Walker, BJ et al. Pilon: ein integriertes Tool zur umfassenden Erkennung mikrobieller Varianten und zur Verbesserung der Genomassemblierung. PLoS ONE 9, e112963 (2014).

Artikel PubMed PubMed Central CAS Google Scholar

Li, H. & Durbin, R. Schnelle und genaue Ausrichtung kurzer Lesevorgänge mit der Burrows-Wheeler-Transformation. Bioinformatik 25, 1754–1760 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Parra, G., Bradnam, K. & Korf, I. CEGMA: eine Pipeline zur genauen Annotation von Kerngenen in eukaryotischen Genomen. Bioinformatik 23, 1061–1067 (2007).

Artikel CAS PubMed Google Scholar

Belton, JM et al. Hi-C: Eine umfassende Technik zur Erfassung der Konformation von Genomen. Methoden 58, 268–276 (2012).

Artikel CAS PubMed Google Scholar

Servant, N. et al. HiC-Pro: eine optimierte und flexible Pipeline für die Hi-C-Datenverarbeitung. Genombiol. 16, 259 (2015).

Artikel PubMed PubMed Central CAS Google Scholar

Edgar, RC & Myers, EW PILER: Identifizierung und Klassifizierung genomischer Wiederholungen. Bioinformatik 21, 152–158 (2005).

Artikel Google Scholar

Price, AL, Jones, NC & Pevzner, PA De-novo-Identifizierung von Wiederholungsfamilien in großen Genomen. Bioinformatik 21, 351–358 (2005).

Artikel Google Scholar

Xu, Z. & Wang, H. LTR_FINDER: ein effizientes Werkzeug zur Vorhersage von LTR-Retrotransposons voller Länge. Nukleinsäuren Res. 35, W265–W268 (2007).

Artikel PubMed PubMed Central Google Scholar

Wicker, T. et al. Ein einheitliches Klassifizierungssystem für eukaryontische transponierbare Elemente. Nat. Rev. Genet. 8, 973–982 (2007).

Artikel CAS PubMed Google Scholar

Tarailo-Graovac, M. & Chen, N. Verwenden von RepeatMasker zur Identifizierung repetitiver Elemente in Genomsequenzen. Curr. Protokoll. Bioinforma. 25, 4.10.1–4.10.14 (2009).

Artikel Google Scholar

Jurka, J. et al. Repbase Update, eine Datenbank eukaryotischer repetitiver Elemente. Cytogenet Genome Res. 110, 462–467 (2005).

Artikel CAS PubMed Google Scholar

Stanke, M., Steinkamp, ​​R., Waack, S. & Morgenstern, B. AUGUSTUS: ein Webserver zur Gensuche in Eukaryoten. Nukleinsäuren Res. 32, W309–W312 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Majoros, WH, Pertea, M. & Salzberg, SL TigrScan und GlimmerHMM: zwei Open-Source-Ab-initio-Genfinder für eukaryotische Gene. Bioinformatik 20, 2878–2879 (2004).

Artikel CAS PubMed Google Scholar

Bromberg, Y. & Rost, B. SNAP: Vorhersage der Auswirkung nicht-synonymer Polymorphismen auf die Funktion. Nukleinsäuren Res. 35, 3823–3835 (2007).

Artikel CAS PubMed PubMed Central Google Scholar

Blanco, E., Parra, G. & Guigó, R. Verwendung von Geneid zur Identifizierung von Genen. Curr. Protokoll. Bioinforma. 18, 4.3.1–4.3.28 (2007).

Artikel Google Scholar

Altschul, SF et al. Grundlegendes Suchwerkzeug für die lokale Ausrichtung. J. Mol. Biol. 215, 403–410 (1990).

Artikel CAS PubMed Google Scholar

Keilwagen, J. et al. Verwendung der Intronpositionskonservierung für die homologiebasierte Genvorhersage. Nukleinsäuren Res. 44, e89 (2016).

Artikel PubMed PubMed Central CAS Google Scholar

Tang, S., Lomsadze, A. & Borodovsky, M. Identifizierung proteinkodierender Regionen in RNA-Transkripten. Nukleinsäuren Res. 43, e78 (2015).

Artikel PubMed PubMed Central CAS Google Scholar

Haas, BJ et al. Automatisierte Annotation der eukaryotischen Genstruktur mit EVidenceModeler und dem Programm zum Zusammenstellen gespleißter Alignments. Genombiol. 9, R7 (2008).

Artikel PubMed PubMed Central CAS Google Scholar

Campbell, MA et al. Umfassende Analyse des alternativen Spleißens in Reis und vergleichende Analysen mit Arabidopsis. BMC Genomics 7, 327 (2006).

Artikel PubMed PubMed Central CAS Google Scholar

Boeckmann, B. et al. Die Protein-Wissensdatenbank SWISS-PROT und ihre Ergänzung TrEMBL im Jahr 2003. Nucleic Acids Res. 31, 365–370 (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Conesa, A. et al. Blast2GO: ein universelles Tool zur Annotation, Visualisierung und Analyse in der funktionellen Genomforschung. Bioinformatik 21, 3674–3676 (2005).

Artikel CAS PubMed Google Scholar

Ashburner, M. et al. Genontologie: Werkzeug zur Vereinheitlichung der Biologie. Das Gen-Ontologie-Konsortium. Nat. Genet. 25, 25–29 (2000).

Artikel CAS PubMed PubMed Central Google Scholar

Kanehisa, M. & Goto, S. KEGG: Kyoto-Enzyklopädie der Gene und Genome. Nukleinsäuren Res. 28, 27–30 (2000).

Artikel CAS PubMed PubMed Central Google Scholar

Li, L., Stoeckert, CJ & Roos, DS OrthoMCL: Identifizierung orthologer Gruppen für eukaryontische Genome. Genomres. 13, 2178–2189 (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Katoh, K. & Standley, DM MAFFT Multiple Sequence Alignment Software Version 7: Verbesserungen bei Leistung und Benutzerfreundlichkeit. Mol. Biol. Entwicklung 30, 772–780 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Castresana, J. Auswahl konservierter Blöcke aus mehreren Alignments für ihre Verwendung in der phylogenetischen Analyse. Mol. Biol. Entwicklung 17, 540–552 (2000).

Artikel CAS PubMed Google Scholar

Stamatakis, A. RAxML-VI-HPC: Maximum-Likelihood-basierte phylogenetische Analysen mit Tausenden von Taxa und gemischten Modellen. Bioinformatik 22, 2688–2690 (2006).

Artikel CAS PubMed Google Scholar

Yang, Z. PAML 4: Phylogenetische Analyse nach Maximum Likelihood. Mol. Biol. Entwicklung 24, 1586–1591 (2007).

Artikel CAS PubMed Google Scholar

De Bie, T. et al. CAFE: ein Computertool zur Untersuchung der Evolution von Genfamilien. Bioinformatik 22, 1269–1271 (2006).

Artikel CAS PubMed Google Scholar

Chen, C. et al. TBtools: Ein integratives Toolkit, das für interaktive Analysen großer biologischer Daten entwickelt wurde. Mol. Werk 13, 1194–1202 (2020).

Artikel CAS PubMed Google Scholar

Krzywinski, M. et al. Circos: Eine Informationsästhetik für die vergleichende Genomik. Genomres. 19, 1639–1645 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Die Forschung wurde von der National Natural Science Foundation of China (31701497 und 31601371), der Natural Science Foundation of Jiangsu Province (BK20160600 und BK20180312) und dem Jiangsu Key Laboratory for the Research and Utilization of Plant Resources (JSPKLB201801 und JSPKLB201832) unterstützt.

Diese Autoren haben gleichermaßen beigetragen: Xiaoyang Xu, Haiyan Yuan

Institut für Botanik, Provinz Jiangsu und Chinesische Akademie der Wissenschaften/Plattform der Provinz Jiangsu für die Erhaltung und Nutzung von landwirtschaftlichem Keimplasma, Nanjing, 210014, Jiangsu, China

Xiaoyang Xu, Haiyan Yuan, Suzhen Huang, Yuming Sun, Ting Zhang, Qingquan Liu, Haiying Tong, Yongxia Zhang, Yinjie Wang, Menglan Hou und Yongheng Yang

Hochschule für Gartenbau, Nanjing Agricultural University, Nanjing, 210095, Jiangsu, China

Xiaqing Yu

Institut für Pomologie, Jiangsu Academy of Agricultural Sciences/Jiangsu Key Laboratory for Horticultural Crop Genetic Improvement, Nanjing, 210014, Jiangsu, China

Chunxiao Liu

Biomarker Technologies Corporation, Peking, 101300, China

Lei Wu

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

XX, YY und HY konzipierten die Studie; HT, YW und YZ sammelten Proben; LW und XX führten die Genomsequenzierung durch; XX, XY, SH, YS, CL, TZ, QL und MH führten die Datenanalysen durch; XX und HY haben das Manuskript geschrieben; und YY überarbeitete das Manuskript. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Yongheng Yang.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Ergänzende Abbildungen 1–8 Unser Artikel enthält nur zwei ergänzende Dateien, die ergänzenden Tabellen 1–11 und die ergänzenden Abbildungen 1–8. Bitte löschen Sie die doppelten Zusatzdateien, danke.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Xu, X., Yuan, H., Yu, X. et al. Das Stevia-Genom auf Chromosomenebene bietet Einblicke in die Steviolglycosid-Biosynthese. Hortic Res 8, 129 (2021). https://doi.org/10.1038/s41438-021-00565-4

Zitat herunterladen

Eingegangen: 23. November 2020

Überarbeitet: 07. März 2021

Angenommen: 14. März 2021

Veröffentlicht: 01. Juni 2021

DOI: https://doi.org/10.1038/s41438-021-00565-4

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

BMC Pflanzenbiologie (2023)

Genetische Ressourcen und Pflanzenentwicklung (2023)

Pflanzliche Zell-, Gewebe- und Organkultur (PCTOC) (2022)