Genetische Variation und Struktur des vollständigen Chloroplastengenoms in gebietsfremden einhäusigen und zweihäusigen Amaranthus-Unkräutern

Genomische Merkmale

Die vierteilige Struktur von 22 Proben von 17 Arten in Amaranthus besteht aus einer großen Single-Copy-Region (LSC mit 83, 382–84, 062 bp), einer kleinen Single-Copy-Region (SSC mit 17, 937 – 18, 124 bp) und einem Paar invertierter Repeat-Regionen (IRs mit 23, 964–24, 357 bp). Die volle Länge der 22-cp-Genome reicht von 149.949 bp in A. polygonoides bis 150, 756 bp ein A. Albus (Tabelle 1). Die Chloroplastengenomsequenzen wurden in der GenBank hinterlegt (Tabelle 1).

Tabelle 1 Zusammenfassende Informationen für die Chloroplastengenome von Amaranthus.

Der Gesamt-GC-Gehalt betrug nur 36,5 % bis 36,6 % A. Albus, A. blitoides und A. polygonoides haben einen GC-Gehalt von 36,5 % (Tabelle 1). Das Chloroplastengenom enthält insgesamt 133 Gene, darunter 88 proteinkodierende Gene, 37 tRNA-Gene und 8 rRNA-Gene, von denen 18 in den invertierten Wiederholungsregionen dupliziert wurden (siehe Ergänzungstabelle S1 online). Das Gen rps12 wurde transgespleißt; das 50-Ende-Exon war in der LSC-Region lokalisiert, wohingegen das 30-Ende-Intron und -Exon dupliziert waren und in den invertierten Wiederholungsregionen lokalisiert waren. Das teilweise Duplikat von rps19 und ycf1 Gene erschienen als Pseudogene, da sie ihre Fähigkeit zur Proteinkodierung verloren. 16 Gene haben Introns.

Varianten von cp-Genomen

Die Länge der SSC-Region wurde unter den Untergattungen konserviert, indem die Länge der Chloroplastengenome von 22 Individuen aus 17 Arten verglichen wurde. A. palmeri, A. tuberculatus und A. arenicola im Untergen. Acnida waren 18.027–18.042 bp lang, die SSC-Länge von 5 Arten von Subgen. Amaranthus betrug 17,937–17,948 bp, und die SSC-Länge von 8 Arten von Subgen. Albersia betrug 18,057–18,124 bp (Tabellen 1, 2). Es waren ungefähr 77 bp InDels drin ndhE-G und 180 bp InDels ein ndhG-I, was die Variation der SSC-Länge zwischen den Untergattungen induziert (Tabelle 2; siehe ergänzende Abb. S1 online). Die Häufigkeiten von SNPs und InDels in den Chloroplastengenomen der 17 Arten betrugen 1,79 % bzw. 2,86 % (Tabelle 3). Die Häufigkeiten von SNPs und InDels in den Genen betrugen 1,22 % und 1,14 %, und die Häufigkeiten von SNPs und InDels im intergenischen Spacer betrugen 3,25 % bzw. 7,32 % (Tabelle 3). Im Allgemeinen trat die Variation hauptsächlich in der intergenischen Spacer-Region auf, und InDels traten hauptsächlich in der nicht-codierenden Region auf (Tabelle 3). Die längste InDel war 387 bp, die am auftrat ycf2gefolgt von 384 bp InDel an psbM-trnD.

Tabelle 2 Längenunterschiede der SSC-Regionen des Chloroplastengenoms auf Untergattungsebene in Amaranthus.
Tabelle 3 Variation der Chloroplastengenome in Amaranthus.

Wiederholungs- und SSR-Analysen

Jede Art hat 28 bis 38 Repeats, die auf 30 Stellen verteilt sind, darunter 11 bis 14 Forward-Repeats, 11 bis 17 palindromische Repeats und 6 bis 8 Reverse-Repeats mit einer Länge von 30 bis 64 bp. Es gab 19 gemeinsame Wiederholungsstellen, von denen 11 keine Variation aufwiesen und 8 eine Variation in der Länge aufwiesen. R3, R8, R11 und R13 hatten die häufigste Variation (Abb. 2). Das R12 (Vorwärts- und Rückwärtswiederholungen) wurde in LSC, IRa, SSC und IRb verteilt. Das R12 auf SSC ist fast entgegengesetzt zu R12 auf LSC und teilt das gesamte kreisförmige Genom in zwei Teile von nahezu gleicher Länge. Die Repeats auf LSC waren hauptsächlich in der Nähe von Repeat 12 (Loci 29.572–46.282), Loci 8166–8327, Loci 29.572 und Loci 75.230 konzentriert. Die Wiederholungen auf IRs sind innerhalb der Gattung konstant. Es gab zwei gemeinsame Wiederholungen in SSC, und eine war eine Palindromsequenz, die von Subgen geteilt wurde. AcnidaUntergen. Amaranthusund A. Albus.

Figur 2
Bild 2

Die Verteilung von Wiederholungssequenzen an 30 Loci in Amaranthus. „R“ ist die Abkürzung für Wiederholung. Das rote Liniensegment R12 und die schwarzen Liniensegmente sind Wiederholungen in allen 17 Arten, das orangefarbene Liniensegment repräsentiert eine sich wiederholende Sequenz in einigen Arten. Eine Wiederholung mit nur einem Liniensegment zeigt an, dass an der Stelle nur eine Wiederholung vorhanden ist, und umgekehrt zeigt an, dass an der Stelle mehrere verschiedene Wiederholungen vorhanden sind. Die Chloroplasten-Genomfigur wurde von Geneious Prime v. 2020.1.2-Software.

Die MISA-Analyse zeigte, dass jedes cp-Genom von Amaranthus enthielten 29–39 SSRs (siehe Ergänzungstabelle S4 online). Im Durchschnitt war die Anzahl der SSR-Typen von mehr bis weniger Mono-, Tetra-, Di-, Tri-, Penta- und Hexanukleotide in der Reihenfolge (siehe Ergänzungstabelle S4 online). Etwa 55,56 % dieser SSRs bestanden aus A- oder T-Basen. Unter allen SSRs befinden sich die meisten Loci in LSC (77,78 %) und IGS (71,91 %). Etwa 12 Wiederholungsmotive wurden von allen Arten der Gattung geteilt, während die verbleibenden Motive artspezifisch oder subgattungsspezifisch waren (siehe Ergänzungstabelle S4 online). Unterschiedliche Kombinationen von SSR-Markern konnten alle Arten außer unterscheiden A. standleynaus und A. Crispus, A. dubius und A. spinosus (siehe Ergänzungstabelle S4 online).

Phylogenetische Bäume ganzer Chloroplastengenome

Die Topologien der phylogenetischen Bäume, die mit Maximum-Likelihood- und Bayes’schen Methoden konstruiert wurden, waren im Grunde die gleichen. A. palmeri, A. arenicola und A. tuberculatus geclustert (BS/PP = 100/1) zu Subgen. Acnidaoder die Diözische Klade (Abb. 3). A. hybridus, A. hypochondriacus, A. dubius, A. spinosus, A. retroflexus geclustert (BS/PP = 100/1), um Subgen darzustellen. Amaranthus, oder die Hyridus Clade (Abb. 3). Und die beiden oben genannten Kladen waren sehr nahe beieinander (BS/PP = 100/1) (Abb. 3). A. Albus und A. blitoides wurden mit niedrigem/mäßigem Wert (BS/PP = 35/0,84) geclustert und vom Subgen getrennt. Albersia und waren eng verwandt mit subgen. Amaranthus und Untergen. Acnida (BS/PP = 58/0,99) (Abb. 3). Unter den drei Arten von subgen. Albersia Vertrieb auf Galapagos, A. polygonoides wurde zu einem einzigen Basalzweig. Die anderen beiden Arten, A. Albus und A. blitoides, bildeten eine separate Clade (Galápagos Clade). Der Rest von Untergen. Albersia wurden zu einem Zweig zusammengefasst, nämlich der ESA + South American Clade (BS/PP = 100/1) (Abb. 3).

Figur 3
Bild 3

Ein topologischer Baum mit maximaler Wahrscheinlichkeit basierend auf dem Chloroplastengenom von Amaranthus und drei Außengruppen. Die Werte an jedem Knoten geben den Maximum-Likelihood-Bootstrap-Support (BS)/Bayesian Inference Posterior Probability (PP)-Wert an. Mit grauem Hintergrund markierte Individuen repräsentieren große monophyletische Zweige in der Gattung. Die Dateien im Newick-Format werden in MEGA Version 6 importiert, um den endgültigen Topologiebaum zu generieren.

Hotspots für Amaranthus

Die durch das erschöpfende Verfahren gesuchten teilweise qualifizierten Fragmentbereiche wurden überlappt, und die überlappten Bereiche wurden als Hotspot-Bereich miteinander kombiniert. Schließlich wurden 16 Hotspot-Fragmente mit einer Länge von 737 bis 2818 bp erhalten, und die SNP-Variationsfrequenz lag im Bereich von 0,78 bis 1,49 % (siehe Ergänzungstabelle S3 online). Die topologischen Bäume, die durch die Alignments dieser 17 heißen Fragmente konstruiert wurden, und die topologischen Bäume, die durch die Alignment-Sequenzen jedes Gens und des intergenischen Spacers konstruiert wurden, stimmten mit dem topologischen Baum des Chloroplastengenoms überein, nämlich die Hotspots mit mehr als 90 % Bootstrap-Wertunterstützung für die Untergen. AmaranthusUntergen. Acnida und Untergen. Albersia Filiale (ausschl A. Albus, A. polygonoidesund A. blitoides) wurden ndhF-rpl32, ycf1 und rpoC2 (Abb. 4).

Figur 4
Figur 4

Drei topologische Bäume mit maximaler Wahrscheinlichkeit basierend auf rpoC2, ndhF-rpl32 und ycf1 von Amaranthus und drei Außengruppen. Die Werte an jedem Knoten geben den Maximum-Likelihood-Bootstrap-Support (BS)/Bayesian Inference Posterior Probability (PP)-Wert an. „AMA“ steht für das Subgen. Amaranthus„ACN“ steht für das Subgen. Acnida„ALB“ steht für das Subgen. Albersia. Die Dateien im Newick-Format werden in MEGA Version 6 importiert, um den endgültigen Topologiebaum zu generieren.

In mehreren ähnlichen Taxa gab es 25 InDels und 11 SNPs dazwischen A. tunetanus und A.standleyanus. A. Crispus und A.standleyanus hatte keinen unterschied. Dazwischen liegen 46 SNPs und 144 InDels A. arenicola und A. tuberculatus. Durch Sequenzabgleich und Variationsanalyse wurde festgestellt, dass trnK-UUUatpF, trnT-UGUatpB, psbEclpP, rpl14rps19, ndhF-D zur Unterscheidung dienen könnte A. tunetanus aus A.standleyanus, A. Crispusund A. arenicola aus A. tuberculatus.

Leave a Comment

Your email address will not be published.