Please use this identifier to cite or link to this item: http://hdl.handle.net/2067/3140
Title: De novo assembly of giant reed (Arundo donax L.) leaf transcriptome using RNA-Seq provides insight into drought response, gene discovery and genetic marker identification
Other Titles: L'assemblaggio de novo del trascrittoma della foglia della canna comune (Arundo donax L.) usando RNA-Seq fornisce delucidazioni sulla risposta alla siccità, scoperta di geni e identificazione di marcatori genetici
Authors: Evangelistella, Chiara
Keywords: Arundo donax;Drougth;Biofuel;De novo leaf transcriptome;RNA-Seq;Genic-SSRs;DETs;Siccità;Biocarburanti;Trascrittoma de novo della foglia;SSRs genici;AGR/05
Issue Date: 6-Jun-2017
Publisher: Università degli studi della Tuscia - Viterbo
Series/Report no.: Tesi dei dottorato di ricerca. 29. ciclo
Abstract: 
Introduction
Arundo donax has attracted renewed interest as a potential candidate bioenergy crop for use in biomass-to-liquid fuel-conversion processes and biorefineries. This is due to its high productivity, adaptability to marginal lands, among which drought-prone environments, and suitability for biofuel and biomaterial production. Despite its importance, currently the genomic resources publicly available for supporting the improvement of this species are still limited and also there is little information about its molecular response to drought in field.
Results
Illumina next-generation mRNA-sequencing (mRNA-Seq) was used to de novo assemble and characterize the A. donax leaf transcriptome. The sequencing generated 1,249 million clean reads that were assembled using single-k-mer (SK) and multi-k-mer (MK) approaches into 62,596 unique sequences (unitranscripts) with an N50 of 1,134 bp. TransDecoder and Trinotate software suites were used to obtain putative coding sequences and to annotate them by mapping to UniProtKB/Swiss-Prot and UniRef90 databases, searching for known transcripts, proteins, protein domains and signal peptides. Furthermore, the unitranscripts were annotated by mapping them to the NCBI non-redundant, GO and KEGG pathway databases using Blast2GO software. The transcriptome was also characterized by customized BLAST searches to investigate homologous transcripts of key genes involved in important metabolic pathways, such as lignin, cellulose, purine and thiamine biosynthesis and carbon fixation. Moreover, a set of homologous transcripts of key genes involved in stomatal development and of genes coding for stress-associated proteins (SAPs) was identified. Additionally, 8,364 simple sequence repeat (SSR) markers were identified that represent the first genetic marker catalog of A. donax. Furthermore, 53 SSRs (PolySSRs) were then predicted to be polymorphic between ecotype-specific assemblies, suggesting a certain degree of genetic variability in the studied A. donax ecotypes (called EcoA, EcoB and EcoC). Furthermore, differentially expressed transcripts (DETs) between well-watered (WW) and natural moderate drought stress (mDr) conditions were identified in three A. donax ecotypes and three different timepoints (referred as T1, T2 and T3). All the three ecotypes over-expressed transcripts encoding for PFP and JIPs proteins, and employed the ABA (abscisic acid)-dependent pathways to cope with drought stress, several differentially regulated transcripts belonging to different transcription factors (TFs) families (e.g. NAC, WRKY, MYC, MYB, AP2/ERF, bZIP, FAR, FRS, bHLH, PIF) and encoding for proteins involved in ABA perception (e.g. PP2C, PYL4-like and PYR1-like). The differential regulation of FAR1 and FRS genes in EcoA and EcoB could be associated with a greater control of stomata size, thereby of water loss, and thus suggesting a greater ability to tolerate
drought stress compared to EcoC. In addition, in EcoA the down-regulation of SDD1 gene, together with the up-regulation of FAR1 transcript, could be associated with a molecular adaptive response of this ecotype which controls stomatal density and size to fine-regulate water flow and gas exchange under drought stress. Furthermore, all the three ecotypes down-regulated different AQP genes (e.g. NIP2;2 and NIP 1;1-like; TIP1;1 and TIP4;2; SIP2;1 and PIP1;1 and PIP2;7) in order to regulate water flow across cells and subcellular compartments. Finally, for EcoC transcripts encoding for a TNKS1-like proteins were up-regulated, suggesting a role of this gene, which is involved in DNA damage repair, cell death pathways, transcription regulation and chromatin modification/remodeling, in the drought stress response of this ecotype. In addition, for EcoA and EcoB the down-regulation of genes involved in the lignin biosynthetic pathway was observed, which represents an important result in the context of A. donax as bioenergy crop for biofuel production. Finally, in EcoA and EcoB the down-regulation of EIL3 gene could be associated with a delay in the progression of drought-induced leaf senescence and, a possible increase in water stress tolerance in these ecotypes.
Conclusions
This study provides the first publicly available transcriptome resource for A. donax bioenergy crop. The functional annotation and characterization of the leaf transcriptome will be highly useful for providing insight into the molecular mechanisms underlying the extreme adaptability of A. donax. The identification of homologous transcripts involved in key metabolic pathways offers a platform that will direct future efforts in genetic improvement of this species. In addition, the identified SSRs will facilitate the harnessing of untapped genetic diversity. This transcriptome should be of value to ongoing functional genomics and genetic studies in this crop of paramount economic importance. Finally, differential expression (DE) analysis allowed the identification of potential candidate genes useful for accelerating future molecular breeding program aiming to obtain increasingly drought tolerant A. donax ecotypes.

Introduzione
Arundo donax ha cominciato ad attirare interesse rinnovato come potenziale coltura bioenergetica candidata per i processi di conversione della biomassa in carburante liquido e per le bioraffinerie. Ciò è dovuto alla sua elevata produttività, adattabilità ai terreni marginali, tra i quali gli ambienti soggetti a siccità, e per la sua idoneità per la produzione di biocarburanti e biomateriali. Nonostante la sua importanza, attualmente le risorse genomiche pubblicamente disponibili per supportare il miglioramento di tale specie sono ancora limitate ed, inoltre, vi è una limitata conoscenza circa le sue risposte alla siccità in campo.
Risultati
Illumina next-generation mRNA-sequencing (mRNA-Seq) è stato utilizzato per assemblare de novo e caratterizzare il trascrittoma della foglia di A. donax. Il sequenziamento ha generato 1,249 milioni di ‘reads’ che sono state assemblate utilizzando gli approcci single-k-mer (SK) and multi-k-mer (MK) in 62,596 sequenze uniche (unitrascritti) con un N50 di 1,134 bp.
I software TransDecoder e Trinotate sono stati utilizzati per ottenere putative sequenze codificanti e per annotarle mappandole sui database UniProtKB/Swiss-Prot e UniRef90, ricercando trascritti, proteine, domini proteici e peptidi segnale noti. Inoltre, gli unitrascritti sono stati annotati mappandoli sui database NCBI non-redundant, GO and KEGG pathway utilizzando il software Blast2GO. Il trascrittoma è stato inoltre caratterizzato attraverso ricerche BLAST personalizzate per investigare la presenza di trascritti omologhi a geni chiave coinvolti in importanti processi metabolici, come la biosintesi di lignina, cellulosa, purina e tiamina e la fissazione del carbonio. In aggiunta, sono stati identificati nel trascrittoma un set di trascritti omologhi a geni chiave coinvolti nello sviluppo degli stomi e di geni codificanti per le proteine associate allo stress (SAPs). Inoltre, 8,364 marcatori simple sequence repeat (SSR) sono stati identificati e rappresentano il primo catalogo di marcatori genetici di A. donax. Di questi, 53 SSRs (PolySSRs) sono stati predetti come polimorfici tra gli ecotipi, suggerendo un certo grado di variabilità genetica negli ecotipi studiati (denominati EcoA, EcoB e EcoC). In aggiunta, sono stati identificati trascritti differenzialmente espressi (DETs) tra le condizioni ‘well-watered’ (WW) e ‘natural moderate drought stress’ (mDr) nei tre ecotipi e tra i tre differenti ‘timepoints’ (denominati T1, T2 e T3). Tutti i tre ecotipi over – esprimevano trascritti codificanti per le proteine PFP e JIPs, e coinvolti nei pathways dipendenti dall’ acido abscissico (ABA) per affrontare lo stress idrico, diversi trascritti differenzialmente regolati appartenenti a differenti famiglie di fattori di trascrizione (TFs) (ad es. NAC, WRKY, MYC, MYB, AP2/ERF, bZIP, FAR, FRS, bHLH, PIF) e codificanti per proteine coinvolte nella percezione dell’ABA (come PP2C, PYL4-like e PYR1-like). La regolazione differenziale dei geni
FAR1 e FRS negli ecotipi EcoA e EcoB potrebbe essere associata con un maggior controllo della grandezza degli stomi, e in tal modo la perdita di acqua, e quindi suggerendo una maggiore capacità a tollerare lo stress idrico rispetto all’ecotipo EcoC. In aggiunta, nell’ecotipo EcoA la down-regolazione del gene SDD1, insieme all’up-regolazione del trascritto FAR1, potrebbe essere associata con una risposta molecolare adattativa di questo ecotipo nel controllare la densità e la dimensione degli stomi al fine di regolare il flusso dell’acqua e degli scambi gassosi sotto stress idrico. Inoltre, tutti e tre gli ecotipi la down-regolazione di differenti geni AQP (ad es. NIP2;2 e NIP 1;1-like; TIP1;1 e TIP4;2; SIP2;1 e PIP1;1 e PIP2;7) al fine di regolare i flussi di acqua attraverso le cellule e i compartimenti subcellulari. Inoltre, per l’ecotipo EcoC i trascritti codificanti per le proteine TNKS1-like erano up-regolati, suggerendo un ruolo di questo gene, coinvolto nel riparo al danno al DNA, nei pathways per la morte cellulare, nella regolazione trascrizionale e nel rimodellamento/modifica della cromatina, nella risposta alla siccità di questo ecotipo. Inoltre, per gli ecotipi EcoA e EcoB è stata osservata una down-regolazione dei geni coinvolti nel pathway biosintetico della lignina; ciò rappresenta un risultato importante nell’uso di A. donax come coltura bioenergetica per la produzione di biocarburanti. Infine, negli ecotipi EcoA e EcoB la down-regolazione del gene EIL3 potrebbe essere associata con un ritardo nella progressione della senescenza della foglia indotta dallo stress idrico ed a un possibile aumento in questi ecotipi della tolleranza allo stress idrico.
Conclusione
Questo studio fornisce la prima risorsa trascrittomica pubblicamente disponibile per la coltura bioenergetica A. donax. L’annotazione funzionale e la caratterizzazione del trascrittoma della foglia sarà altamente utile per fornire delucidazioni riguardo i meccanismi molecolari alla base dell’estrema adattabilità di A. donax. L’identificazione di trascritti omologhi a quelli coinvolti in pathway metabolici chiave offre una piattaforma che dirigerà i futuri sforzi volti al miglioramento genetico di questa specie. In aggiunta, l’identificazione di SSRs faciliterà lo sfruttamento dell’inesplorata diversità genetica. Il trascrittoma sarà di valore per continuare gli studi genetici e di genomica funzionale in questa coltura caratterizzata dalla grande importanza economica. Infine, l’analisi di espressione genica differenziale ha permesso l’identificazione di potenziali geni candidati utili per accelerare i programmi di breeding molecolare con l’obiettivo di ottenere ecotipi di A. donax maggiormente tolleranti alla siccità.
Description: 
Dottorato di ricerca in Scienze, tecnologie e biotecnologie per la sostenibilità
URI: http://hdl.handle.net/2067/3140
Appears in Collections:Archivio delle tesi di dottorato di ricerca

Files in This Item:
File Description SizeFormat
cevangelistella_tesid.pdf3.93 MBAdobe PDFView/Open
Show full item record

Page view(s)

3
Last Week
1
Last month
0
checked on Oct 25, 2020

Download(s)

1
checked on Oct 25, 2020

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.