• Metodi computazionali per l'annotazione di genomi e proteomi
  • Computational methods for genome and proteome annotation
  • Indio, Valentina <1982>

Subject

  • BIO/10 Biochimica

Description

  • Il progresso tecnologico nel campo della biologia molecolare, pone la comunità scientifica di fronte all’esigenza di dare un’interpretazione all’enormità di sequenze biologiche che a mano a mano vanno a costituire le banche dati, siano esse proteine o acidi nucleici. In questo contesto la bioinformatica gioca un ruolo di primaria importanza. Un nuovo livello di possibilità conoscitive è stato introdotto con le tecnologie di Next Generation Sequencing (NGS), per mezzo delle quali è possibile ottenere interi genomi o trascrittomi in poco tempo e con bassi costi. Tra le applicazioni del NGS più rilevanti ci sono senza dubbio quelle oncologiche che prevedono la caratterizzazione genomica di tessuti tumorali e lo sviluppo di nuovi approcci diagnostici e terapeutici per il trattamento del cancro. Con l’analisi NGS è possibile individuare il set completo di variazioni che esistono nel genoma tumorale come varianti a singolo nucleotide, riarrangiamenti cromosomici, inserzioni e delezioni. Va però sottolineato che le variazioni trovate nei geni vanno in ultima battuta osservate dal punto di vista degli effetti a livello delle proteine in quanto esse sono le responsabili più dirette dei fenotipi alterati riscontrabili nella cellula tumorale. L’expertise bioinformatica va quindi collocata sia a livello dell’analisi del dato prodotto per mezzo di NGS ma anche nelle fasi successive ove è necessario effettuare l’annotazione dei geni contenuti nel genoma sequenziato e delle relative strutture proteiche che da esso sono espresse, o, come nel caso dello studio mutazionale, la valutazione dell’effetto della variazione genomica. È in questo contesto che si colloca il lavoro presentato: da un lato lo sviluppo di metodologie computazionali per l’annotazione di sequenze proteiche e dall’altro la messa a punto di una pipeline di analisi di dati prodotti con tecnologie NGS in applicazioni oncologiche avente come scopo finale quello della individuazione e caratterizzazione delle mutazioni genetiche tumorali a livello proteico.
  • The technological advancement in the molecular biology field is strongly dependent from the availability of bioinformatics support in order to manage and to interpret the very large amount of biological sequences produced. A new level of knowledge is derivable from the Next Generation Sequencing technology (NGS), that allows to obtain whole genomes and transcriptomes in few days and with low costs. Cancer research is one of the most relevant applications of NGS technology. With the NGS analysis is possible to perform the genomic characterization of tumors highlighting all the detectable mutations such as single nucleotide variants, chromosomal rearrangements, insertions and deletions, in order to develop new diagnostic, prognostic and therapeutic approaches in the cancer treatment. However, the genetic variation found in the samples must be analyzed at protein level since they directly alter the tumor cell phenotype. The bioinformatic expertise is essential to implement the NGS data analysis and also to perform the annotation of the genes emerging from the sequenced genome and of the protein expressed by it. In this work of thesis two computational methods for protein annotation have been developed (prediction of targeting and signal peptides); moreover we will introduce a bioinformatic pipeline to analyze NGS data and to annotate the genetic variants in the cancer genomic research.

Date

  • 2014-04-11

Type

  • Doctoral Thesis
  • PeerReviewed

Format

  • application/pdf

Identifier

urn:nbn:it:unibo-13008

Indio, Valentina (2014) Metodi computazionali per l'annotazione di genomi e proteomi, [Dissertation thesis], Alma Mater Studiorum Università di Bologna. Dottorato di ricerca in Scienze biochimiche e biotecnologiche , 26 Ciclo. DOI 10.6092/unibo/amsdottorato/6619.

Relations