Por favor, use este identificador para citar o enlazar este ítem:
https://www.arca.fiocruz.br/handle/icict/19538
Tipo
DisertaciónDerechos de autor
Acceso abierto
Colecciones
Metadatos
Mostrar el registro completo del ítem
INTEGRAÇÃO DE DADOS DE EXPRESSÃO GÊNICA E PROTEÔMICA EM REDES DE INTERAÇÃO PROTEÍNA-PROTEÍNA DE TRYPANOSOMA CRUZI
Redes biológicas
Redes de interação proteína-proteína
Proteínas
Trypanosoma cruzi
Integração de dados
Interaction network
Protein
Trypanosoma cruzi
Data integration
Guimarães, Frederico Gonçalves | Fecha del documento:
2017
Director
Co-director
Miembros de la junta
Afiliación
Fundação Oswaldo Cruz. Instituto René Rachou. Belo Horizonte, MG, Brasil.
Resumen en portugues
Paradoxalmente vivemos um momento da pesquisa científica em que possuímos um volume abundante de dados, mas com dificuldades cada vez maiores de se obter informações a partir deles. Diversidade de formatos, dificuldade na construção de uma forma de acesso simples, mas não superficial, ausência de um identificador único para as unidades biológicas de estudo (proteínas, RNAs, genes, etc.) e falta de integração entre os bancos de dados são alguns dos desafios enfrentados cotidianamente na tarefa de mineração de informações a partir dessas diversas fontes. Com o objetivo de contribuir na tarefa de extração de informações a partir de fontes públicas, mediante a integração de dados de enriquecimento funcional, construímos uma metodologia de trabalho que permite a obtenção, filtragem e tratamento de dados oriundos do banco STRING v.10 e de análises massivas de RNA e proteínas, integrando-os em redes de interação proteína-proteína através do software Cytoscape . Como organismo modelo, trabalhamos com dois clones de Trypanosoma cruzi , apresentando diferenças relacionadas aos perfis de infectividade (alta e baixa infectividade). Utilizamos dados de genes diferencialmente expressos identificados em experimentos de RNA-Seq e shotgun proteomics . Durante o estudo foram construídos 11 scripts e 3 programas, parte integrante de uma metodologia modular aplicável a outros organismos e modelos experimentais, tanto em sua totalidade quando parcialmente. Como resultado, além da metodologia, obtivemos também o resultado de sua implementação, que consistiu de uma série de redes de interação proteína-proteína do organismo estudado, onde foram destacadas características de interesse biológico, tais como informações de EC number, agrupamentos funcionais, tipo de interação entre as proteínas e importância das proteínas segundo métricas de teoria de grafos. Concluímos, então, que a utilização de redes de interação proteína-proteína pode ser uma ótima estratégia tanto para a realização de novos estudos quanto para a revisão de estudos anteriores, uma vez que podemos extrair novas informações a partir de dados já existentes publicamente. Além disso as redes nos fornecem uma visão sistêmica do organismo, o que pode desvelar novos olhares sobre a sua biologia dos organismos de estudo.
Resumen en ingles
The present epistemological moment in scientific research is characterized by a paradox: there is a considerable amount of data, but the odds in the process of obtaining information from them is overwhelming and growing. The differences between data formats and the difficulties in their handling, the absence of a single identifier for the biological units of investigation (proteins, RNAs, genes etc.) and the lack of integration between the existing databases are some of the challenges researchers face constantly in the task of information mining from this multiple sources. We have built, with the main purpose of contributing to better extracting information from public databases and through the integration of functional enrichment data, a procedural methodology that leads to the obtaining, filtering and handling of data originally contained in the STRING v.10 public database and massive analysis of RNA and proteins, integrating them in protein-protein interaction networks with Cytoscape . As model organism, we used two clones of Trypanosoma cruzi , with different infectivity profiles (high and low infectivity). We used differentially expressed gene data from RNA-Seq and shotgun proteomics experiments. Along our study we built 11 scripts and 3 programs, integrating a modular methodology applied to other organisms and experimental models, as a whole or partially. This work also comes out with the results of the implementation of such a methodological innovation, which consists of a series of protein-protein interaction networks that emphasize characteristics of biological interest, as EC number information, functional grouping, protein interaction type and the relevance of protein according to graph theory metrics. We come to a conclusion that the use of protein-protein interaction networks can be an excellent strategy even to produce new researches as to review existing ones, once it’s possible to mine new informations from data previously published. Such a procedure becomes especially relevant under the consideration that the strategy of using networks makes it possible to cast a new perspective on current scientific research, usually centered in the study of individual components and not in the systemic aspects of an organism's interactions.
Palabras clave en portugues
BioinformáticaRedes biológicas
Redes de interação proteína-proteína
Proteínas
Trypanosoma cruzi
Integração de dados
Palabras clave en ingles
BioinformaticsInteraction network
Protein
Trypanosoma cruzi
Data integration
Compartir