Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/29689
Type
DissertationCopyright
Open access
Embargo date
2019-09-12
Collections
Metadata
Show full item record
ANÁLISE COMPARATIVA DA DIVERSIDADE DE SPLICING ALTERNATIVO NO PROTEOMA DO CÉREBRO HUMANO E MURINO
Silva, Esdras Matheus Gomes da | Date Issued:
2018
Advisor
Comittee Member
Affilliation
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.
Abstract in Portuguese
Os avanços obtidos em transcriptômica, em função do desenvolvimento de sequenciadores de alta vazão, e na proteômica, por meio dos modernos espectrômetros de massas (MS), resultaram em um grande volume de dados que passou a ser integrado em diversos estudos de Bioinformática, levando ao melhor entendimento sobre a fração dos RNAs mensageiros efetivamente traduzida em proteínas. A proteogenômica é a área de pesquisa que reúne estas tecnologias, atuando na interface entre a genômica e a proteômica para interpretar eventos moleculares, tais como, por exemplo, o splicing alternativo. Este evento molecular é capaz de gerar RNAs mensageiros diferentes a partir de um mesmo gene, podendo alterar a sequência polipeptídica e, consequentemente, gerar proteoformas com funções distintas. Neste sentido, atualmente alguns projetos têm realizado esta análise integrativa com o intuito de comparar os resultados de amostras de ser humano e outros mamíferos, uma vez que alguns destes animais são utilizados como organismos modelo para o estudo dos aspectos moleculares de doenças, como as neurodegenerativas. Desta forma, este projeto teve como objetivo principal analisar o perfil de expressão de variantes de splicing alternativo em dados de espectrometria de massas de proteínas de amostras de tecidos de cérebros sadios de humano e camundongo Para tal, foram utilizados dados de mRNAs de referência (Refseq), ESTs e sequências da base de dados Uniprot/Swiss-Prot para confecção de repositórios de sequências proteicas personalizados, utilizando uma metodologia desenvolvida pelo nosso grupo de pesquisa denominada matrizes ternárias. O repositório personalizado para humano continha 20.150 sequências canônicas e 204.294 peptídeos não redundantes, totalizando 224.453 sequências. O repositório de camundongo possuía 16.888 sequências canônicas e 156.889 peptídeos não redundantes, totalizando 173.777 sequências. Estes repositórios de sequências proteicas personalizados foram empregados para a análise de dados de espectrometria de massas de três regiões distintas do cérebro de humano e camundongo (corpo caloso, nervo óptico e bulbo olfatório). A partir destas análises, nós inferimos a expressão de um total de 3.289 proteínas canônicas e 23 proteoformas de genes ortólogos entre humano e camundongo. Dentre as proteoformas, seis foram inferidas a partir de peptídeos proteotípicos idênticos identificados em dados de MS de humano e camundongo (PKM, CRMP1, PRKCB, STXBP1, CADM1 e HNRNPK). Portanto, acreditamos que a identificação de peptídeos compartilhados entre humano e camundongo, pertencentes a proteoformas de genes ortólogos, realizada neste projeto, contribuiu para o melhor conhecimento da diversidade de splicing do cérebro de humano e camundongo.
Abstract
The advances in transcriptomics, due to the development of high throughput sequencers and in proteomics, using modern mass spectrometers (MS), resulted in a large volume of data that has been integrated into several Bioinformatics studies, leading to a better understanding of messenger RNAs fraction that is effectively translated into proteins. Proteogenomics is the area of research that brings together these technologies, acting at the interface between genomics and proteomics to interpret molecular events such as alternative splicing. This molecular event can generate different messenger RNAs from the same gene, which may alter the polypeptide sequence and, consequently, generate proteoforms with different functions. Currently, some projects have performed this integrative analysis with the aim of comparing the results derived from human and other mammal samples, since some of these animals are used as model organisms for the study of molecular aspects of diseases, such as neurodegenerative diseases. Thus, the main goal of this project was to analyze the expression profile of alternative splicing variants in protein mass spectrometry data from tissue samples from healthy human and mouse brains For this, data from reference mRNAs (Refseq), ESTs and sequences from the Uniprot/Swiss-Prot database were used to make custom protein sequence repositories using a methodology developed by our research group called ternary matrices. The human custom repository contained 20,150 canonical sequences and 204,294 non-redundant peptides, summing up to 224,453 sequences. The mouse custom repository had 16,888 canonical sequences and 156,889 non-redundant peptides, giving a total of 173,777 sequences. These custom protein sequence repositories were used for the analysis of mass spectrometric data from three distinct regions of the human and mouse brain (corpus callosum, optic nerve and olfactory bulb). From these analyzes, we inferred the expression of a total of 3,289 canonical proteins and 23 proteoforms of orthologous genes between human and mouse. Among the proteoforms, six were inferred from identical proteotypic peptides identified in human and mouse MS data (PKM, CRMP1, PRKCB, STXBP1, CADM1 and HNRNPK). Therefore, we believe that the identification of shared peptides between human and mouse belonging to proteoforms from orthologous genes carried out in this project contributed to a better understanding of the splicing diversity of human and mouse brain.
Share