Por favor, use este identificador para citar o enlazar este ítem:
https://www.arca.fiocruz.br/handle/icict/17604
Tipo
ArtículoDerechos de autor
Acceso abierto
Colecciones
Metadatos
Mostrar el registro completo del ítem
MÁQUINA DE AGRUPAMENTO POR ELIPSÓIDE: UMA LINHA DE FRENTE PARA AUXILIAR NO DIAGNÓSTICO DE DOENÇAS
Aprendizagem de Máquina
Reconhecimento de Padrões
Clustering
Doença de Hodgkin
Proteômica
Machine Learning
Pattern Recognition
Clustering
Hodgkin’s Disease
Proteomics
Titulo alternativo
Ellipsoid clustering machine: a front line to aid in disease diagnosisAutor
Afiliación
Universidade Federal do Rio de Janeiro. Programa de Engenharia de Sistemas e Computação. Rio de Janeiro, RJ, Brasil.
Fundação Oswaldo Cruz. Instituto Carlos Chagas. Laboratório de Proteômica e Engenharia de Proteínas. Centro Industrial de Curitiba, Curitiba, PR, Brasil.
Universidade Federal do Rio de Janeiro. Programa de Engenharia de Sistemas e Computação. Rio de Janeiro, RJ, Brasil.
Universidade Federal do Rio de Janeiro. Instituto de Química, Departamento de Bioquímica. Rio de Janeiro, RJ, Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Laboratório de Genômica Funcional e Bioinformática. Rio de Janeiro, RJ, Brasil.
Universidade Federal do Rio de Janeiro. Instituto de Biofísica Carlos Chagas Filho. Rio de Janeiro, RJ, Brasil.
Fundação Oswaldo Cruz. Instituto Carlos Chagas. Laboratório de Proteômica e Engenharia de Proteínas. Centro Industrial de Curitiba, Curitiba, PR, Brasil.
Universidade Federal do Rio de Janeiro. Programa de Engenharia de Sistemas e Computação. Rio de Janeiro, RJ, Brasil.
Universidade Federal do Rio de Janeiro. Instituto de Química, Departamento de Bioquímica. Rio de Janeiro, RJ, Brasil.
Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Laboratório de Genômica Funcional e Bioinformática. Rio de Janeiro, RJ, Brasil.
Universidade Federal do Rio de Janeiro. Instituto de Biofísica Carlos Chagas Filho. Rio de Janeiro, RJ, Brasil.
Resumen en portugues
Este estudo apresenta nova estratégia de inferência direcionada a detectar presença de doenças em amostras biológicas. Diferencialmente dos métodos existentes, esta técnica é aplicável quando o número de patologias e as mesmas são desconhecidos. Esta é exemplificada através de software que denominamos “Máquina de Agrupamento por Elipsóide”, do inglês, Ellipsoid Clustering Machine (ECM). O mesmo identifica regiões conservadas em perfis proteômicos obtidos por espectrometria de massa de amostras biológicas de indivíduos controles e estima limites para classifica- ção baseando-se na variância da expressão protéica. O software também pode ser utilizado para inspeção visual de reprodutibilidade de dados. O ECM foi avaliado utilizando perfis protéicos do soro de pacientes com a doença de Hodgkin e de indivíduos controle. De acordo com a validação cruzada leave-one-out, o ECM separou corretamente os grupos se baseando apenas na informação de quatro picos espectrais selecionados. Este trabalho descreve o algoritmo e apresenta imagens de modelos 3D representativos da separação. O software está disponível na página do projeto na internet junto com modelos interativos e uma animação demonstrando o método.
Resumen en ingles
This study presents a new machine learning strategy to address the disease diagnosis classification problem that comprises an unknown number of disease classes. This is exemplified by a software called Ellipsoid Clustering Machine (ECM) that identifies conserved regions in mass spectrometry proteomic profiles obtained from control subjects and uses these to estimate classification boundaries based on sample variance. The software can also be used for visual inspection of data reproducibility. ECM was evaluated using mass spectrometry protein profiles obtained from serum of Hodgkin’s disease patients (HD) and control subjects. According to the leave-one-out cross validation, ECM completely separated both groups based only on the information derived from four selected mass spectral peaks. Classification details and a 3D graphical model showing the separation between the control subject cluster and HD patients is also presented. The software is available on the project website together with online interactive models of the dataset and an animation demonstrating the method.
Palabras clave en portugues
Espectrometria de MassaAprendizagem de Máquina
Reconhecimento de Padrões
Clustering
Doença de Hodgkin
Proteômica
Palabras clave en ingles
Mass SpectrometryMachine Learning
Pattern Recognition
Clustering
Hodgkin’s Disease
Proteomics
Compartir