Comparação de métodos para tratamento de dados faltantes em inquéritos epidemiológicos com amostragem complexa

Pacheco, Vanessa Eufrauzino

Por favor, use este identificador para citar o enlazar este ítem: https://www.arca.fiocruz.br/handle/icict/28714

Ver/Abrir

ve_Vanessa_Eufrazino_ENSP_2018... (4.681Mb)

Tipo

Disertación

Derechos de autor

Acceso abierto

Colecciones

ENSP - PPGEPI - Dissertações de Mestrado [239]

Estadísticas

Metadatos

Mostrar el registro completo del ítem

Pacheco, Vanessa Eufrauzino | Fecha del documento: 2018

Titulo alternativo

Comparison of methods for treatment of missing data in epidemiological surveys with complex sampling

Afiliación

Fundação Oswaldo Cruz. Escola Nacional de Saúde Pública Sergio Arouca. Rio de Janeiro, RJ, Brasil.

Resumen en portugues

Inquéritos epidemiológicos com amostragem complexa são bastante utilizados devido a redução de custo propiciando o mesmo benefício que uma pesquisa censitária. Entretanto,a ocorrência de perda de dados é um dos problemas que podem afetar esses inquéritos,influenciando os resultados analíticos da pesquisa. A razão para um dado ser faltante é chamado de mecanismo de dados faltantes, definido em três categorias: perda completamente aleatória, perda não completamente aleatória e perda não aleatória. Esse trabalho descreve esses mecanismos e aponta algumas técnicas de tratamento de dados que podem ser aplicadas em uma amostragem complexa, considerando predominantemente desfechos categóricos. A partir do banco de dados Nascer no Brasil, foram simulados bancos de dados com os três tipos de mecanismos de perda e, para o tratamento dos dados, foram utilizados os métodos de análise de casos completos, método do vizinho mais próximo, imputação múltipla por média preditiva e imputação por escore de propensão. Para a comparação dos resultados foram observadas as taxas de recuperação de dados de maneira exata aos originais e diferença quadrática de estimativas de parâmetros de regressão logística e linear.Os métodos de imputação trouxeram mais de 50% dos dados recuperados de maneira exata para os mecanismos perda completamente aleatória e perda não aleatória, já para o mecanismo perda não completamente aleatória, a recuperação foi de aproximadamente 30 por cento. Para as diferenças quadráticas os métodos do vizinho mais próximo e imputação múltipla tiveram resultados equiparáveis.O presente estudo ressaltou a importância da escolha adequada de métodos de imputação para desfechos categóricos e de variáveis para predição de valores, assim como demonstrou diferenças importantes observadas de acordo com o mecanismo de perda utilizado.

Resumen en ingles

Epidemiological surveys with complex sampling are widely used because of cost reduction, providing the same benefit as a census survey. However, the occurrence of data loss is one of the problems that can affect these surveys, influencing the analytical results of the research. The reason for a missing data is called the missing data mechanism, definedin three categories: completely random loss, not completely random loss, and non-randomloss. This work describes these mechanisms and points out some techniques of data treatment that can be applied in a complex sampling, considering predominantly categorical outcomes. Databases with the three types of loss mechanisms were simulated from the Born in Brazil database and, for the treatment of the data, we used the methods of analysis of complete cases, method of the nearest neighbor, multiple imputation by predictive meanand imputation by propensity score. In order to compare the results, the data recovery rateswere observed in an exact manner to the originals and the quadratic difference of logistic and linear regression parameters estimates. The imputation methods brought more than 50 percent of the exact recovered data to the mechanisms completely random loss and non-randomloss, whereas for the mechanism not completely random loss, the recovery was approximately 30 percent. For the quadratic differences, the methods of the closest neighbor and multiple imputation had similar results. The present study emphasized the importance of the adequate choice of imputation methods for categorical outcomes and variables for predicting values, as well as showing important differences observed according to the mechanismof loss used.

Palabras clave en portugues

Modelos logísticos
Distribuição aleatória
Epidemiologia descritiva
Dados Faltantes
Amostra Complexa
Escore de Propensão
Imputação múltipla
Vizinho mais próximo

Palabras clave en ingles

Complex sample
missing data
Propensity score
Multiple imputation

DeCS

Coleta de Dados
Inquéritos Epidemiológicos

Referencia

PACHECO, Vanessa Eufrauzino. Comparação de métodos para tratamento de dados faltantes em inquéritos epidemiológicos com amostragem complexa. 2018. 85 f. Dissertação (Mestrado em Saúde Pública) - Escola Nacional de Saúde Pública Sergio Arouca, Fundação Oswaldo Cruz, Rio de Janeiro, 2018.

Listar

Estadísticas

Por favor, use este identificador para citar o enlazar este ítem: https://www.arca.fiocruz.br/handle/icict/28714

Tipo

Derechos de autor

Acceso abierto

Colecciones

Estadísticas

Metadatos

Titulo alternativo

Autor

Director

Co-director

Afiliación

Resumen en portugues

Resumen en ingles

Palabras clave en portugues

Palabras clave en ingles

DeCS

Referencia

Local de defensa

Rio de Janeiro/RJ

Instituicion de defensa

Fundação Oswaldo Cruz. Escola Nacional de Saúde Pública Sergio Arouca.

Programa

Programa de Pós-Graduação em Epidemiologia em Saúde Pública

Por favor, use este identificador para citar o enlazar este ítem: https://www.arca.fiocruz.br/handle/icict/28714

Tipo

Derechos de autor

Acceso abierto

Colecciones

Compartir

Estadísticas

Metadatos

Titulo alternativo

Autor

Director

Co-director

Afiliación

Resumen en portugues

Resumen en ingles

Palabras clave en portugues

Palabras clave en ingles

DeCS

Referencia

Local de defensa

Rio de Janeiro/RJ

Instituicion de defensa

Fundação Oswaldo Cruz. Escola Nacional de Saúde Pública Sergio Arouca.

Programa

Programa de Pós-Graduação em Epidemiologia em Saúde Pública