Please use this identifier to cite or link to this item: http://guaiaca.ufpel.edu.br:8080/handle/prefix/3848
metadata.dc.type: masterThesis
Title: Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
Other Titles: Data prediction in populational surveys using machine learning techniques
metadata.dc.creator: Ferreira, Leonardo Zanini
metadata.dc.contributor.advisor-co2: Fleischmann, Ana Marilza Pernas
metadata.dc.description.resumo: O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável.
Abstract: Monitoring the development of countries’ health and nutrition indicators rely on accurate and complete data. Low-and middle-income countries depend on populational surveys for decision-making since their information systems are still unreliable. These indicators are health outcomes which point out the status of a maternal and child health intervention, behavior or care. Despite being great sources of information, the populational surveys also lack information which could prevent the creation of these standardized indicators. Machine learning arise as an alternative to fill the gaps found in the surveys based on sociodemographic characteristics and related predictors. This work evaluates the performance of four machine learning techniques (neural networks, decision trees, KNN and XGB) in this task by observing the behavior of two health outcomes in four different samples. The results indicate that a great variation can be found depending on the selected outcome. The availability of those indicators as predictors is also a challenge. The studied machine learning techniques presented a small performance variation between themselves which suggests that the nature of the data is determinant to this kind of application. Still, the first outcomes showed acceptable results for a practical application while the second outcome reached lower estimates compared to those which specialists consider as a reasonable performance.
Keywords: Aprendizado de máquina
Desfechos de saúde
Inquéritos populacionais de saúde
Machine learning
Health outcomes
Populational health surveys
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Pelotas
metadata.dc.publisher.initials: UFPel
metadata.dc.publisher.department: Centro de Desenvolvimento Tecnológico
metadata.dc.publisher.program: Programa de Pós-Graduação em Computação
Citation: FERREIRA, Leonardo Zanini. Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina. 2018. 87 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, 2018.
metadata.dc.rights: OpenAccess
URI: http://repositorio.ufpel.edu.br:8080/handle/prefix/3848
Issue Date: 6-Feb-2018
Appears in Collections:Pós-Graduação em Computação: Dissertações e Teses

Files in This Item:
File Description SizeFormat 
Dissertacao_Leonardo_Ferreira.pdf1,15 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons