Mostrar el registro sencillo del ítem
Análise de fatores associados ao desempenho educacional no Brasil: uma abordagem por agrupamento com K-means nos dados da PeNSE e IDEB
| dc.creator | Camboim, Guilherme de Barros | |
| dc.date.accessioned | 2025-11-28T11:17:18Z | |
| dc.date.available | 2025-11-28 | |
| dc.date.available | 2025-11-28T11:17:18Z | |
| dc.date.issued | 2025-09-19 | |
| dc.identifier.citation | CAMBOIM, Guilherme de Barros. Análise de fatores associados ao desempenho educacional no Brasil [recurso eletrônico] : uma abordagem por agrupamento com K-means nos dados da PeNSE e IDEB. Orientador: Tiago Thompsen Primo. 2025. 85f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. | pt_BR |
| dc.identifier.uri | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/18732 | |
| dc.description.abstract | The 2022 PISA results revealed significant challenges for Brazilian education, with most students failing to reach minimum proficiency levels in mathematics, read ing, and science — a situation also reflected in IDEB indicators. Various factors, such as housing conditions, emotional and social aspects, and teacher training, contribute to this scenario. Despite the relevance of these assessments, there is still limited use of clustering techniques applied to national datasets to support educational policy development. This study aimed to identify patterns of student behavior, based on data from the National School Health Survey (PeNSE), that relate to different educational performance trajectories in IDEB. The K-Means clustering algorithm was applied to PeNSE microdata from 2009, 2015, and 2019 to identify behavioral patterns and associate them with educational outcomes. Students from the 9th grade of elementary school and the 3rd year of high school were analyzed, organized by federal unit and administrative sphere, using self-reported survey data. Preprocessing included cleaning inconsistencies, imputing missing values, and standardizing variables. The number of clusters was determined using metrics such as elbow, silhouette, Calin ski–Harabasz, and Davies–Bouldin. Between three and four clusters were identified per edition, and the results showed that low parental supervision, poor diet, sedentary behavior, and early exposure to alcohol and drugs were associated with lower IDEB performance, especially in public schools. Despite limitations — such as the heterogeneity of PeNSE cycles and the absence of a direct link between behavior and performance — the study reveals recurring patterns and provides valuable insights for more effective public policies. Factors such as parental supervision, physical activity, and healthy eating emerge as priorities for future interventions. | pt_BR |
| dc.description.sponsorship | Sem bolsa | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal de Pelotas | pt_BR |
| dc.rights | OpenAccess | pt_BR |
| dc.subject | Aprendizagem de máquina | pt_BR |
| dc.subject | K-means | pt_BR |
| dc.subject | Educação | pt_BR |
| dc.subject | PeNSE | pt_BR |
| dc.subject | Machine learning | pt_BR |
| dc.subject | Education | pt_BR |
| dc.title | Análise de fatores associados ao desempenho educacional no Brasil: uma abordagem por agrupamento com K-means nos dados da PeNSE e IDEB | pt_BR |
| dc.title.alternative | Pattern analysis in Brazilian educational performance: an unsupervised learning approach using data from the PeNSE Survey | pt_BR |
| dc.type | masterThesis | pt_BR |
| dc.contributor.authorLattes | Não localizado. | pt_BR |
| dc.contributor.advisorID | https://orcid.org/0000-0003-3870-097X | pt_BR |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/5641514282351546 | pt_BR |
| dc.description.resumo | Os resultados do PISA 2022 evidenciaram desafios significativos para a educa ção brasileira, com a maioria dos estudantes não atingindo os níveis mínimos de proficiência em matemática, leitura e ciências — situação também refletida nos indica dores do IDEB. Diversos fatores, como condições habitacionais, emocionais, sociais e a formação docente, contribuem para esse cenário. Apesar da relevância dessas avaliações, ainda há pouco uso de técnicas de clusterização aplicadas a bases nacio nais como subsídio à formulação de políticas públicas. Este estudo buscou identificar padrões de comportamentos estudantis, a partir da Pesquisa Nacional de Saúde do Escolar (PeNSE), que se relacionam com diferentes trajetórias de desempenho no IDEB. Aplicou-se o algoritmo K-Means aos microdados da PeNSE de 2009, 2015 e 2019, para identificar padrões comportamentais e relacioná-los aos desempenhos educacionais. Foram considerados estudantes do 9º ano e do 3º ano, organizados por unidade federativa e esfera administrativa, com dados de inquérito amostral baseados em autorrelato. O pré-processamento incluiu limpeza de inconsistências, imputação de valores faltantes e padronização das variáveis. O número de clusters foi definido por métricas como cotovelo, silhouette, Calinski–Harabasz e Davies–Bouldin. Identificaram-se entre três e quatro clusters por edição, e os resultados mostraram que baixa supervisão parental, alimentação inadequada, sedentarismo e uso precoce de álcool e drogas estiveram associados aos piores resultados no IDEB, sobretudo nas escolas públicas. Apesar das limitações — como a heterogeneidade dos ciclos da PeNSE e a ausência de vínculo direto entre comportamento e desempenho —, o estudo revela padrões recorrentes e fornece subsídios relevantes para políticas públicas mais eficientes. Fatores como supervisão parental, prática de exercícios e alimentação adequada emergem como prioritários em futuras intervenções. | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
| dc.publisher.initials | UFPel | pt_BR |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.rights.license | CC BY-NC-SA | pt_BR |
| dc.contributor.advisor1 | Primo, Tiago Thompsen | |
| dc.subject.cnpq1 | CIENCIA DA COMPUTACAO | pt_BR |
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(ones)
-
PPGC: Dissertações e Teses [235]
Dissertações e teses.

