Mostrar registro simples

dc.creatorCamboim, Guilherme de Barros
dc.date.accessioned2025-11-28T11:17:18Z
dc.date.available2025-11-28
dc.date.available2025-11-28T11:17:18Z
dc.date.issued2025-09-19
dc.identifier.citationCAMBOIM, Guilherme de Barros. Análise de fatores associados ao desempenho educacional no Brasil [recurso eletrônico] : uma abordagem por agrupamento com K-means nos dados da PeNSE e IDEB. Orientador: Tiago Thompsen Primo. 2025. 85f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.pt_BR
dc.identifier.urihttp://guaiaca.ufpel.edu.br/xmlui/handle/prefix/18732
dc.description.abstractThe 2022 PISA results revealed significant challenges for Brazilian education, with most students failing to reach minimum proficiency levels in mathematics, read ing, and science — a situation also reflected in IDEB indicators. Various factors, such as housing conditions, emotional and social aspects, and teacher training, contribute to this scenario. Despite the relevance of these assessments, there is still limited use of clustering techniques applied to national datasets to support educational policy development. This study aimed to identify patterns of student behavior, based on data from the National School Health Survey (PeNSE), that relate to different educational performance trajectories in IDEB. The K-Means clustering algorithm was applied to PeNSE microdata from 2009, 2015, and 2019 to identify behavioral patterns and associate them with educational outcomes. Students from the 9th grade of elementary school and the 3rd year of high school were analyzed, organized by federal unit and administrative sphere, using self-reported survey data. Preprocessing included cleaning inconsistencies, imputing missing values, and standardizing variables. The number of clusters was determined using metrics such as elbow, silhouette, Calin ski–Harabasz, and Davies–Bouldin. Between three and four clusters were identified per edition, and the results showed that low parental supervision, poor diet, sedentary behavior, and early exposure to alcohol and drugs were associated with lower IDEB performance, especially in public schools. Despite limitations — such as the heterogeneity of PeNSE cycles and the absence of a direct link between behavior and performance — the study reveals recurring patterns and provides valuable insights for more effective public policies. Factors such as parental supervision, physical activity, and healthy eating emerge as priorities for future interventions.pt_BR
dc.description.sponsorshipSem bolsapt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Pelotaspt_BR
dc.rightsOpenAccesspt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.subjectK-meanspt_BR
dc.subjectEducaçãopt_BR
dc.subjectPeNSEpt_BR
dc.subjectMachine learningpt_BR
dc.subjectEducationpt_BR
dc.titleAnálise de fatores associados ao desempenho educacional no Brasil: uma abordagem por agrupamento com K-means nos dados da PeNSE e IDEBpt_BR
dc.title.alternativePattern analysis in Brazilian educational performance: an unsupervised learning approach using data from the PeNSE Surveypt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLattesNão localizado.pt_BR
dc.contributor.advisorIDhttps://orcid.org/0000-0003-3870-097Xpt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/5641514282351546pt_BR
dc.description.resumoOs resultados do PISA 2022 evidenciaram desafios significativos para a educa ção brasileira, com a maioria dos estudantes não atingindo os níveis mínimos de proficiência em matemática, leitura e ciências — situação também refletida nos indica dores do IDEB. Diversos fatores, como condições habitacionais, emocionais, sociais e a formação docente, contribuem para esse cenário. Apesar da relevância dessas avaliações, ainda há pouco uso de técnicas de clusterização aplicadas a bases nacio nais como subsídio à formulação de políticas públicas. Este estudo buscou identificar padrões de comportamentos estudantis, a partir da Pesquisa Nacional de Saúde do Escolar (PeNSE), que se relacionam com diferentes trajetórias de desempenho no IDEB. Aplicou-se o algoritmo K-Means aos microdados da PeNSE de 2009, 2015 e 2019, para identificar padrões comportamentais e relacioná-los aos desempenhos educacionais. Foram considerados estudantes do 9º ano e do 3º ano, organizados por unidade federativa e esfera administrativa, com dados de inquérito amostral baseados em autorrelato. O pré-processamento incluiu limpeza de inconsistências, imputação de valores faltantes e padronização das variáveis. O número de clusters foi definido por métricas como cotovelo, silhouette, Calinski–Harabasz e Davies–Bouldin. Identificaram-se entre três e quatro clusters por edição, e os resultados mostraram que baixa supervisão parental, alimentação inadequada, sedentarismo e uso precoce de álcool e drogas estiveram associados aos piores resultados no IDEB, sobretudo nas escolas públicas. Apesar das limitações — como a heterogeneidade dos ciclos da PeNSE e a ausência de vínculo direto entre comportamento e desempenho —, o estudo revela padrões recorrentes e fornece subsídios relevantes para políticas públicas mais eficientes. Fatores como supervisão parental, prática de exercícios e alimentação adequada emergem como prioritários em futuras intervenções.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Computaçãopt_BR
dc.publisher.initialsUFPelpt_BR
dc.subject.cnpqCIENCIAS EXATAS E DA TERRApt_BR
dc.publisher.countryBrasilpt_BR
dc.rights.licenseCC BY-NC-SApt_BR
dc.contributor.advisor1Primo, Tiago Thompsen
dc.subject.cnpq1CIENCIA DA COMPUTACAOpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples