| dc.creator | Camboim, Guilherme de Barros | |
| dc.date.accessioned | 2025-11-28T11:17:18Z | |
| dc.date.available | 2025-11-28 | |
| dc.date.available | 2025-11-28T11:17:18Z | |
| dc.date.issued | 2025-09-19 | |
| dc.identifier.citation | CAMBOIM, Guilherme de Barros. Análise de fatores associados ao desempenho educacional no Brasil [recurso eletrônico] : uma abordagem por agrupamento com K-means nos dados da PeNSE e IDEB. Orientador: Tiago Thompsen Primo. 2025. 85f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. | pt_BR |
| dc.identifier.uri | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/18732 | |
| dc.description.abstract | The 2022 PISA results revealed significant challenges for Brazilian education,
with most students failing to reach minimum proficiency levels in mathematics, read ing, and science — a situation also reflected in IDEB indicators. Various factors, such
as housing conditions, emotional and social aspects, and teacher training, contribute
to this scenario. Despite the relevance of these assessments, there is still limited use
of clustering techniques applied to national datasets to support educational policy
development. This study aimed to identify patterns of student behavior, based on data
from the National School Health Survey (PeNSE), that relate to different educational
performance trajectories in IDEB. The K-Means clustering algorithm was applied to
PeNSE microdata from 2009, 2015, and 2019 to identify behavioral patterns and
associate them with educational outcomes. Students from the 9th grade of elementary
school and the 3rd year of high school were analyzed, organized by federal unit
and administrative sphere, using self-reported survey data. Preprocessing included
cleaning inconsistencies, imputing missing values, and standardizing variables. The
number of clusters was determined using metrics such as elbow, silhouette, Calin ski–Harabasz, and Davies–Bouldin. Between three and four clusters were identified
per edition, and the results showed that low parental supervision, poor diet, sedentary
behavior, and early exposure to alcohol and drugs were associated with lower
IDEB performance, especially in public schools. Despite limitations — such as the
heterogeneity of PeNSE cycles and the absence of a direct link between behavior and
performance — the study reveals recurring patterns and provides valuable insights for
more effective public policies. Factors such as parental supervision, physical activity,
and healthy eating emerge as priorities for future interventions. | pt_BR |
| dc.description.sponsorship | Sem bolsa | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal de Pelotas | pt_BR |
| dc.rights | OpenAccess | pt_BR |
| dc.subject | Aprendizagem de máquina | pt_BR |
| dc.subject | K-means | pt_BR |
| dc.subject | Educação | pt_BR |
| dc.subject | PeNSE | pt_BR |
| dc.subject | Machine learning | pt_BR |
| dc.subject | Education | pt_BR |
| dc.title | Análise de fatores associados ao desempenho educacional no Brasil: uma abordagem por agrupamento com K-means nos dados da PeNSE e IDEB | pt_BR |
| dc.title.alternative | Pattern analysis in Brazilian educational performance: an unsupervised learning approach using data from the PeNSE Survey | pt_BR |
| dc.type | masterThesis | pt_BR |
| dc.contributor.authorLattes | Não localizado. | pt_BR |
| dc.contributor.advisorID | https://orcid.org/0000-0003-3870-097X | pt_BR |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/5641514282351546 | pt_BR |
| dc.description.resumo | Os resultados do PISA 2022 evidenciaram desafios significativos para a educa ção brasileira, com a maioria dos estudantes não atingindo os níveis mínimos de
proficiência em matemática, leitura e ciências — situação também refletida nos indica dores do IDEB. Diversos fatores, como condições habitacionais, emocionais, sociais
e a formação docente, contribuem para esse cenário. Apesar da relevância dessas
avaliações, ainda há pouco uso de técnicas de clusterização aplicadas a bases nacio nais como subsídio à formulação de políticas públicas. Este estudo buscou identificar
padrões de comportamentos estudantis, a partir da Pesquisa Nacional de Saúde do
Escolar (PeNSE), que se relacionam com diferentes trajetórias de desempenho no
IDEB. Aplicou-se o algoritmo K-Means aos microdados da PeNSE de 2009, 2015 e
2019, para identificar padrões comportamentais e relacioná-los aos desempenhos
educacionais. Foram considerados estudantes do 9º ano e do 3º ano, organizados
por unidade federativa e esfera administrativa, com dados de inquérito amostral
baseados em autorrelato. O pré-processamento incluiu limpeza de inconsistências,
imputação de valores faltantes e padronização das variáveis. O número de clusters foi
definido por métricas como cotovelo, silhouette, Calinski–Harabasz e Davies–Bouldin.
Identificaram-se entre três e quatro clusters por edição, e os resultados mostraram
que baixa supervisão parental, alimentação inadequada, sedentarismo e uso precoce
de álcool e drogas estiveram associados aos piores resultados no IDEB, sobretudo
nas escolas públicas. Apesar das limitações — como a heterogeneidade dos ciclos
da PeNSE e a ausência de vínculo direto entre comportamento e desempenho —,
o estudo revela padrões recorrentes e fornece subsídios relevantes para políticas
públicas mais eficientes. Fatores como supervisão parental, prática de exercícios e
alimentação adequada emergem como prioritários em futuras intervenções. | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
| dc.publisher.initials | UFPel | pt_BR |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.rights.license | CC BY-NC-SA | pt_BR |
| dc.contributor.advisor1 | Primo, Tiago Thompsen | |
| dc.subject.cnpq1 | CIENCIA DA COMPUTACAO | pt_BR |