MPC-SDP: um classificador genérico baseado em múltiplas perspectivas para a predição da evasão estudantil
Resumo
Considerando o grave problema da evasão estudantil, diversos estudos têm aplicado
técnicas de mineração de dados aos grandes volumes de dados educacionais, a fim
de desenvolver modelos que permitam a identificação de estudantes e/ou fatores de
risco. Essas pesquisas costumam representar o comportamento dos estudantes a
partir de dados relacionados aos seus aspectos acadêmico, social e/ou econômico.
Também é comum o desenvolvimento de modelos especializados em cursos e/ou
momentos de predição, embora seus resultados sejam menos abrangentes. Ademais,
os estudos aplicam geralmente as técnicas de forma tradicional, sem adaptá-las às
especificidades do domínio da evasão. Com o intuito de explorar essas lacunas, nesta
Tese foi proposto o MPC-SDP, um modelo de ensemble destinado a prever a evasão
de estudantes em diferentes cursos e estágios da trajetória acadêmica (predição
genérica), mas guiado por perspectivas especializadas e importantes para o domínio
da evasão estudantil. Mais especificamente, o MPC-SDP visa (i) dar maior atenção à
variabilidade dos padrões de evasão ao longo da trajetória acadêmica dos estudantes,
a partir da construção de um comitê de classificação formado por subclassificadores
especializados por períodos/semestres letivos; e (ii) uma participação mais abrangente
de diferentes aspectos de dados dos estudantes (acadêmico, contextual,
econômico, interacional e social) na representação do comportamento de evasão, por
meio de um processo de seleção de atributos orientado por aspectos. Considerando
o contexto dos cursos de graduação presenciais do Instituto Federal Farroupilha
como estudo de caso, ao ser avaliado e comparado a modelos de predição genérica
construídos de forma tradicional, o MPC-SDP demonstrou melhorar a precisão da
predição de estudantes evadidos nos semestres iniciais. Na prática, isso oportunizaria
um melhor direcionamento de medidas preventivas nas etapas mais críticas
do acompanhamento estudantil, já que os semestres iniciais concentram os maiores
quantitativos de matrículas e evasões. Além disso, a seleção de atributos orientada
por aspectos proporcionou um aumento na variabilidade dos aspectos representados
entre os principais padrões dos subclassificadores do MPC-SDP, contribuindo para
um entendimento mais amplo e multifacetado dos padrões de evasão.