Um estudo sobre aprendizado de máquina multimodal para identificar a depressão em adolescentes brasileiros usando dados coletados via smartphones
Resumen
A depressão afeta cerca de 322 milhões de pessoas em todo o mundo, segundo
a OMS. Os primeiros sintomas da depressão costumam surgir entre o final da adolescência
e o início da fase adulta. No entanto, sua apresentação clínica, altamente
heterogênea, dificulta o diagnóstico nas fases iniciais, especialmente em ambientes
não especializados. Além disso, não existem exames laboratoriais para diagnosticar
a depressão. As entrevistas clínicas que seguem critérios operacionais padronizados,
como o DSM, são o padrão ouro para o diagnóstico da depressão, apesar do viés subjetivo
da avaliação. Neste contexto, as tecnologias móveis, como smartphones e sensores
vestíveis, oportunizaram novas formas de coletar dados sobre o comportamento
depressivo em ambientes domésticos, não observáveis clinicamente, que vão além
das abordagens tradicionais. Neste estudo, investigamos modelos multimodais e multitarefas
de aprendizado de máquina para prever o humor deprimido atual e futuro dos
adolescentes da base de dados do estudo IDEA-RiSCo (Identifying Depression Early
in Adolescence Risk Stratified Cohort). Realizamos extensos experimentos usando
81 atributos extraídos de dados acústicos, da fala dos adolescentes e do ambiente,
acelerômetro e GPS coletados via smartphones. Também comparamos o desempenho
de modelos preditivos nomotéticos (generalizado) e idiográficos (personalidado) e
duas agregações de dados. Os experimentos foram realizados considerando as pontuações
do questionário sMFQ como verdade básica. Estabelecemos um modelo de
aprendizado de máquina nomotético que combina dados de atividade, áudio de relatos
e mobilidade usando agregação cumulativa como uma importante alternativa para
complementar o diagnóstico de depressão em adolescentes brasileiros. Além disso,
destacamos os atributos que mais contribuíram para otimizar o desempenho dos modelos
preditivos, relacionado à atividade: tempo médio diário de caminhada; áudios
de relatos: coeficientes MFCC, espectrogramas e contrastes espectrais; e mobilidade:
distância máxima de casa e variação de localização.