Um pipeline de aprendizado de máquina para reconhecimento de emoções com base em informações temporais e espaciais de mapas topográficos gerados a partir de sinais de eletroencefalograma
Resumo
O reconhecimento de emoções é uma área que está se tornando cada vez
mais relevante devido sua implicação direta na vida da sociedade. A área busca
por melhores formas de compreender como as emoções, de natureza subjetiva,
influenciam o comportamento humano. Considerando que as emoções podem ser
expressas de forma não verbal, a análise da atividade cerebral, a partir de sinais
de eletroencefalograma, torna-se uma abordagem relevante para a identificação de
emoções. O eletroencefalograma registra os sinais elétricos gerados pelo córtex
cerebral por meio de eletrodos fixados sobre o couro cabeludo. Estes sinais possuem
características complexas, nos domínios espacial, temporal e de frequência. Diante
disto, o uso de um pipeline de predição mostra-se como uma alternativa para o
reconhecimento de emoções. Consoante a literatura, destacam-se poucos estudos
baseados no uso de imagens de mapas topográficos derivados de sinais cerebrais,
sobretudo com as informações mapeadas para um formato estruturado. Neste
contexto, este trabalho propõe a análise e a construção de modelos de aprendizado
de máquina para o reconhecimento de emoções, com base em mapas topográficos
do cérebro geradas a partir de sinais de eletroencefalograma na ferramenta EEGLAB.
O estudo de caso se refere ao DEAP, um dataset amplamente reconhecido na
área, construído por meio de experimentos de eletroencefalograma nos quais os
sujeitos foram expostos a estímulos musicais e visuais, realizando autoavaliações em
dimensões emocionais, como excitação, valência, dominância e preferência. Além da
proposta do pipeline, as principais contribuições deste estudo incluem apresentar um
dataset estruturado – construído com base no mapeamento de informações obtidas
nos mapas topográficos, abrangendo dados de intensidade cerebral por região, com
uso de janelas temporais, para amostras em três bandas de frequência: Alpha, Beta
e Gama. Por fim, este estudo apresenta modelos preditivos para o reconhecimento
de emoções, com destaque de acurácia de 85,46%, 85,05%, 85,92% e 84,49% para
excitação, valência, dominância e preferência, respectivamente – obtida por meio do
algoritmo K-Nearest Neighbors utilizando dados de todos os eletrodos.