Mostrar registro simples

dc.creatorGruendemann, Felipe Camargo
dc.date.accessioned2023-04-04T00:36:03Z
dc.date.available2023-04-03
dc.date.available2023-04-04T00:36:03Z
dc.date.issued2023-02-23
dc.identifier.citationGRUENDEMANN, Felipe Camargo. Classificação Automática de Produções Científicas em Inteligência Artificial Utilizando Processamento de Linguagem Natural. Orientador: Ricardo Matsumura de Araújo. 2023. 58 f. Dissertação (Mestrado em Ciência da Computação) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2023.pt_BR
dc.identifier.urihttp://guaiaca.ufpel.edu.br/handle/prefix/9235
dc.description.abstractThe analysis of scientific communities is an important topic for understanding sci entific scenarios from different perspectives. This subject gains strength with the de velopment of digital libraries. In this context, there are different virtual repositories that provide bibliographic data of scientific productions and information about authors and venues. In Brazil, the main scientific database is the Lattes Platform, which has mil lions of researchers’ CVs. However, the platform lacks automated tools to analyze data and faces problems related to manual filling of free text fields. Thus, the task of ana lyzing the volume of publications by subject can be a difficult task. Machine learning models applied with natural language processing techniques are being shown to be a useful alternative for text classification. In this work, models were developed to classify subarea and specialty of cientific works, based only on the title. As a case study, the subarea of Artificial Intelligence and its specialties was used. In this way, datasets were created from extraction of The DBLP Computer Science Bibliography (DBLP) data for developing of two models: one to classify whether a given title of Computer Science is related to the subarea of AI; another to classify, among seven categories, which is the specialty of AI. The models achieved accuracy of 93% and 71%, respectively.pt_BR
dc.description.sponsorshipSem bolsapt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Pelotaspt_BR
dc.rightsOpenAccesspt_BR
dc.subjectClassificaçãopt_BR
dc.subjectProdução científicapt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectClassificationpt_BR
dc.subjectCientific productionpt_BR
dc.subjectArtificial intelligencept_BR
dc.subjectNatural language processingpt_BR
dc.titleClassificação Automática de Produções Científicas em Inteligência Artificial Utilizando Processamento de Linguagem Natural.pt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/4723493788953873pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1544604888519188pt_BR
dc.description.resumoA análise de comunidades científicas é um tema importante para compreensão de cenários científicos em diferentes perspectivas. Esse assunto ganha força com o desenvolvimento de bibliotecas digitais. Nesse contexto, existem diferentes re positórios virtuais que disponibilizam dados bibliográficos de produções científicas e informações sobre autores e veículos de publicação. No Brasil, a principal base de dados científicos é a Plataforma Lattes, que conta com milhões de currículos de pesquisadores. Contudo, a plataforma carece de formas automatizadas para análise de dados e enfrenta problemas relacionados ao preenchimento manual de texto livre. Dessa forma, a tarefa de analisar o volume de publicações por assunto pode ser uma tarefa difícil. Modelos de machine learning aplicados com técnicas de processamento de linguagem natural vêm se mostrando uma alternativa útil para classificação de texto. Assim, neste trabalho, foram desenvolvidos modelos para classificar subárea e especialidade de trabalhos, baseando-se apenas no título. Como caso de estudo, foi utilizada a subárea de Inteligência Artificial e suas especialidades. Assim, foram construídos conjuntos de dados extraídos da plataforma The DBLP Computer Science Bibliography (DBLP) para o desenvolvimento de dois modelos: um para classificar se um determinado título da computação está relacionado à subárea da IA; outro para classificar, dentre sete categorias, qual a especialidade da IA. Os modelos atingiram acurácia de 93% e 71%, respectivamente.pt_BR
dc.publisher.departmentCentro de Desenvolvimento Tecnológicopt_BR
dc.publisher.programPrograma de Pós-Graduação em Computaçãopt_BR
dc.publisher.initialsUFPelpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.publisher.countryBrasilpt_BR
dc.contributor.advisor1Araújo, Ricardo Matsumura de


Arquivos deste item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples