Mostrar el registro sencillo del ítem

dc.creatorGuimarães, Amanda Munari
dc.date.accessioned2025-08-01T20:52:22Z
dc.date.available2025-08-01T20:52:22Z
dc.date.issued2025-02-21
dc.identifier.citationGUIMARÃES, Amanda Munari. Desenvolvimento de uma pipeline para vacinologia reversa baseada em arquitetura transformer. 2025. 92 f. Tese (Doutorado em Biotecnologia) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.pt_BR
dc.identifier.urihttp://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16807
dc.description.abstractReverse vaccinology, combined with bioinformatics, enables the prediction of immunogenic proteins from genomic data, facilitating the development of biotechnological products. The in silico prediction of vaccine targets involves models based on natural language processing (NLP), applied to the structural and functional analysis of proteins, biomedical text mining, and synthetic data generation. This study presents ReVarcine, a tool designed to predict protein characteristics relevant to immunogenicity. Its process includes preprocessing sequences from the UniProt and SwissProt databases, removing incomplete or redundant entries, and using Keras-based tokenization for numerical representation. The sequences were divided into training and testing sets, distinguishing Gram-positive and Gram-negative bacteria. Eight deep learning models were developed to predict signal peptides, cleavage sites, subcellular localization, and secondary structures such as beta barrels and alpha helices. The architectures include embedding layers, transformers, LSTM, and dense layers, integrated into a modular pipeline. This design ensures scalability and adaptability for different organisms and analytical needs. Performance evaluation used metrics such as MCC and F1 score, comparing ReVarcine with established tools, including SignalP, PSORT, and PSIPRED. The results indicate that ReVarcine often outperforms traditional predictors in proteomic analysis, standing out for its versatility and accuracy. ReVarcine innovates by unifying multiple predictive tasks, reducing reliance on various specialized tools. This optimizes computational time and minimizes errors in data processing across platforms. Its integrated approach sets a new standard for immunoinformatics, making it a promising tool to meet the growing demands of reverse vaccinology.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Pelotaspt_BR
dc.rightsOpenAccesspt_BR
dc.subjectBioinformáticapt_BR
dc.subjectProteomapt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectBactériaspt_BR
dc.subjectPatógenospt_BR
dc.titleDesenvolvimento de uma pipeline para vacinologia reversa baseada em arquitetura transformerpt_BR
dc.title.alternativeDevelopment of a pipeline for reverse vaccinology based on transformer architecturept_BR
dc.typedoctoralThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/5836082127248499pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6065261074656602pt_BR
dc.contributor.advisor-co1Pinto, Luciano da Silva
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/3819262588755487pt_BR
dc.description.resumoA vacinologia reversa, associada à bioinformática, permite a predição de proteínas imunogênicas a partir de dados genômicos, viabilizando o desenvolvimento de produtos biotecnológicos. A predição in silico de alvos vacinais envolve modelos baseados em processamento de linguagem natural (NLP), aplicados na análise estrutural e funcional de proteínas, mineração de textos biomédicos e geração de dados sintéticos. O estudo apresenta o ReVarcine, uma ferramenta projetada para prever características proteicas relevantes na imunogenicidade. Seu processo inclui pré-processamento de sequências dos bancos UniProt e SwissProt, remoção de entradas incompletas ou redundantes e tokenização baseada em Keras para representação numérica. As sequências foram divididas em conjuntos de treinamento e teste, diferenciando bactérias Gram-positivas e Gram-negativas. Foram desenvolvidos oito modelos de aprendizado profundo para prever peptídeos sinal, sites de clivagem, localização subcelular e estruturas secundárias como barris beta e alfa-hélices. As arquiteturas incluem camadas de incorporação, transformadores, LSTM e camadas densas, integradas em um pipeline modular. Esse design garante escalabilidade e adaptabilidade para diferentes organismos e necessidades analíticas. A avaliação de desempenho utilizou métricas como MCC e F1 score, comparando o ReVarcine com ferramentas consolidadas, incluindo SignalP, PSORT e PSIPRED. Os resultados indicam que o ReVarcine frequentemente supera preditores tradicionais na análise proteômica, destacando-se pela versatilidade e precisão. O ReVarcine inova ao unificar múltiplas tarefas preditivas, reduzindo a dependência de diversas ferramentas especializadas. Isso otimiza o tempo computacional e minimiza erros no processamento de dados entre plataformas. Sua abordagem integrada estabelece um novo padrão para imuno informática, tornando-o uma ferramenta promissora para suprir as crescentes demandas da vacinologia reversa.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Biotecnologiapt_BR
dc.publisher.initialsUFPelpt_BR
dc.subject.cnpqCIENCIAS DA SAUDEpt_BR
dc.publisher.countryBrasilpt_BR
dc.rights.licenseCC BY-NC-SApt_BR
dc.contributor.advisor1Kremer, Frederico Schmitt
dc.subject.cnpq1MEDICINApt_BR


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem