| dc.creator | Guidotti, Isadora Leitzke | |
| dc.date.accessioned | 2023-01-06T16:01:17Z | |
| dc.date.available | 2023-01-05 | |
| dc.date.available | 2023-01-06T16:01:17Z | |
| dc.date.issued | 2021-11-10 | |
| dc.identifier.citation | GUIDOTTI, Isadora Leitzke. Bambu: desenvolvimento de uma ferramenta para QSAR baseada em aprendizado de máquina. 2021. 66f. Dissertação (Mestrado em Biotecnologia) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas. Pelotas, 2021. | pt_BR |
| dc.identifier.uri | http://guaiaca.ufpel.edu.br/handle/prefix/8905 | |
| dc.description.abstract | BioAssays Model Builder - BAMBU is a tool developed to assist researchers in research related to the development of new drugs. The identification of molecules with pharmacological potential is traditionally performed through discoveries of natural compounds, for which the drug discovery approach is used, within it the High Throughput Screening (HTS). Another approach used to develop these tools is machine learning (ML), a sub-area of artificial intelligence, which aims to develop algorithms capable of solving problems for which they were not explicitly programmed. It can be divided into two fundamental areas, supervised learning that aims to learn from the data provided and unsupervised learning that learns from sample patterns. One of the methodologies used in supervised ML in the context of drug discovery is the Quantitative Structure-Activity Relationship (QSAR), a quantitative study to see interactions between organic molecules and chemical structures in a three-dimensional way that aims to study the ligand. The bamboo tool joins the databases from HTS studies with the QSAR methodology that employs the use of supervised ML and uses ML algorithms to distinguish molecules with
pharmacological potential from those that do not and can be used to assist in the search for new approaches therapeutics for various diseases including cancer and neurodegenerative diseases. To compose the tool we used models based on decision trees, neural networks and linear regression. As a balancing strategy, undersampling, oversampling, tomek links and SMOTE approaches are used. To
assess the functioning of the tool, ranking metrics are used such as precision, recall, f1-score and accuracy. The use of models allows the tool to be able to separate active from inactive molecules and this is proven and achieves the objective of the work when we observe the precision data, which is one of the metrics used to validate that tells us if the model is managing to separate active molecules from
inactive molecules. We also observed that models based on decision trees and decision tree ensembles are the ones with the most satisfactory results. | pt_BR |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal de Pelotas | pt_BR |
| dc.rights | OpenAccess | pt_BR |
| dc.subject | Bioinformática | pt_BR |
| dc.subject | Quimioinformática | pt_BR |
| dc.subject | Terapia alvo | pt_BR |
| dc.subject | HTS | pt_BR |
| dc.subject | Bioinformatics | pt_BR |
| dc.subject | Chemoinformatics | pt_BR |
| dc.subject | Target therapy | pt_BR |
| dc.title | Bambu: desenvolvimento de uma ferramenta para QSAR baseada em aprendizado de máquina | pt_BR |
| dc.title.alternative | Bambu: development of a machine learning-based QSAR | pt_BR |
| dc.type | masterThesis | pt_BR |
| dc.contributor.authorID | | pt_BR |
| dc.contributor.authorLattes | http://lattes.cnpq.br/6213559298016476 | pt_BR |
| dc.contributor.advisorID | | pt_BR |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/6065261074656602 | pt_BR |
| dc.contributor.advisor-co1 | Seixas, Fabiana Kömmling | |
| dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/4335833939769004 | pt_BR |
| dc.description.resumo | BioAssays Model Builder - BAMBU é uma ferramenta desenvolvida para auxiliar pesquisadores em pesquisas relacionadas ao desenvolvimento de novos fármacos. A identificação de moléculas com potencial farmacológico é tradicionalmente realizada por meio de descobertas de compostos naturais, para isso se usa a abordagem de drug discovery, dentro dela o High Throughput Screening (HTS).
Outra abordagem usada para o desenvolvimento dessas ferramentas é o aprendizado de máquina (AM), uma subárea da inteligência artificial, que visa desenvolver algoritmos capazes de solucionar problemas para os quais não foram explicitamente programados. Pode ser dividida em duas áreas fundamentais: a aprendizagem supervisionada que visa aprender com os dados fornecidos e a
aprendizagem não supervisionada que aprender com base nos padrões de amostras. Uma das metodologias empregadas no ML supervisionado no contexto de drug discovery é a Quantitative Structure-Activity Relationship (QSAR), um estudo quantitativo para ver interações entre moléculas orgânicas e estruturas químicas de forma tridimensional que visa estudar o ligante. A ferramenta bambu une os bancos de dados oriundos de estudos de HTS junto da metodologia QSAR que emprega o uso do AM supervisionado e usa algoritmos de AM para distinguir moléculas com potencial farmacológico daquelas que não possuem e pode ser usada para auxiliar na pesquisa de novas abordagens terapêuticas para várias doenças incluindo câncer e doenças neurodegenerativas. Para compor a ferramenta usamos modelos baseados em árvores de decisão, redes neurais e regressão linear. Como estratégia de balanceamento são usadas abordagens de undersampling, oversampling, tomek links e SMOTE. Para avaliar o funcionamento da ferramenta é usado métricas de classificação como precisão, recall, f1-score e acurácia. O uso dos modelos permite que a ferramenta consiga separar moléculas ativas de inativas e isso se comprova e atinge o objetivo do trabalho quando observamos os dados da precisão que é uma das métricas usadas para validar que nos diz se o modelo está conseguindo separar moléculas ativas de moléculas inativas. Também observamos que os modelos baseados em árvores de decisão e ensembles de árvores de decisão são os que obtiveram resultados mais satisfatórios. | pt_BR |
| dc.publisher.department | Centro de Desenvolvimento Tecnológico | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Biotecnologia | pt_BR |
| dc.publisher.initials | UFPel | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO::MODELOS ANALITICOS E DE SIMULACAO | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.relation.references | GUIDOTTI, Isadora Leitzke. Bambu: desenvolvimento de uma ferramenta para QSAR baseada em aprendizado de máquina. 2021. 66f. Dissertação (Mestrado em Biotecnologia) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas. Pelotas, 2021. | pt_BR |
| dc.contributor.advisor1 | Kremer, Frederico Schmitt | |