Mostrar el registro sencillo del ítem

dc.creatorMossmann, Eduardo Henrique
dc.date.accessioned2024-05-13T12:15:56Z
dc.date.available2024-05-10
dc.date.available2024-05-13T12:15:56Z
dc.date.issued2022-08-16
dc.identifier.citationMOSSMANN, Eduardo Henrique. A physics based feature engineering framework for trajectory analysis. orientador: José Rafael Bordin. coordenador: Maurício Moreira Soares. 2022. 177 f. Dissertação (Mestrado em Física) - Programa de Pós-Graduação em Física, Departamento de Física, Instituto de Física e Matemática, Universidade Federal de Pelotas, Pelotas, 2022.pt_BR
dc.identifier.urihttp://guaiaca.ufpel.edu.br/xmlui/handle/prefix/12963
dc.description.abstractTrajectory analysis is of great importance for the understanding of dynamical systems and their properties. Trajectories may describe the time evolution of a variable in different contexts, such as the motion of cancer cell , the volatility of a stock in the stock market, the populational growth and so forth. In physical systems, where we are interested in the time evolution of the position of one or a set of bodies, there are systems where the position of these bodies depends on the concentration of matter at different locations. In such context, the movement of bodies tends to be in the direction of an area with high concentration of matter to a region of low concentration. This motion is called Diffusion. As a general way of describing the time evolution of a body in such systems, we use the Mean Squared Displacement. The motion types, sometimes called the Diffusion Classes, are a way of describing the movement of bodies in systems where Diffusion is observed. To classify the diffusion, the literature uses the time dependence of the Mean Squared Displacement. In the present work, we pointed out that using this time dependence as the only quantity to classify the Diffusion will give rise to an immediate problem, where we can have two or more possible Diffusion Classes for the same motion. With that in mind, we proposed a physics-based feature engineering framework for trajectory analysis called TrajPy as a possible solution to this problem. The framework contains three main components. The first allows us to perform trajectory analysis by computing multiple quantities of physical and statistical interest for any trajectory, whether this trajectory is taken from experiments or generated in a computer simulation. The second component is a combination of two graphical-user interfaces. The first allows us to compute the quantities of the first component in a way that we do not need to be familiar with Python programming. The second graphical-user interface was developed to be a first step towards a general solution to the bottleneck present in the drug discovery process. The third component allows us to simulate the four basic motion types with a range of parameters so that we may use these simulations as a connection between trajectory analysis and Machine Learning, where we aim to classify the Diffusion of particles in a more general way so that we avoid the problem involving the overlapping of diffusion classes. As a demonstration of the application of TrajPy, we performed trajectory analysis and diffusion classification for systems that mimic the capability of cells to be deformed. For this, we simulated multiple systems, using Molecular Dynamics, in a combination of values of pressure and the spring constant related to Hooke’s Law, where each system is composed of 400 two-dimensional polymer rings. As a result, we observed that the polymer rings, once the pressure reaches a certain threshold, present a dynamical transition from Normal Diffusion to Confined Diffusion, i.e., as the pressure increases, the polymer rings become trapped inside a region as an effect of the increase in pressure. Then, we classified the Diffusion of each polymer ring for every system and observed the same behavior from the perspective of the Random Forest Classifier algorithm using Machine Learning.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Pelotaspt_BR
dc.rightsOpenAccesspt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectAnálise de trajetóriaspt_BR
dc.subjectDifusãopt_BR
dc.subjectMachine learningpt_BR
dc.subjectTrajectory analysispt_BR
dc.subjectDiffusionpt_BR
dc.titleA physics based feature engineering framework for trajectory analysispt_BR
dc.typemasterThesispt_BR
dc.contributor.advisor-co1Soares, Maurício Moreira
dc.description.resumoAnálise de trajetória é de grande importância para o entendimento de sistemas dinâmicos e suas propriedades. Trajetórias podem descrever a evolução temporal de uma variável em diferentes contextos, como o movimento da célula cancerígenas, a volatilidade de uma ação na bolsa de valores, o crescimento populacional e assim por diante. Nos sistemas físicos, onde estamos interessados na evolução temporal da posição de um ou de um conjunto de corpos, existem sistemas onde a posição desses corpos depende da concentração de matéria em diferentes locais. Nesses contextos, o movimento dos corpos tende a ser no sentido de uma área com alta concentração de matéria para uma região de baixa concentração. Este movimento, tecnicamente chamado de fenômeno de transporte, é chamado de Difusão. Como uma maneira geral de descrever a evolução temporal de um corpo em tais sistemas, usamos o Deslocamento Médio Quadrático. Os tipos de movimento, às vezes chamados de Classes de Difusão, são uma maneira de descrever o movimento de corpos em sistemas onde a Difusão é observada. Para classificar a difusão, a literatura utiliza a dependência temporal do Deslocamento Quadrático Médio. No presente trabalho, apontamos que usar esta dependência temporal como a única grandeza para classificar a Difusão dá origem a um problema imediato, onde podemos ter duas ou mais Classes de Difusão possíveis para o mesmo movimento. Com isso em mente, propusemos uma estrutura de engenharia de atributos baseada em física para análise de trajetória chamada TrajPy como uma possível solução para esse problema. A estrutura contém três componentes principais. A primeira nos permite realizar a análise de trajetórias computando múltiplas quantidades de interesse físico e estatístico para qualquer trajetória, seja essa trajetória retirada de experimentos ou gerada em uma simulação computacional. A segunda componente é uma combinação de duas interfaces gráficas, que são modelos de interface que permite a interação com dispositivos digitais por meio de elementos gráficos como menus e botões. A primeira nos permite calcular as quantidades físicas e estatísticas de forma que não precisamos estar familiarizados com programação em Python. A segunda interface gráfica foi desenvolvida para ser um primeiro passo para uma solução geral para o gargalo tecnológico presente no processo de descoberta de medicamentos. A terceira componente nos permite simular os quatro tipos básicos de movimento (Difusão Normal, Anômala, Confinada e Movimento Direto com Difusão) com uma gama de parâmetros para que possamos usar essas simulações como uma conexão entre análise de trajetórias e algoritmos de classificação externo no contexto de Aprendizado de Máquina para que possamos classificar a Difusão de partículas de uma forma mais geral para que evitemos o problema envolvendo a sobreposição de classes de difusão. Como demonstração da aplicação do TrajPy, realizamos análise de trajetória e classificação de difusão para sistemas que mimetizam a capacidade das células de serem deformadas. Para isso, simulamos vários sistemas, usando Dinâmica Molecular, em uma combinação de valores de pressão e constante de mola relacionada à Lei de Hooke, onde cada sistema é composto por 400 anéis poliméricos bidimensionais. Como resultados, observamos que os anéis poliméricos, uma vez que a pressão atinge um determinado limiar, apresentam uma transição dinâmica de Difusão Normal para Difusão Confinada, ou seja, à medida que a pressão aumenta, os anéis poliméricos ficam confinados dentro de uma região como efeito do aumento da pressão. Em seguida, classificamos a Difusão de cada anel polimérico para cada sistema e observamos o mesmo comportamento sob a perspectiva do algoritmo Random Forest Classifier usando Aprendizado de Máquina.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Físicapt_BR
dc.publisher.initialsUFPelpt_BR
dc.subject.cnpqCIENCIAS EXATAS E DA TERRApt_BR
dc.publisher.countryBrasilpt_BR
dc.rights.licenseCC BY-NC-SApt_BR
dc.contributor.advisor1Bordin, José Rafael
dc.subject.cnpq1FISICApt_BR


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem