Please use this identifier to cite or link to this item: http://guaiaca.ufpel.edu.br:8080/handle/prefix/4352
metadata.dc.type: masterThesis
Title: Proposta de métodos de clusterização de dados com validação por testes de heterogeneidade e discordância aplicados à regionalização de bacias hidrográficas
Other Titles: Proposal of methods for data clustering with validation by tests of heterogeneity and disagreement applied to the regionalization of watersheds.
metadata.dc.creator: Oliveira, Leroi Floriano de
metadata.dc.contributor.advisor1: Aguiar, Marilton Sanchotene de
metadata.dc.contributor.advisor-co1: Beskow, Samuel
metadata.dc.description.resumo: Através da regionalização de bacias hidrográficas, é possível, dentre outras aplicações, fazer previsões estatísticas de vazões máximas e mínimas em cursos d’água. Diversos estudos demonstram bons resultados na utilização de clusterização para a formação de melhores regiões do ponto de vista hidrológico. Este trabalho aplica técnicas de aprendizado de máquina para a formação de regiões hidrologicamente homogêneas. Mais especificamente, neste trabalho foi explorada a utilização dos métodos: k-means, affinnity propagation, aglomerative clustering e regions of influence para a formação de regiões, fazendo-se, portanto, uma comparação entre os métodos e a utilização de técnicas de seleção de atributos. Ainda, neste trabalho também são propostos três métodos para a solução do problema, utilizando ajuste dos clusters com base nas medidas de heterogeneidade e discordância de Hosking. Dois destes métodos utilizam o algoritmo k-means fazendo variações nos clusters iniciais de forma a buscar centroides que melhor representem regiões hidrologicamente homogêneas. O outro método combina resultados de clusterização com o método regions of influence. Com os métodos propostos, foi possível alcançar uma melhora, de 63,2% para 90,5% de aproveitamento das regiões formadas para a aplicação da análise de frequência regional. Com este trabalho, concluiu-se que os atributos selecionados apresentaram melhores resultados que a utilização de todos os atributos; e, que os métodos propostos demonstram grande potencial, visto que apresentaram melhores resultados que outros métodos já existentes.
Abstract: Through the regionalization of river basins, it is possible, among other applications, to make statistical forecasts of maximum and minimum flows in watercourses. Several studies show good results in the use of clustering for the formation of better regions from the hydrological point of view. This work applies machine learning techniques to obtain hydrologically homogeneous regions. More specifically, in this work we have explored the use of the methods: k-means, affinnity propagation, aglomerative clustering and region of influence for the formation of regions, which makes a comparison between the methods and the use of attributes selection techniques. In this work three methods are proposed for the solution of the problem, using clusters adjustment based on the measures of heterogeneity and discordance of Hosking. Two of these methods use the k-means algorithm making variations in the initial clusters in order to look for centroids that best represent hydrologically homogeneous regions. And the other method combines clustering results with regions of influence. With the proposed methods it was possible to improve, in the best result, from 63.2 % to 90.5 % of the utilization of the regions formed for the application of RFA. With this work it was concluded that the selected attributes presented better results than the use of all the attributes, and that the proposed methods show great potential since they presented better results than other already existing methods.
Keywords: Aprendizado não-supervisionado
Clusterização
Regionalização hidrológica
Unsupervised learning
Clustering
Regional flood frequency
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Pelotas
metadata.dc.publisher.initials: UFPel
metadata.dc.publisher.department: Centro de Desenvolvimento Tecnológico
metadata.dc.publisher.program: Programa de Pós-Graduação em Computação
Citation: OLIVEIRA, Leroi Floriano de. Proposta de métodos de clusterização de dados com validação por testes de heterogeneidade e discordância aplicados à regionalização de bacias hidrográficas. 2018. 63 f. Dissertação (Mestrado em Computação) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2018.
metadata.dc.rights: OpenAccess
URI: http://guaiaca.ufpel.edu.br:8080/handle/prefix/4352
Issue Date: 6-Apr-2018
Appears in Collections:PPGC: Dissertações e Teses

Files in This Item:
File Description SizeFormat 
Dissertacao_Leroi_Floriano_de_Almeida.pdf10,64 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons