Mostrar el registro sencillo del ítem
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
dc.creator | Viana, Ramiro Gomes da Silva | |
dc.date.accessioned | 2025-05-28T12:28:33Z | |
dc.date.available | 2025-05-28T12:28:33Z | |
dc.date.issued | 2025-03-11 | |
dc.identifier.citation | VIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. | pt_BR |
dc.identifier.uri | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988 | |
dc.description.abstract | As the demand for video transmission surges on remote work, education, and streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging as a notable example. This work provides an overview of the main algorithms in VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine Motion Estimation (AME), two of the most computationally intensive tools within VVC. Furthermore, this work introduces an approach to accelerate TZS and AME using Machine Learning, specifically employing Decision Trees. First, an acceleration of the VVC Test Model (VTM) reference software was performed, focusing on TZS, by selectively skipping its last three steps using a set of 12 Decision Trees, one for each block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was performed, considering the accelerated implementation of TZS. In this case, the entire AME process is selectively skipped using a new set of 12 Decision Trees, one for each block size supported by AME in VVC. The proposed approach achieved an average reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15% in the TZS execution time, and an average reduction of 63.58% in the AME execution time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results are competitive compared to related works in the literature and demonstrate that the strategy of using machine learning to reduce the computational cost of VVC has the potential to continue yielding significant results in future solutions. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Pelotas | pt_BR |
dc.rights | OpenAccess | pt_BR |
dc.subject | Predição inter-quadros | pt_BR |
dc.subject | Versatile Video Coding | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Árvores de decisão | pt_BR |
dc.subject | Inter frame prediction | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject | Decision trees | pt_BR |
dc.title | Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC | pt_BR |
dc.title.alternative | Machine Learning Applied to Reducing the Computational Cost of Test Zone Search and Affine Motion Estimation in the VVC Encoder | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.authorID | https://orcid.org/0000-0001-7590-2883 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/5361131703414450 | pt_BR |
dc.contributor.advisorID | https://orcid.org/0000-0002-3421-5830 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9604735363839730 | pt_BR |
dc.contributor.advisor-co1 | Porto, Marcelo Schiavon | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/5741927083446578 | pt_BR |
dc.contributor.advisor-co2 | Corrêa, Guilherme Ribeiro | |
dc.contributor.advisor-co2Lattes | http://lattes.cnpq.br/1389878856201800 | pt_BR |
dc.description.resumo | À medida que a demanda por transmissão de vídeo aumenta com trabalho re moto, educação e serviços de streaming, a necessidade de avanços contínuos nas tecnologias de codificação de vídeo torna-se cada vez mais evidente. Adaptar-se às exigências crescentes de entrega e consumo eficiente de vídeos requer o desen volvimento e aprimoramento constante nos padrões de codificação de vídeo, com o Versatile Video Coding (VVC) emergindo como um exemplo notável. Este trabalho apresenta uma visão geral dos principais algoritmos na Predição Inter-Quadros do VVC, com foco principalmente no Test Zone Search (TZS) e na Estimação de Movi mento Affine (AME), duas das ferramentas mais intensivas em termos de computação dentro do VVC. Além disso, este trabalho introduz uma abordagem para acelerar o TZS e a AME usando Aprendizado de Máquina, especificamente utilizando Árvores de Decisão. Primeiro, foi realizada uma aceleração no software de referência VVC Test Model (VTM) focada no TZS, pulando seletivamente as suas três últimas etapas, utilizando um conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco suportado pelo TZS no VVC. Em seguida, foi realizada a aceleração da AME do VTM, considerando a implementação acelerada do TZS. Neste caso, todo o processo da AME é pulado seletivamente, utilizando um novo conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco suportado pela AME no VVC. Esta abordagem proposta alcançou uma redução média de 20,99% no tempo total de codificação do VVC, uma redução média de 62,15% no tempo de execução do TZS e uma redução média de 63,58% no tempo de execução da AME, ocasionando em uma pequena perda média de eficiência de BD-BR de somente 0,90%. Estes resultados são competitivos quando comparados com os trabalhos da literatura e demonstram que a estratégia de uso de aprendizado de máquina para reduzir o custo computacional do VVC tem potencial de seguir gerando resultados expressivos em soluções futuras. | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.publisher.initials | UFPel | pt_BR |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.rights.license | CC BY-NC-SA | pt_BR |
dc.contributor.advisor1 | Agostini, Luciano Volcan | |
dc.subject.cnpq1 | CIENCIA DA COMPUTACAO | pt_BR |
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(ones)
-
PPGC: Dissertações e Teses [230]
Dissertações e teses.