dc.creator | Viana, Ramiro Gomes da Silva | |
dc.date.accessioned | 2025-05-28T12:28:33Z | |
dc.date.available | 2025-05-28T12:28:33Z | |
dc.date.issued | 2025-03-11 | |
dc.identifier.citation | VIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. | pt_BR |
dc.identifier.uri | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988 | |
dc.description.abstract | As the demand for video transmission surges on remote work, education, and
streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of
efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging
as a notable example. This work provides an overview of the main algorithms in
VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine
Motion Estimation (AME), two of the most computationally intensive tools within VVC.
Furthermore, this work introduces an approach to accelerate TZS and AME using
Machine Learning, specifically employing Decision Trees. First, an acceleration of
the VVC Test Model (VTM) reference software was performed, focusing on TZS, by
selectively skipping its last three steps using a set of 12 Decision Trees, one for each
block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was
performed, considering the accelerated implementation of TZS. In this case, the entire
AME process is selectively skipped using a new set of 12 Decision Trees, one for each
block size supported by AME in VVC. The proposed approach achieved an average
reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15%
in the TZS execution time, and an average reduction of 63.58% in the AME execution
time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results
are competitive compared to related works in the literature and demonstrate that the
strategy of using machine learning to reduce the computational cost of VVC has the
potential to continue yielding significant results in future solutions. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Pelotas | pt_BR |
dc.rights | OpenAccess | pt_BR |
dc.subject | Predição inter-quadros | pt_BR |
dc.subject | Versatile Video Coding | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Árvores de decisão | pt_BR |
dc.subject | Inter frame prediction | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject | Decision trees | pt_BR |
dc.title | Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC | pt_BR |
dc.title.alternative | Machine Learning Applied to Reducing the Computational Cost of Test Zone Search and Affine Motion Estimation in the VVC Encoder | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.authorID | https://orcid.org/0000-0001-7590-2883 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/5361131703414450 | pt_BR |
dc.contributor.advisorID | https://orcid.org/0000-0002-3421-5830 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9604735363839730 | pt_BR |
dc.contributor.advisor-co1 | Porto, Marcelo Schiavon | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/5741927083446578 | pt_BR |
dc.contributor.advisor-co2 | Corrêa, Guilherme Ribeiro | |
dc.contributor.advisor-co2Lattes | http://lattes.cnpq.br/1389878856201800 | pt_BR |
dc.description.resumo | À medida que a demanda por transmissão de vídeo aumenta com trabalho re moto, educação e serviços de streaming, a necessidade de avanços contínuos nas
tecnologias de codificação de vídeo torna-se cada vez mais evidente. Adaptar-se às
exigências crescentes de entrega e consumo eficiente de vídeos requer o desen volvimento e aprimoramento constante nos padrões de codificação de vídeo, com o
Versatile Video Coding (VVC) emergindo como um exemplo notável. Este trabalho
apresenta uma visão geral dos principais algoritmos na Predição Inter-Quadros do
VVC, com foco principalmente no Test Zone Search (TZS) e na Estimação de Movi mento Affine (AME), duas das ferramentas mais intensivas em termos de computação
dentro do VVC. Além disso, este trabalho introduz uma abordagem para acelerar o
TZS e a AME usando Aprendizado de Máquina, especificamente utilizando Árvores
de Decisão. Primeiro, foi realizada uma aceleração no software de referência VVC
Test Model (VTM) focada no TZS, pulando seletivamente as suas três últimas etapas,
utilizando um conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco
suportado pelo TZS no VVC. Em seguida, foi realizada a aceleração da AME do VTM,
considerando a implementação acelerada do TZS. Neste caso, todo o processo da
AME é pulado seletivamente, utilizando um novo conjunto de 12 Árvores de Decisão,
uma para cada tamanho de bloco suportado pela AME no VVC. Esta abordagem
proposta alcançou uma redução média de 20,99% no tempo total de codificação do
VVC, uma redução média de 62,15% no tempo de execução do TZS e uma redução
média de 63,58% no tempo de execução da AME, ocasionando em uma pequena
perda média de eficiência de BD-BR de somente 0,90%. Estes resultados são
competitivos quando comparados com os trabalhos da literatura e demonstram que a
estratégia de uso de aprendizado de máquina para reduzir o custo computacional do
VVC tem potencial de seguir gerando resultados expressivos em soluções futuras. | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.publisher.initials | UFPel | pt_BR |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.rights.license | CC BY-NC-SA | pt_BR |
dc.contributor.advisor1 | Agostini, Luciano Volcan | |
dc.subject.cnpq1 | CIENCIA DA COMPUTACAO | pt_BR |