Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC

Visualizar/ Abrir
Data
2025-03-11Autor
Viana, Ramiro Gomes da Silva
Metadata
Mostrar registro completoResumo
À medida que a demanda por transmissão de vídeo aumenta com trabalho re moto, educação e serviços de streaming, a necessidade de avanços contínuos nas
tecnologias de codificação de vídeo torna-se cada vez mais evidente. Adaptar-se às
exigências crescentes de entrega e consumo eficiente de vídeos requer o desen volvimento e aprimoramento constante nos padrões de codificação de vídeo, com o
Versatile Video Coding (VVC) emergindo como um exemplo notável. Este trabalho
apresenta uma visão geral dos principais algoritmos na Predição Inter-Quadros do
VVC, com foco principalmente no Test Zone Search (TZS) e na Estimação de Movi mento Affine (AME), duas das ferramentas mais intensivas em termos de computação
dentro do VVC. Além disso, este trabalho introduz uma abordagem para acelerar o
TZS e a AME usando Aprendizado de Máquina, especificamente utilizando Árvores
de Decisão. Primeiro, foi realizada uma aceleração no software de referência VVC
Test Model (VTM) focada no TZS, pulando seletivamente as suas três últimas etapas,
utilizando um conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco
suportado pelo TZS no VVC. Em seguida, foi realizada a aceleração da AME do VTM,
considerando a implementação acelerada do TZS. Neste caso, todo o processo da
AME é pulado seletivamente, utilizando um novo conjunto de 12 Árvores de Decisão,
uma para cada tamanho de bloco suportado pela AME no VVC. Esta abordagem
proposta alcançou uma redução média de 20,99% no tempo total de codificação do
VVC, uma redução média de 62,15% no tempo de execução do TZS e uma redução
média de 63,58% no tempo de execução da AME, ocasionando em uma pequena
perda média de eficiência de BD-BR de somente 0,90%. Estes resultados são
competitivos quando comparados com os trabalhos da literatura e demonstram que a
estratégia de uso de aprendizado de máquina para reduzir o custo computacional do
VVC tem potencial de seguir gerando resultados expressivos em soluções futuras.