Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC

Gonçalves, Paulo Henrik Ribeiro

dc.creator	Gonçalves, Paulo Henrik Ribeiro
dc.date.accessioned	2021-06-24T22:56:10Z
dc.date.available	2021-06-24T22:56:10Z
dc.date.issued	2021-04-23
dc.identifier.citation	GONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021.	pt_BR
dc.identifier.uri	http://guaiaca.ufpel.edu.br/handle/prefix/7787
dc.description.abstract	The new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC.	pt_BR
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Pelotas	pt_BR
dc.rights	OpenAccess	pt_BR
dc.subject	Computação	pt_BR
dc.subject	Codificação de vídeo	pt_BR
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	Redução de esforço computacional	pt_BR
dc.subject	Predição affine	pt_BR
dc.subject	Video coding	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Complexity reduction	pt_BR
dc.subject	Affine prediction	pt_BR
dc.title	Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC	pt_BR
dc.title.alternative	A Learning-based Affine Prediction for VVC Video Coding	pt_BR
dc.type	masterThesis	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/1391402769662738	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/5741927083446578	pt_BR
dc.contributor.advisor-co1	Corrêa, Guilherme Ribeiro
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/1389878856201800	pt_BR
dc.contributor.advisor-co2	Agostini, Luciano Volcan
dc.contributor.advisor-co2Lattes	http://lattes.cnpq.br/9604735363839730	pt_BR
dc.description.resumo	Novas tendências no cenário de vídeos digitais têm ganhado muita popularidade recentemente, como vídeos de resoluções 4K-8K, vídeos omnidirecionais e conteúdo de tela. Para suportar tais tecnologias, novos codificadores de vídeo têm sido propostos nos últimos anos. Dentre eles, o Versatile Video Coding (VVC) é a nova aposta do Joint Video Experts Team. Lançado em Julho de 2020, o novo padrão obtém uma eficiência de codificação de 33%, quando comparado ao seu antecessor, isto devido às novas ferramentas implementadas, como estruturas de particionamento flexíveis, novas ferramentas de predição intra blocos, conjunto de novas transformadas, entre outras. Entretanto, tal avanço vem ao custo de um aumento expressivo no tempo do codificação. Outra nova ferramenta implementada é a predição affine, que permite a detecção de movimentos não-translacionais durante o processo de predição inter quadros, e portanto, oferece uma eficiência de codificação superior aos padrões anteriores. Entretanto, a predição affine acrescenta um aumento no tempo de processamento da predição interquadros de até 47%, dependendo da configuração utilizada, tornando-se um grande desafio para aplicações que necessitam de uma codificação rápida. Sendo assim, este trabalho propõe um esquema para redução do esforço computacional do codificador de vídeo VVC, através do controle de execução da etapa de predição affine. Chamado de LEAP (do inglês, Learning-based Affine Prediction), o esquema proposto é baseado em aprendizado de máquina, e é capaz de reduzir o tempo total de codificação em 8,49%, e o tempo de codificação do módulo de predição affine em 46,94%, em média, com baixas penalidades na eficiência de codificação. Além disso, por se tratar de um controle de uma das etapas de codificação, o esquema proposto pode ser aliado a outras técnicas de redução de esforço computacional para obter uma redução final ainda mais eficiente.	pt_BR
dc.publisher.department	Centro de Desenvolvimento Tecnológico	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Computação	pt_BR
dc.publisher.initials	UFPel	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.contributor.advisor1	Porto, Marcelo Schiavon

Files in this item

Name:: Dissertacao_Paulo_Henrrik_Ribe ...
Size:: 4.197Mb
Format:: PDF

View/Open

Name:: license_url
Size:: 49bytes
Format:: Text file

View/Open

Name:: license_text
Size:: 0bytes
Format:: HTML

View/Open

Name:: license_rdf
Size:: 0bytes
Format:: application/rdf+xml

View/Open

This item appears in the following Collection(s)

PPGC: Dissertações e Teses [236]
Dissertações e teses.

Show simple item record