| dc.creator | Gonçalves, Paulo Henrik Ribeiro | |
| dc.date.accessioned | 2021-06-24T22:56:10Z | |
| dc.date.available | 2021-06-24T22:56:10Z | |
| dc.date.issued | 2021-04-23 | |
| dc.identifier.citation | GONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021. | pt_BR |
| dc.identifier.uri | http://guaiaca.ufpel.edu.br/handle/prefix/7787 | |
| dc.description.abstract | The new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC
interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of
reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC. | pt_BR |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal de Pelotas | pt_BR |
| dc.rights | OpenAccess | pt_BR |
| dc.subject | Computação | pt_BR |
| dc.subject | Codificação de vídeo | pt_BR |
| dc.subject | Aprendizado de máquina | pt_BR |
| dc.subject | Redução de esforço computacional | pt_BR |
| dc.subject | Predição affine | pt_BR |
| dc.subject | Video coding | pt_BR |
| dc.subject | Machine learning | pt_BR |
| dc.subject | Complexity reduction | pt_BR |
| dc.subject | Affine prediction | pt_BR |
| dc.title | Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC | pt_BR |
| dc.title.alternative | A Learning-based Affine Prediction for VVC Video Coding | pt_BR |
| dc.type | masterThesis | pt_BR |
| dc.contributor.authorLattes | http://lattes.cnpq.br/1391402769662738 | pt_BR |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/5741927083446578 | pt_BR |
| dc.contributor.advisor-co1 | Corrêa, Guilherme Ribeiro | |
| dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/1389878856201800 | pt_BR |
| dc.contributor.advisor-co2 | Agostini, Luciano Volcan | |
| dc.contributor.advisor-co2Lattes | http://lattes.cnpq.br/9604735363839730 | pt_BR |
| dc.description.resumo | Novas tendências no cenário de vídeos digitais têm ganhado muita popularidade recentemente, como vídeos de resoluções 4K-8K, vídeos omnidirecionais e conteúdo de tela. Para suportar tais tecnologias, novos codificadores de vídeo têm sido propostos nos últimos anos. Dentre eles, o Versatile Video Coding (VVC) é a nova aposta do Joint Video Experts Team. Lançado em Julho de 2020, o novo padrão obtém uma eficiência de codificação de 33%, quando comparado ao seu antecessor, isto devido às novas ferramentas implementadas, como estruturas de particionamento flexíveis, novas ferramentas de predição intra blocos, conjunto de novas transformadas, entre outras. Entretanto, tal avanço vem ao custo de um aumento expressivo no tempo do codificação. Outra nova ferramenta implementada é a predição affine, que permite a detecção de movimentos não-translacionais durante o processo de predição inter quadros, e portanto, oferece uma eficiência de codificação superior aos
padrões anteriores. Entretanto, a predição affine acrescenta um aumento no tempo de processamento da predição interquadros de até 47%, dependendo da configuração utilizada, tornando-se um grande desafio para aplicações que necessitam de uma codificação rápida. Sendo assim, este trabalho propõe um esquema para redução do esforço computacional do codificador de vídeo VVC, através do controle de execução da etapa de predição affine. Chamado de LEAP (do inglês, Learning-based Affine Prediction), o esquema proposto é baseado em aprendizado de máquina, e é capaz de reduzir o tempo total de codificação em 8,49%, e o tempo de codificação do módulo de predição affine em 46,94%, em média, com baixas penalidades na eficiência de codificação. Além disso, por se tratar de um controle de uma das etapas de codificação, o esquema proposto pode ser aliado a outras técnicas de redução de esforço computacional para obter uma redução final ainda mais eficiente. | pt_BR |
| dc.publisher.department | Centro de Desenvolvimento Tecnológico | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
| dc.publisher.initials | UFPel | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.contributor.advisor1 | Porto, Marcelo Schiavon | |