dc.creator | Borges, Alex Machado | |
dc.date.accessioned | 2023-04-04T00:40:11Z | |
dc.date.available | 2023-04-03 | |
dc.date.available | 2023-04-04T00:40:11Z | |
dc.date.issued | 2023-03-15 | |
dc.identifier.citation | BORGES, Alex Machado. Desenvolvimento de Soluções Baseadas em Aprendizado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1. Orientador: Guilherme Ribeiro Correa. 2023. 193 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2023. | pt_BR |
dc.identifier.uri | http://guaiaca.ufpel.edu.br/handle/prefix/9241 | |
dc.description.abstract | Video encoders are currently very important tools for enabling common applica tions in our daily lives, whether in applications dedicated to video transmission for
entertainment, such as YouTube and Netflix, or in social networks, such as Instagram
or TikTok, or even for private communication, such as on video calls. Even with the
use of efficient video encoders, video content represents a considerable portion of
the world’s data traffic over the Internet. For this reason, this is an area of unique
relevance in the scientific community and the definition of new standards and video
compression formats has been a constant. Considering the large number of video
formats and standards, modifying encoded video files for different purposes is a
common practice, whether to provide compatibility between devices or even to adapt a
coded video to different situations, such as bit rate adaptation and resolution change.
This modification is called video transcoding and has several applications. One of
the applications, called heterogeneous transcoding, tipically involves updating videos
encoded in an older format to a more recent one with greater compression efficiency.
However, this task requires a significant computational effort, as it involves decoding
and re-encoding the video in sequence. Therefore, part of the scientific community
active in the video coding field has been looking for solutions to speed up the video
transcoding process. This thesis is focused on this goal. The thesis initially presents
the state of the art in video transcoding, its applications and techniques. In this
thesis, seven fast transcoders are proposed for the AOMedia Video 1 (AV1) format,
based on other formats widely used by the video streaming industry. Among the
proposals, those that employ predictive models trained by machine learning algorithms
to accelerate the encoder partitioning decisions stand out. In order to enable the
agile development of fast transcoders, this thesis also proposes a processing pipeline,
which allows, among other things, the automation of training predictive models and the
scheduling of experiments to test them. As a proof of concept for this methodological
proposal, five fast video transcoders were developed with the pipeline, all of them
employing decision tree models. The obtained results indicate that it is possible to
accelerate the transcoding process for the AV1 format between 12% and 55%, with
losses in coding efficiency that vary between 0.96% and 12.85%, depending on the
source format. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Pelotas | pt_BR |
dc.rights | OpenAccess | pt_BR |
dc.subject | Formato AV1 | pt_BR |
dc.subject | Redução de complexidade | pt_BR |
dc.subject | Codificação de vídeo | pt_BR |
dc.subject | Transcodificação de vídeo | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | AV1 Format | pt_BR |
dc.subject | Complexity reduction | pt_BR |
dc.subject | Video coding | pt_BR |
dc.subject | Video transcoding | pt_BR |
dc.subject | MachinelLearning | pt_BR |
dc.title | Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1. | pt_BR |
dc.title.alternative | Development of Machine Learning-Based Solutions for Fast Video Transcoding to the Format AOMedia Video 1. | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/8656832357507890 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/1389878856201800 | pt_BR |
dc.contributor.advisor-co1 | Zatt, Bruno | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/8251926321102019 | pt_BR |
dc.contributor.advisor-co2 | Porto, Marcelo Schiavon | |
dc.contributor.advisor-co2Lattes | http://lattes.cnpq.br/5741927083446578 | pt_BR |
dc.description.resumo | Codificadores de vídeo são ferramentas importantíssimas atualmente para a vi abilização de aplicações comuns no nosso cotidiano, seja em aplicativos dedicados
à transmissão de vídeo para entretenimento, como YouTube e Netflix, seja em redes
sociais, como Instagram ou TikTok, ou ainda para comunicação privada, como em
chamadas de vídeo. Não à toa, mesmo com uso de codificadores de vídeo eficientes,
conteúdos de vídeo representam uma parcela considerável do tráfego de dados
mundial pela internet. Por este motivo, esta é uma área de relevância ímpar na comu nidade científica e a definição de novos padrões e formatos de compressão de vídeo
cada vez mais eficientes tem sido uma constante. Considerando o grande número de
formatos e padrões de codificação, a modificação de arquivos de vídeo para diversos
fins é uma prática comum, seja para prover compatibilidade entre dispositivos ou ainda
para adequar um vídeo codificado a situações adversas, como adaptação de taxa de
bits e resolução. Essa modificação é chamada de transcodificação de vídeo e possui
diversas aplicações. Uma das aplicações, denominada transcodificação heterogênea,
tipicamente envolve a atualização de vídeos codificados em um formato mais antigo
para outro mais recente e com maior eficiência de compressão. Contudo, essa tarefa
exige um significativo esforço computacional, pois envolve uma decodificação e uma
nova codificação em sequência. Por isso, parte da comunidade científica atuante na
área de codificação de vídeo vem buscando soluções para acelerar o processo de
transcodificação de vídeo. Esta tese está centrada neste objetivo. A tese apresenta
inicialmente o estado da arte em transcodificação de vídeo, suas aplicações e
técnicas. Nesta tese, são apresentadas sete propostas de transcodificadores rápidos
para o formato AOMedia Video 1 (AV1), partindo de outros formatos largamente
utilizados pela indústria de streaming de vídeo. Dentre as propostas realizadas,
destacam-se aquelas que empregam modelos preditivos treinados por algoritmos de
aprendizado de máquina para acelerar as decisões de particionamento do codificador.
De forma a possibilitar o desenvolvimento ágil de transcodificadores rápidos, esta
tese também propõe um pipeline de processamento, que permite, dentre outras
coisas, a automatização do treinamento de modelos preditivos e o escalonamento de
experimentos para testá-los. Como prova de conceito a essa proposta metodológica,
cinco transcodificadores de vídeo rápidos foram desenvolvidos com o pipeline, todos eles empregando modelos preditivos do tipo árvore de decisão. Os resultados obtidos
indicam que é possível acelerar o processo de transcodificação para o formato AV1
entre 12% e 55%, com perdas em eficiência de codificação que variam entre 1,6% e
12,8%, dependendo do formato de origem. | pt_BR |
dc.publisher.department | Centro de Desenvolvimento Tecnológico | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.publisher.initials | UFPel | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.contributor.advisor1 | Corrêa, Guilherme Ribeiro | |