Mostrar el registro sencillo del ítem

dc.creatorBorges, Alex Machado
dc.date.accessioned2023-04-04T00:40:11Z
dc.date.available2023-04-03
dc.date.available2023-04-04T00:40:11Z
dc.date.issued2023-03-15
dc.identifier.citationBORGES, Alex Machado. Desenvolvimento de Soluções Baseadas em Aprendizado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1. Orientador: Guilherme Ribeiro Correa. 2023. 193 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2023.pt_BR
dc.identifier.urihttp://guaiaca.ufpel.edu.br/handle/prefix/9241
dc.description.abstractVideo encoders are currently very important tools for enabling common applica tions in our daily lives, whether in applications dedicated to video transmission for entertainment, such as YouTube and Netflix, or in social networks, such as Instagram or TikTok, or even for private communication, such as on video calls. Even with the use of efficient video encoders, video content represents a considerable portion of the world’s data traffic over the Internet. For this reason, this is an area of unique relevance in the scientific community and the definition of new standards and video compression formats has been a constant. Considering the large number of video formats and standards, modifying encoded video files for different purposes is a common practice, whether to provide compatibility between devices or even to adapt a coded video to different situations, such as bit rate adaptation and resolution change. This modification is called video transcoding and has several applications. One of the applications, called heterogeneous transcoding, tipically involves updating videos encoded in an older format to a more recent one with greater compression efficiency. However, this task requires a significant computational effort, as it involves decoding and re-encoding the video in sequence. Therefore, part of the scientific community active in the video coding field has been looking for solutions to speed up the video transcoding process. This thesis is focused on this goal. The thesis initially presents the state of the art in video transcoding, its applications and techniques. In this thesis, seven fast transcoders are proposed for the AOMedia Video 1 (AV1) format, based on other formats widely used by the video streaming industry. Among the proposals, those that employ predictive models trained by machine learning algorithms to accelerate the encoder partitioning decisions stand out. In order to enable the agile development of fast transcoders, this thesis also proposes a processing pipeline, which allows, among other things, the automation of training predictive models and the scheduling of experiments to test them. As a proof of concept for this methodological proposal, five fast video transcoders were developed with the pipeline, all of them employing decision tree models. The obtained results indicate that it is possible to accelerate the transcoding process for the AV1 format between 12% and 55%, with losses in coding efficiency that vary between 0.96% and 12.85%, depending on the source format.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Pelotaspt_BR
dc.rightsOpenAccesspt_BR
dc.subjectFormato AV1pt_BR
dc.subjectRedução de complexidadept_BR
dc.subjectCodificação de vídeopt_BR
dc.subjectTranscodificação de vídeopt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectAV1 Formatpt_BR
dc.subjectComplexity reductionpt_BR
dc.subjectVideo codingpt_BR
dc.subjectVideo transcodingpt_BR
dc.subjectMachinelLearningpt_BR
dc.titleDesenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.pt_BR
dc.title.alternativeDevelopment of Machine Learning-Based Solutions for Fast Video Transcoding to the Format AOMedia Video 1.pt_BR
dc.typedoctoralThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/8656832357507890pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1389878856201800pt_BR
dc.contributor.advisor-co1Zatt, Bruno
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/8251926321102019pt_BR
dc.contributor.advisor-co2Porto, Marcelo Schiavon
dc.contributor.advisor-co2Latteshttp://lattes.cnpq.br/5741927083446578pt_BR
dc.description.resumoCodificadores de vídeo são ferramentas importantíssimas atualmente para a vi abilização de aplicações comuns no nosso cotidiano, seja em aplicativos dedicados à transmissão de vídeo para entretenimento, como YouTube e Netflix, seja em redes sociais, como Instagram ou TikTok, ou ainda para comunicação privada, como em chamadas de vídeo. Não à toa, mesmo com uso de codificadores de vídeo eficientes, conteúdos de vídeo representam uma parcela considerável do tráfego de dados mundial pela internet. Por este motivo, esta é uma área de relevância ímpar na comu nidade científica e a definição de novos padrões e formatos de compressão de vídeo cada vez mais eficientes tem sido uma constante. Considerando o grande número de formatos e padrões de codificação, a modificação de arquivos de vídeo para diversos fins é uma prática comum, seja para prover compatibilidade entre dispositivos ou ainda para adequar um vídeo codificado a situações adversas, como adaptação de taxa de bits e resolução. Essa modificação é chamada de transcodificação de vídeo e possui diversas aplicações. Uma das aplicações, denominada transcodificação heterogênea, tipicamente envolve a atualização de vídeos codificados em um formato mais antigo para outro mais recente e com maior eficiência de compressão. Contudo, essa tarefa exige um significativo esforço computacional, pois envolve uma decodificação e uma nova codificação em sequência. Por isso, parte da comunidade científica atuante na área de codificação de vídeo vem buscando soluções para acelerar o processo de transcodificação de vídeo. Esta tese está centrada neste objetivo. A tese apresenta inicialmente o estado da arte em transcodificação de vídeo, suas aplicações e técnicas. Nesta tese, são apresentadas sete propostas de transcodificadores rápidos para o formato AOMedia Video 1 (AV1), partindo de outros formatos largamente utilizados pela indústria de streaming de vídeo. Dentre as propostas realizadas, destacam-se aquelas que empregam modelos preditivos treinados por algoritmos de aprendizado de máquina para acelerar as decisões de particionamento do codificador. De forma a possibilitar o desenvolvimento ágil de transcodificadores rápidos, esta tese também propõe um pipeline de processamento, que permite, dentre outras coisas, a automatização do treinamento de modelos preditivos e o escalonamento de experimentos para testá-los. Como prova de conceito a essa proposta metodológica, cinco transcodificadores de vídeo rápidos foram desenvolvidos com o pipeline, todos eles empregando modelos preditivos do tipo árvore de decisão. Os resultados obtidos indicam que é possível acelerar o processo de transcodificação para o formato AV1 entre 12% e 55%, com perdas em eficiência de codificação que variam entre 1,6% e 12,8%, dependendo do formato de origem.pt_BR
dc.publisher.departmentCentro de Desenvolvimento Tecnológicopt_BR
dc.publisher.programPrograma de Pós-Graduação em Computaçãopt_BR
dc.publisher.initialsUFPelpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.publisher.countryBrasilpt_BR
dc.contributor.advisor1Corrêa, Guilherme Ribeiro


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem