Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.

Borges, Alex Machado

dc.creator	Borges, Alex Machado
dc.date.accessioned	2023-04-04T00:40:11Z
dc.date.available	2023-04-03
dc.date.available	2023-04-04T00:40:11Z
dc.date.issued	2023-03-15
dc.identifier.citation	BORGES, Alex Machado. Desenvolvimento de Soluções Baseadas em Aprendizado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1. Orientador: Guilherme Ribeiro Correa. 2023. 193 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2023.	pt_BR
dc.identifier.uri	http://guaiaca.ufpel.edu.br/handle/prefix/9241
dc.description.abstract	Video encoders are currently very important tools for enabling common applica tions in our daily lives, whether in applications dedicated to video transmission for entertainment, such as YouTube and Netflix, or in social networks, such as Instagram or TikTok, or even for private communication, such as on video calls. Even with the use of efficient video encoders, video content represents a considerable portion of the world’s data traffic over the Internet. For this reason, this is an area of unique relevance in the scientific community and the definition of new standards and video compression formats has been a constant. Considering the large number of video formats and standards, modifying encoded video files for different purposes is a common practice, whether to provide compatibility between devices or even to adapt a coded video to different situations, such as bit rate adaptation and resolution change. This modification is called video transcoding and has several applications. One of the applications, called heterogeneous transcoding, tipically involves updating videos encoded in an older format to a more recent one with greater compression efficiency. However, this task requires a significant computational effort, as it involves decoding and re-encoding the video in sequence. Therefore, part of the scientific community active in the video coding field has been looking for solutions to speed up the video transcoding process. This thesis is focused on this goal. The thesis initially presents the state of the art in video transcoding, its applications and techniques. In this thesis, seven fast transcoders are proposed for the AOMedia Video 1 (AV1) format, based on other formats widely used by the video streaming industry. Among the proposals, those that employ predictive models trained by machine learning algorithms to accelerate the encoder partitioning decisions stand out. In order to enable the agile development of fast transcoders, this thesis also proposes a processing pipeline, which allows, among other things, the automation of training predictive models and the scheduling of experiments to test them. As a proof of concept for this methodological proposal, five fast video transcoders were developed with the pipeline, all of them employing decision tree models. The obtained results indicate that it is possible to accelerate the transcoding process for the AV1 format between 12% and 55%, with losses in coding efficiency that vary between 0.96% and 12.85%, depending on the source format.	pt_BR
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Pelotas	pt_BR
dc.rights	OpenAccess	pt_BR
dc.subject	Formato AV1	pt_BR
dc.subject	Redução de complexidade	pt_BR
dc.subject	Codificação de vídeo	pt_BR
dc.subject	Transcodificação de vídeo	pt_BR
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	AV1 Format	pt_BR
dc.subject	Complexity reduction	pt_BR
dc.subject	Video coding	pt_BR
dc.subject	Video transcoding	pt_BR
dc.subject	MachinelLearning	pt_BR
dc.title	Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.	pt_BR
dc.title.alternative	Development of Machine Learning-Based Solutions for Fast Video Transcoding to the Format AOMedia Video 1.	pt_BR
dc.type	doctoralThesis	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/8656832357507890	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/1389878856201800	pt_BR
dc.contributor.advisor-co1	Zatt, Bruno
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/8251926321102019	pt_BR
dc.contributor.advisor-co2	Porto, Marcelo Schiavon
dc.contributor.advisor-co2Lattes	http://lattes.cnpq.br/5741927083446578	pt_BR
dc.description.resumo	Codificadores de vídeo são ferramentas importantíssimas atualmente para a vi abilização de aplicações comuns no nosso cotidiano, seja em aplicativos dedicados à transmissão de vídeo para entretenimento, como YouTube e Netflix, seja em redes sociais, como Instagram ou TikTok, ou ainda para comunicação privada, como em chamadas de vídeo. Não à toa, mesmo com uso de codificadores de vídeo eficientes, conteúdos de vídeo representam uma parcela considerável do tráfego de dados mundial pela internet. Por este motivo, esta é uma área de relevância ímpar na comu nidade científica e a definição de novos padrões e formatos de compressão de vídeo cada vez mais eficientes tem sido uma constante. Considerando o grande número de formatos e padrões de codificação, a modificação de arquivos de vídeo para diversos fins é uma prática comum, seja para prover compatibilidade entre dispositivos ou ainda para adequar um vídeo codificado a situações adversas, como adaptação de taxa de bits e resolução. Essa modificação é chamada de transcodificação de vídeo e possui diversas aplicações. Uma das aplicações, denominada transcodificação heterogênea, tipicamente envolve a atualização de vídeos codificados em um formato mais antigo para outro mais recente e com maior eficiência de compressão. Contudo, essa tarefa exige um significativo esforço computacional, pois envolve uma decodificação e uma nova codificação em sequência. Por isso, parte da comunidade científica atuante na área de codificação de vídeo vem buscando soluções para acelerar o processo de transcodificação de vídeo. Esta tese está centrada neste objetivo. A tese apresenta inicialmente o estado da arte em transcodificação de vídeo, suas aplicações e técnicas. Nesta tese, são apresentadas sete propostas de transcodificadores rápidos para o formato AOMedia Video 1 (AV1), partindo de outros formatos largamente utilizados pela indústria de streaming de vídeo. Dentre as propostas realizadas, destacam-se aquelas que empregam modelos preditivos treinados por algoritmos de aprendizado de máquina para acelerar as decisões de particionamento do codificador. De forma a possibilitar o desenvolvimento ágil de transcodificadores rápidos, esta tese também propõe um pipeline de processamento, que permite, dentre outras coisas, a automatização do treinamento de modelos preditivos e o escalonamento de experimentos para testá-los. Como prova de conceito a essa proposta metodológica, cinco transcodificadores de vídeo rápidos foram desenvolvidos com o pipeline, todos eles empregando modelos preditivos do tipo árvore de decisão. Os resultados obtidos indicam que é possível acelerar o processo de transcodificação para o formato AV1 entre 12% e 55%, com perdas em eficiência de codificação que variam entre 1,6% e 12,8%, dependendo do formato de origem.	pt_BR
dc.publisher.department	Centro de Desenvolvimento Tecnológico	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Computação	pt_BR
dc.publisher.initials	UFPel	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.contributor.advisor1	Corrêa, Guilherme Ribeiro

Ficheros en el ítem

Nombre:: Tese_Alex Machado Borges.pdf
Tamaño:: 1.763Mb
Formato:: PDF

Ver/

Nombre:: license_url
Tamaño:: 49bytes
Formato:: Fichero de texto

Ver/

Nombre:: license_text
Tamaño:: 0bytes
Formato:: HTML

Ver/

Nombre:: license_rdf
Tamaño:: 0bytes
Formato:: application/rdf+xml

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

PPGC: Dissertações e Teses [233]
Dissertações e teses.

Mostrar el registro sencillo del ítem

Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Ítems relacionados

A produção de vídeo estudantil na prática docente: uma forma de ensinar ﻿

Avaliação Objetiva de Qualidade de Imagem e Vídeo 3D Utilizando Técnicas de Aprendizado de Máquina ﻿

Melhoria de Qualidade de Vídeo Comprimido: soluções com Redes Neurais Profundas para Múltiplos Codecs ﻿

A produção de vídeo estudantil na prática docente: uma forma de ensinar

Avaliação Objetiva de Qualidade de Imagem e Vídeo 3D Utilizando Técnicas de Aprendizado de Máquina

Melhoria de Qualidade de Vídeo Comprimido: soluções com Redes Neurais Profundas para Múltiplos Codecs