Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.
Abstract
Codificadores de vídeo são ferramentas importantíssimas atualmente para a vi abilização de aplicações comuns no nosso cotidiano, seja em aplicativos dedicados
à transmissão de vídeo para entretenimento, como YouTube e Netflix, seja em redes
sociais, como Instagram ou TikTok, ou ainda para comunicação privada, como em
chamadas de vídeo. Não à toa, mesmo com uso de codificadores de vídeo eficientes,
conteúdos de vídeo representam uma parcela considerável do tráfego de dados
mundial pela internet. Por este motivo, esta é uma área de relevância ímpar na comu nidade científica e a definição de novos padrões e formatos de compressão de vídeo
cada vez mais eficientes tem sido uma constante. Considerando o grande número de
formatos e padrões de codificação, a modificação de arquivos de vídeo para diversos
fins é uma prática comum, seja para prover compatibilidade entre dispositivos ou ainda
para adequar um vídeo codificado a situações adversas, como adaptação de taxa de
bits e resolução. Essa modificação é chamada de transcodificação de vídeo e possui
diversas aplicações. Uma das aplicações, denominada transcodificação heterogênea,
tipicamente envolve a atualização de vídeos codificados em um formato mais antigo
para outro mais recente e com maior eficiência de compressão. Contudo, essa tarefa
exige um significativo esforço computacional, pois envolve uma decodificação e uma
nova codificação em sequência. Por isso, parte da comunidade científica atuante na
área de codificação de vídeo vem buscando soluções para acelerar o processo de
transcodificação de vídeo. Esta tese está centrada neste objetivo. A tese apresenta
inicialmente o estado da arte em transcodificação de vídeo, suas aplicações e
técnicas. Nesta tese, são apresentadas sete propostas de transcodificadores rápidos
para o formato AOMedia Video 1 (AV1), partindo de outros formatos largamente
utilizados pela indústria de streaming de vídeo. Dentre as propostas realizadas,
destacam-se aquelas que empregam modelos preditivos treinados por algoritmos de
aprendizado de máquina para acelerar as decisões de particionamento do codificador.
De forma a possibilitar o desenvolvimento ágil de transcodificadores rápidos, esta
tese também propõe um pipeline de processamento, que permite, dentre outras
coisas, a automatização do treinamento de modelos preditivos e o escalonamento de
experimentos para testá-los. Como prova de conceito a essa proposta metodológica,
cinco transcodificadores de vídeo rápidos foram desenvolvidos com o pipeline, todos eles empregando modelos preditivos do tipo árvore de decisão. Os resultados obtidos
indicam que é possível acelerar o processo de transcodificação para o formato AV1
entre 12% e 55%, com perdas em eficiência de codificação que variam entre 1,6% e
12,8%, dependendo do formato de origem.
Collections
The following license files are associated with this item:
Related items
Showing items related by title, author, creator and subject.
-
A produção de vídeo estudantil na prática docente: uma forma de ensinar
Silva, Josias Pereira da (2014-04-15)A tecnologia diminui a distância entre as pessoas, possibilitando que usuários sem conhecimento técnico tornem-se produtores de conteúdos. Crianças e jovens contam com ferramentas como celular, máquina fotográfica e tablet ... -
Avaliação Objetiva de Qualidade de Imagem e Vídeo 3D Utilizando Técnicas de Aprendizado de Máquina
Bastos, Narúsci dos Santos (2023-02-27)Décadas de pesquisa em Avaliação de Qualidade de Imagem e Vídeo promo veram a criação de uma variedade de métricas objetivas de qualidade que se correlacionam fortemente com a qualidade subjetiva de imagem e vídeo. No ... -
Melhoria de Qualidade de Vídeo Comprimido: soluções com Redes Neurais Profundas para Múltiplos Codecs
Franco Neto, Gilberto Kreisler (2024-06-27)O processo de compressão necessário para viabilizar transmissão e armazena mento de vídeos gera artefatos que reduzem a qualidade da imagem, o que se reflete em uma pior qualidade de experiência do usuário. Para atenuar ...