Melhoria de Qualidade de Vídeo Comprimido: soluções com Redes Neurais Profundas para Múltiplos Codecs
Fecha
2024-06-27Autor
Franco Neto, Gilberto Kreisler
Metadatos
Mostrar el registro completo del ítemResumen
O processo de compressão necessário para viabilizar transmissão e armazena mento de vídeos gera artefatos que reduzem a qualidade da imagem, o que se reflete
em uma pior qualidade de experiência do usuário. Para atenuar esses artefatos,
são tipicamente aplicadas estratégias de filtragem no quadro descomprimido, as
quais são classificadas como estratégias in-loop e de pós-processamento. Esta
última funciona como uma segunda camada de filtragem, já que alguns artefatos
persistem após a filtragem in-loop. Por não estarem atrelados a nenhum codec em
específico, esses filtros podem ser usados como pós-processamento de qualquer
codec. As técnicas mais atuais de filtragem de pós-processamento são baseadas
em Redes Neurais Profundas, mais especificamente nas Redes Neurais Convo lucionais (CNN), como é o caso da Spatio-Temporal Deformable Fusion (STDF),
que é a técnica estado-da-arte para melhoria de qualidade de vídeos. Entretanto,
conforme apresentam os resultados obtidos nesta pesquisa, a arquitetura STDF não
apresenta bons resultados quando testada com outros padrões de codificação e
níveis de quantização, causando, inclusive, perdas de qualidade em determinados
cenários. Por isso, este trabalho propõe a exploração de técnicas de treinamento da
arquitetura STDF, com o objetivo de melhorar sua capacidade de generalização em
diversos codecs de vídeo. A primeira e a segunda solução são semelhantes quanto
à metodologia, ao propor um treinamento baseado em um dataset misto formado
por vídeos codificados pelo AOMedia Video 1 (AV1) e Versatile Video Coding (VVC).
Ao contrário da primeira solução, que é treinada desde o início sem utilizar modelo
pré-treinado, a segunda solução emprega a estratégia de fine tunning, partindo do
modelo STDF original. A terceira solução se baseia no paradigma de treinamento
multi-domínio, onde cada domínio corresponde a um codec de vídeo. Os resultados
experimentais mostram que a terceira solução atingiu melhorias de qualidade objetiva
de até 1,437 dB. Na média, a melhoria de qualidade atingida foi de 0,569 dB e a
solução mostrou-se capaz de melhorar a qualidade visual para todos os codificadores
e todos os vídeos testados, sendo genérica o suficiente para ser usada como filtro
único de pós-processamento para múltiplos padrões/formatos de codificação.
Colecciones
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
A produção de vídeo estudantil na prática docente: uma forma de ensinar
Silva, Josias Pereira da (2014-04-15)A tecnologia diminui a distância entre as pessoas, possibilitando que usuários sem conhecimento técnico tornem-se produtores de conteúdos. Crianças e jovens contam com ferramentas como celular, máquina fotográfica e tablet ... -
Avaliação Objetiva de Qualidade de Imagem e Vídeo 3D Utilizando Técnicas de Aprendizado de Máquina
Bastos, Narúsci dos Santos (2023-02-27)Décadas de pesquisa em Avaliação de Qualidade de Imagem e Vídeo promo veram a criação de uma variedade de métricas objetivas de qualidade que se correlacionam fortemente com a qualidade subjetiva de imagem e vídeo. No ... -
Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.
Borges, Alex Machado (2023-03-15)Codificadores de vídeo são ferramentas importantíssimas atualmente para a vi abilização de aplicações comuns no nosso cotidiano, seja em aplicativos dedicados à transmissão de vídeo para entretenimento, como YouTube e ...