• português (Brasil)
    • English
    • español
  • português (Brasil) 
    • português (Brasil)
    • English
    • español
  • Entrar
Ver item 
  •   Página inicial
  • Centro de Desenvolvimento Tecnológico - CDTec
  • Pós-Graduação em Computação - PPGC
  • PPGC: Dissertações e Teses
  • Ver item
  •   Página inicial
  • Centro de Desenvolvimento Tecnológico - CDTec
  • Pós-Graduação em Computação - PPGC
  • PPGC: Dissertações e Teses
  • Ver item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Predição de Light Fields utilizando técnicas de aprendizado profundo

Thumbnail
Visualizar/Abrir
Tese_Ítalo Dombrowski Machado.pdf (8.457Mb)
Data
2025-02-21
Autor
Machado, ítalo Dombrowski
Metadata
Mostrar registro completo
Resumo
O crescente uso de múltiplas câmeras tem levado pesquisadores a revisitar a teoria de Light Fields, que captura informações espaciais e angulares, aumentando a quantidade de dados armazenados e exigindo técnicas avançadas de compressão. Algumas abordagens comprimem Light Fields reorganizando-os em sequências pseudo-temporais ou utilizando JPEG-Pleno, mas a falta de predição em blocos ou a conversão para 3D pode diminuir a eficiência da compressão, criando oportunidades para explorar predições ao nível de blocos que aproveitem melhor a estrutura 4D. Além disto, pesquisas recentes têm obtido resultados interessantes ao utilizar algo ritmos de aprendizado de máquina como redes neurais convolucionais para realizar predição em codificadores tanto de imagens como de vídeos. Contudo, existem inúmeras técnicas de treinamento e arquiteturas de redes neurais convolucionais, e seus desempenhos variam drasticamente com o tipo de tarefa e dado. Desta maneira, este trabalho propõe um método de treinar redes neurais convolucionais capazes de adaptar a predição intra de codificadores de vídeo para explorarem as redundâncias angulares e espaciais presentes nos Light Fields. Todas as etapas de avaliação e desenvolvimento durante o fluxo de trabalho foram minuciosamente analisadas, com uma explicação detalhada dos objetivos de cada técnica, bem como suas falhas e sucessos. O software de referência do EVC foi utilizado para avaliar diversas arquiteturas como autoencoders, Highway, Residuais, sob diferentes configurações de kernel e hiperparâmetros como data augmentation e métodos de decaimento do learning rate. Outro experimento realizado foi a comparação da métrica de SATD com a MSE e a SAD como funções de perda no treinamento. Ainda, técnicas de poda es truturada e não estruturada foram avaliadas para aperfeiçoar a eficiência dos modelos treinados. Ao final dos experimentos, os preditores resultantes são constituídos por aproximadamente 1,3M de parâmetros e, quando validados, atingiram um BD-Rate de -40,95% para o codificador HM e -46,89% para o codificador VTM. Quando validados realizando a predição da codificação de um segundo dataset, atingiram uma melhora de eficiência no codificador VTM de -30,09%. Ainda, os preditores se mostraram competitivos com o estado-da-arte de compressão de Light Fields e superaram os trabalhos relacionados em torno de -20%.
URI
http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15744
Collections
  • PPGC: Dissertações e Teses [230]

DSpace software copyright © 2002-2022  LYRASIS
Entre em contato | Deixe sua opinião
Theme by 
Atmire NV
 

 

Navegar

Todo o repositórioComunidades e ColeçõesData do documentoAutoresOrientadoresTítulosAssuntosÁreas de Conhecimento (CNPq)DepartamentosProgramasTipos de DocumentoTipos de AcessoEsta coleçãoData do documentoAutoresOrientadoresTítulosAssuntosÁreas de Conhecimento (CNPq)DepartamentosProgramasTipos de DocumentoTipos de Acesso

Minha conta

EntrarCadastro

Estatística

Ver as estatísticas de uso

DSpace software copyright © 2002-2022  LYRASIS
Entre em contato | Deixe sua opinião
Theme by 
Atmire NV