DEEP LEARNING APLICADO À IDENTIFICAÇÃO DE OUTDOORS

  • Tomás Benfica
  • Rodrigo Treichel Cesar Pereira
  • Daniel Eliel Gaio
  • Gerson Alberto Leiria Nunes
Rótulo Visão, computacional, Yolov5, Deep, Learning, Convolutional, neural, network

Resumo

Machine learning é um subcampo da inteligência artificial que consiste em usar métodos computacionais intensivos a fim de detectar padrões e gerar modelos preditivos para o contexto em que está sendo empregado; tendo por característica o autoaprendizado, simula o processo de tomada de decisão de seres humanos, decidindo a partir da experiência com decisões anteriores. Assim, seus resultados e performance evoluem de forma autônoma. Deep learning, por sua vez, é uma forma de inferência de dados na área de machine learning. Esses dois campos estão entre as principais ferramentas da inteligência artificial moderna. Dessa forma, o presente projeto de pesquisa possui como objetivo o emprego de deep learning com a finalidade de atender uma demanda empresarial por um sistema computacional capaz de identificar, de forma automática, imagens e localização geográfica de outdoors e placas de propaganda situados no entorno de rodovias ou mesmo meios urbanos. A fim de resolver esse problema emprega-se as seguintes etapas no processo: cria-se um dataset, a partir da extração de quadros de vídeos e realiza-se a rotulação dos mesmos através do software LabelImg. Após essa etapa, necessitou-se realizar modificações na plataforma Yolov5 com o intuito de desempenhar o treinamento supervisionado utilizando esses datasets. Por fim, realiza-se o treinamento da rede neural convolucional Yolov5 a partir das imagens rotuladas presentes no dataset. Esse treinamento foi realizado na plataforma Google Colab a qual foi configurada para executar a etapa de treinamento com aproximadamente 1.000 épocas sobre aproximadamente 2.300 imagens rotuladas. No contexto das diferentes arquiteturas para redes neurais artificiais (small, medium, large, extra large), as quais definem a complexidade, os pesos e a quantidade de pesos nas camadas internas, optou-se pela small; fez-se necessário, aproximadamente, um total de 66 horas de processamento paralelo usando GPU (Graphical Processing Unit). Deste processo de treinamento, resulta uma rede neural, definida pela sua arquitetura e conjunto de pesos, a qual obteve uma precisão de 98%, mAP(mean average precision) de 82%, métrica que consiste em uma média da precisão das predições entre as diferentes classes do dataset. Além disso, GIoU (Generalized Intersection over Union), média de erros do processo, de aproximadamente 1,48%. Essas métricas mostraram-se bastante satisfatórias. Após todas essas etapas, foram realizados testes de validação do modelo através de imagens e vídeos desconhecidos. Esses testes de validação apresentaram resultados satisfatórios, apesar da presença de falsos-positivos; os quais podem ser contornados a partir de um limiar de cerca de 60% de certeza. Conclui-se, a partir destes resultados, que o modelo gerado por meio da metodologia aqui descrita está apto a realizar as identificações que por sua vez motivaram seu desenvolvimento.

Downloads

Não há dados estatísticos.
Publicado
2020-11-20
Como Citar
BENFICA, T.; TREICHEL CESAR PEREIRA, R.; ELIEL GAIO, D.; ALBERTO LEIRIA NUNES, G. DEEP LEARNING APLICADO À IDENTIFICAÇÃO DE OUTDOORS. Anais do Salão Internacional de Ensino, Pesquisa e Extensão, v. 12, n. 2, 20 nov. 2020.