ALGORITMOS DE INTELIGÊNCIA ARTIFICIAL PARA CLASSIFICAÇÃO DE NOTÍCIAS FALSAS

  • Pablo Lima
  • Erico Marcelo Hoff Do Amaral
  • Alex Dias Camargo
Rótulo Fake, News, Machine, Learning, Processamento, Linguagem, Natural, Deep, Inteligência, Artificial

Resumo

O presente estudo tem o objetivo realizar uma pesquisa exploratória sobre inteligência artificial e os algoritmos de Processamento de Linguagem Natural - NLP e deep learning usados na classificação de notícias falsas, também conhecidas como fake news, com intuito de verificar qual o melhor método a ser usado para classificação de notícias usando inteligência artificial, frameworks, bibliotecas e linguagens empregadas. Através de uma revisão bibliográfica, foi realizada uma pesquisa de trabalhos no Google Acadêmico sobre o uso de deep learning para classificação do notícias falsas, sendo selecionados 5 trabalhos. Após a leitura investigativa, catalogação em uma ficha com os resumos e principais dados, a seleção foi refinada com 3 trabalhos com resultados mais significativos no que diz respeito ao conjunto dados utilizado, técnicas usadas e acurácia. Foi verificado dentre os trabalhos que de acordo com acurácia, em geral, o melhor resultado foi obtido no trabalho 1, usando a técnica de Word Embedding Glove - Global Vectors for Word Representation e CNN - Redes Neurais Convolucionais, alcançando, assim, 97,5% de acurácia. O conjunto de dados utilizado possui 28712 notícias fakes e reais, sendo 13000 artigos de notícias fake e 15712 de notícias verdadeiras, sendo 90% da base para o treino, 5% validação e 5% da base de dados para o teste. A linguagem de programação utilizada no referido trabalho foi o Python, versão 3.7.1. Para o pré-processamento, os framerworks Gensim, versão 3.7.3 ,e Natural Language Toolkit, versão 3.4.1. Na modelagem do problema os framerworks de aprendizado de máquina Tensorflow versão 1.13.1 juntamente com o Keras, versão 2.2.4, e o scikit-learn, versão 0.21.1, bem como os framerworks para visualizar a matriz de confusão Scikit-plot, versão 0.3.7, juntamente com o matplotlib, versão 3.1.0. Finalmente, para leitura do conjunto de dados foi utilizado o framerwork pandas, versão 0.24.2. Após a pesquisa e análise dos dados coletados, fica sugerido que para classificação de textos tipificados como notícias falsas e verdadeiras, a técnica mais eficiente de Word Embedding é o Glove combinado com uso de Redes Neurais Convolucionais. Porém, não se descarta as demais técnicas usadas e pesquisadas, como o TF-IDF-Term Frequency-Inverse Document Frequency, usada nos trabalhos 2 e 3, LSVC-Linear Support Vector Classifier no trabalho 2 e RNN-Recurrent Neural Network com LSTM-Long Short-Term Memory empregado no trabalho 3 que apresentaram no mínimo 92% de acurácia.

Downloads

Não há dados estatísticos.
Publicado
2020-11-20
Como Citar
LIMA, P.; MARCELO HOFF DO AMARAL, E.; DIAS CAMARGO, A. ALGORITMOS DE INTELIGÊNCIA ARTIFICIAL PARA CLASSIFICAÇÃO DE NOTÍCIAS FALSAS. Anais do Salão Internacional de Ensino, Pesquisa e Extensão, v. 12, n. 2, 20 nov. 2020.