ESTUDO DA EVASÃO DE DISCENTES DO CURSO DE GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UTILIZANDO EDUCATIONAL DATA MINING (EDM)

  • Karina Fernandes
  • Alessandro Bof De Oliveira
Rótulo Educational, Data, Mining, (EDM), Aprendizado, Supervisionado, Evasão

Resumo

Este estudo analisou a evasão de discentes do curso de graduação de Ciência da Computação da Universidade Federal do Pampa (Unipampa), utilizando métodos de Educational Data Mining (EDM). Para a realização desse estudo foi utilizada a linguagem de programação Python e R, a biblioteca Scikit learn, e Pandas dentro do processo Sample Explore Modify Model and Assess (SEMMA) e Knowledge Discovery in Databases (KDD). Os dados foram utilizados de maneira anônima, respeitando a privacidade dos discentes. A pesquisa atuou sob dois aspectos: A análise do perfil socioeconômico dos ingressantes através dos dados do Sistema de Seleção Unificada (SiSU)/Exame Nacional do Ensino Médio (ENEM), referente aos anos de 2010 a 2018 e a análise dos discentes matriculados no primeiro ano nos componentes curriculares referentes aos dois primeiros semestres no eixo temporal de 2009 a 2018. As análises do perfil ingressante e discente foram feitas de maneira separada não tendo o cruzamento de informações. A análise socioeconômica se centrou na análise por agrupamento e estatística, enquanto a análise do perfil discente utilizou dois algoritmos de Machine Learning com aprendizado supervisionado (ou seja, os dados já eram rotulados nas classes que os discentes se encontrariam, como, por exemplo: Aluno Regular, Abandono, etc). Os algoritmos utilizados para a concepção de um modelo preditivo foram o K Nearest Neighbors (KNN) e Rede Neural Artificial Perceptron Multicamadas com retro propagação, respectivamente. Na análise socioeconômica foi apurado que mesmo que a evasão tenha um alto índice, existem grupos de maior risco que possuem necessidades especiais para o aprendizado, com ações afirmativas do núcleo (Área básica do ingressante ABI, denominada A1). Durante o período analisado, todos que ingressaram como A1 abandonaram o curso e cerca de 89% dos que ingressaram com V419 (Levando-se em conta cancelamento e transferência Interna). As notas nas competências por área da avaliação ENEM/SiSU, não demonstrou ter impacto dado à análise estatística da correlação linear das notas com a permanência desse discente. Na análise do perfil discente, os métodos supervisionados treinados obterão uma acurácia de 98,65% e 97,89%, indicando que existe um padrão que pode ser mapeado utilizando os modelos preditivos desse trabalho. A matriz de confusão demonstrou que a classe com maior quantidade de registros é a 2, ou seja, cada vez que entrar um novo registro, ele será classificado a priori como pertencente à 2 abandono. A técnica Zero Rules, ou Zero Regras, demonstrou que o acerto mínimo do algoritmo foi de 43,87%, superior à probabilidade de alguém selecionar a classe correta, sendo de 14,28%. Há também indícios de similaridade dos algoritmos com a análise estatística de Friedman com Nemenyi. Com a mineração dos dados e o modelo preditivo bem sedimentado, é possível atuar em pontos focais evitando casos de evasão, ou seja, em grupos de risco analisados no estudo.

Downloads

Não há dados estatísticos.
Publicado
2020-11-20
Como Citar
FERNANDES, K.; BOF DE OLIVEIRA, A. ESTUDO DA EVASÃO DE DISCENTES DO CURSO DE GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UTILIZANDO EDUCATIONAL DATA MINING (EDM). Anais do Salão Internacional de Ensino, Pesquisa e Extensão, v. 12, n. 2, 20 nov. 2020.