# Resumo

Previsão e análise do abandono de alunos do ensino superior por meio da mineração de dados educacionais (tradução livre)

O paper apresenta um modelo para a predição de evasão escolar utilizando algoritmos de florestas de decisão e Naive-bayes na linguagem R, procurando também as razões que levam à evasão.

# Trabalho proposto

Os dados foram coletados através de aplicações de questionários, onde houve a seguinte distribuição de perguntas por tema:

Fonte: Paper

Para o passo de extração de atributos foram utlizadas técnicas como como identificação de fatores, elaboração de questionário de pesquisa, coleta de fatos dos registros acadêmicos, redução de dimensionalidade, dentre outros.

O modelo proposto foi feito a partir de uma estrutura pré-definida, conforme a imagem abaixo: Fonte: Paper

Os algoritmos utilizados foram Naive-Bayes e Decision Tree (dito como um dos algoritmos mais bem sucedidos para classificações), e dois questionários foram criados e aplicados: um pré questionário (para os alunos que acabaram de entrar na escola) e um pós questionário (para alunos que continuaram na escola). A ideia da aplicação de 2 questionários em momentos diferentes é distinguir o ponto de vista de um aluno que acabou de entrar do ponto de vista de um aluno que continuou no curso. Após a aplicação dos questionários utilizando o google forms, a redução de dimensionalidade tem um peso importante para reduzir o tamanho dos atributos que serão armazenados no banco.

Também são aplicadas técnicas de pré-processamento dos dados com o intuito de verificar dependências entre os atributos. Quatro técnicas principais foram utilizadas:

  • Limpeza dos dados
  • Transformação dos dados
  • Integração dos dados
  • Redução dos dados

Na sequência há a aplicação dos algoritmos utilizando a linguagem de programação R, devido sua velocidade, onde os seguintes resultados foram obtidos:

Fonte: Paper

Onde 36 instâncias foram classificadas corretamente e 14 não (72% de acerto).

# Conclusão

O paper conclui que caso o alunos tenha mais do que 4 falhas em matérias, mais de 3 faltas, se sofre de algum tipo de problema de saúde e não se adaptou ao ambiente ele irá evadir.

# Refêrencias

Vinayak Hegde, Prageeth P P - Higher education student dropout prediction and analysis through educational data mining (opens new window) - Department of Computer Science Amrita School of Arts and Sciences, Amrita Vishwa Vidyapeetham, Mysuru Campus Mysuru, India