Mineria de datos en el sistema de información educativa
Abstract
En el presente proyecto se describe la aplicación de Minería de datos sobre los datos de Educación Formal del Sistema de Información Educativa (SIE) del Ministerio de Educación y Culturas para descubrir patrones de comportamiento acerca del sector educativo, para tal efecto se lleva a cabo el proceso de descubrimiento de conocimiento en bases de datos (de las palabras en inglés Knowledge Discovery in Databases - KDD).
Las etapas del proceso incluyen la selección, el preprocesamiento, la transformación, la minería de datos y la interpretación de resultados. En la fase de selección se extraen los atributos de las tablas más relevantes relacionados con la matriculación del SIE para unificar en una sola tabla denominada data set, en la etapa de preprocesamiento se utilizan métodos estadísticos y descriptivos para conocer mejor los datos seleccionados y en la etapa
de transformación se modifica la forma de los datos.
En la etapa de minería de datos se utiliza la herramienta Weka para aplicar Clustering con el objeto de agrupar los datos para detectar similitudes entre las unidades educativas y también se aplican Árboles de Decisión para tratar de conocer los atributos relevantes en el clustering.
Se desarrolla una herramienta de minería de datos que incluye la visualización de datos de forma multidimensional que constituye una herramienta visual de análisis exploratorio y el algoritmo k-means de Clustering.