Modelos de predicción de prevalencia de enfermedades para centros de salud basado en meneria de datos
Resumen
La epidemiología es el estudio de "enfermedades que afectan transitoriamente a
muchas personas en un sitio determinado". Se considera vigilancia epidemiológica al
seguimiento de la ocurrencia de las enfermedades en las poblaciones. El Ministerio de
Salud y Deportes de la República de Bolivia ha seleccionado un grupo de
enfermedades que están sujetas a notificación obligatoria. Esta selección se ha
realizado en base a las normas internacionales, que permiten priorizar las
enfermedades en base a diferentes criterios, uno de ellos es la magnitud, es decir si la
enfermedad tiene alta incidencia o prevalencia. La prevalencia es la frecuencia
estadística (absoluta o relativa) con la que se presenta un determinado fenómeno en
una población, entendido este término en su sentido estadístico es un real entre 0 y 1
denotando la ausencia o presencia de una enfermedad.
El presente trabajo de tesis tiene como fin desarrollar un modelo de predicción de
este valor de prevalencia para una enfermedad determinada en un establecimiento
de salud en un tiempo determinado. Para ello es importante identificar variables o
atributos que sean importantes para la predicción de este valor. Gracias a la teoría
de conjuntos aproximados es posible este hecho, pues básicamente la aplicación de
dicha teoría es la identificación de atributos relevantes de un conjunto de ellos
conocidos como “reducto”. Ubicados dichos atributos es posible generar datos de
entrenamiento y datos de prueba para una red neuronal artificial con el fin de
desarrollar un modelo de predicción. Este hecho se realizó en los capítulos 3 y 4 del
presente trabajo.
Para la realización de pruebas se desarrolló un prototipo software con principios de
la ingeniería de software. Las pruebas se realizaron con datos de las 10
enfermedades con mayor índice de prevalencia en centros de salud de Bolivia,
información otorgada por la ONG Medicus Mundi. Obteniendo primeramente los
atributos relevantes y posteriormente una red neuronal que como datos de entrada
recibe valores de los atributos relevantes que forman un reducto y como dato de
salida obtiene la prevalencia. Los datos esperados y los datos predecidos por el
modelo para dichas enfermedades no mostraron importante diferencia a un nivel de
95% de confianza para la prueba de hipótesis que se realizó.