Reconocimiento automático de dígitos manuscritos en base a prototipos multivaluados
Resumen
El Reconocimiento óptico de Caracteres (OCR), es un área de investigación importante en reconocimiento de patrones. El objetivo de un sistema OCR, es reconocer letras del alfabeto, números y otros caracteres, que están en forma de imágenes digitales
sin ninguna intervención humana [Reiss, 1993].
El problema de clasificación de caracteres manuscritos ha sido abordado desde multitud
de enfoques, por lo que aun no se ha logrado clasificar de manera exitosa los
dígitos manuscritos, por lo que sigue siendo un desafío en informática [Wisneski, 2007].
Para el objetivo de la tesis, se prueban diferentes métodos de captura de imagen
digital del formulario de encuesta, métodos de preprocesamiento, segmentación de dígitos
y realizar la clasificación de los dígitos en base a prototipos multivaluados. Los
prototipos multivaluados se compone de un conjunto de muestras caracterizadas por
una amplia variedad de estilos de escritura.
En los experimentos se consiguen resultados globales del modelo construido, a partir
de la información contenida en las encuestas capturada por una cámara digital común.
Utilizando fundamentos matemáticos la Topología, como los espacios topológicos, distancia
de Hausdorff, etc. y las etapas del procesamiento digital de imágenes.
Finalmente, se sugiere investigaciones que permitan comprender y fortalecer el preprocesamiento,
segmentación y la clasificación, mediante el método de prototipos multivaluados
con la distancia de Hausdorff, que determina la similitud de objetos midiendo
la distancia de objetos en el espacio de prototipos multivaluados, así obtener una clasificación en el reconocimiento de dígitos manuscritos.