Método multivariado aplicado al análisis de textos de periódicos
Abstract
La producción de información textual en la red exige aplicar nuevas formas para resumir los grandes volúmenes de información que se generan diariamente. Este trabajo presenta métodos multivariados de conglomerados y de correspondencias aplicados a textos de titulares de periódicos, exponiendo un criterio formal sofisticado para el análisis estadístico de datos textuales y métodos de análisis gráfico. Asimismo, expone el procedimiento de recopilación automática de textos de titulares de periódicos El Diario, Prensa y La Razón desde julio del 2019 a julio del 2020 para constitutir una base de datos estruturada considerando tres categorías temáticas: salud, política y economía; y dos periodos temporales: Antes de la cuarentena (AC) a partir de julio del 2019 al 15 de marzo del 2020 y después de la cuarentena (DC) del 16 de marzo a julio del 2020. Determinando así el plano de máxima inercia en el cual se llega a gráficar los textos y las palabras para complementar su análisis correspondiente.