Universidad de Los Andes Instituto de Investigaciones Económicas y Sociales

BANN02.GIF (1472 bytes)

Stratified/PCA: Un método de procesamiento de datos variables para
la construcción de modelos de redes neuronales

Stratified/Pca: A data and variable processing method for the
construction of neural network models

Gerardo A. Colmenares L.
Universidad de Los Andes
Instituto de Investigaciones Económicas y Sociales
E-mail:

RESUMEN

Este artículo describe un método para reducir observaciones y variables contenidas en grandes archivos de datos a nuevos conjuntos de datos cuyo tamaño es mucho más reducido. Estos nuevos conjuntos son confiables para mejorar tanto en calidad como en tiempo, la construcción de los modelos de redes neuronales. El método, Stratified/PCA utiliza la técnica de muestreo estratificado y análisis de componentes principales para reducir eficientemente la cantidad original de datos y variables, manteniendo a su vez, la mayor cantidad de información presente en los datos originales. El desempeño de las redes neuronales construidas con estos conjuntos reducidos de datos ha sido bastante similar al obtenido con el conjunto original de los datos. Por otro lado, la técnica de estratificación usada en Stratified/PCA mostró ser más consistente en la selección de los datos que la técnica aleatoria (convencionalmente más utilizada). Se realizaron comparaciones de reducción de datos usando solamente estratificación y el método Stratified/PCA.
Palabras clave: Modelos de redes neuronales, estratificación, análisis de componentes principales, reducción de datos, reducción de variables, preprocesamiento de datos.

banim05.gif (4535 bytes)

acroread.gif (331 bytes) Trabajo Completo