Stratified/PCA: Un método de procesamiento de datos variables para
la construcción de
modelos de redes neuronales
Stratified/Pca: A data and variable processing method for the
construction of neural network models
Gerardo A. Colmenares L.
Universidad de Los Andes
Instituto de Investigaciones Económicas y Sociales
E-mail:
RESUMEN
Este artículo describe un método para reducir observaciones y variables contenidas en
grandes archivos de datos a nuevos conjuntos de datos cuyo tamaño es mucho más
reducido. Estos nuevos conjuntos son confiables para mejorar tanto en calidad como en
tiempo, la construcción de los modelos de redes neuronales. El método, Stratified/PCA
utiliza la técnica de muestreo estratificado y análisis de componentes principales para
reducir eficientemente la cantidad original de datos y variables, manteniendo a su vez, la
mayor cantidad de información presente en los datos originales. El desempeño de las redes
neuronales construidas con estos conjuntos reducidos de datos ha sido bastante similar al
obtenido con el conjunto original de los datos. Por otro lado, la técnica de estratificación
usada en Stratified/PCA mostró ser más consistente en la selección de los datos que la
técnica aleatoria (convencionalmente más utilizada). Se realizaron comparaciones de
reducción de datos usando solamente estratificación y el método Stratified/PCA. |