Universidad de Los Andes Instituto de Investigaciones Económicas y Sociales

BANN02.GIF (1472 bytes)

Un dispositivo gráfico Biplot para modelar relaciones
entre dos conjuntos de variables

A Biplot graphical tool to model the relationships
between two sets of variables

Maura Vásquez
Postgrado en Estadística
Universidad Central de Venezuela (UCV)
E-mail: mauravasquez@cantv.net

Guillermo Ramírez
Postgrado en Estadística
Universidad Central de Venezuela (UCV)
E-mail: guiram@cantv.net

Alberto Camardiel
Postgrado en Estadística
Universidad Central de Venezuela (UCV)
E-mail: acamar@reacciun.ve

Tomás Aluja
Universidad Politécnica de Cataluña
España
E-mail: tomas.aluja@upc.edu

RESUMEN

En la regresión multivariante se analizan relaciones entre un conjunto de indicadores de un determinado fenómeno (variables y’s) y otro de variables explicativas (variables x’s). Previo a la modelación resulta útil contar con información clave sobre las relaciones entre ambos. En este sentido, se presenta un gráfico desarrollado por Ter Braak (1990) y por Ramírez et al. (2005) en forma independiente. Se proponen indicadores de la calidad de las aproximaciones: a) variables y’s bien explicadas por las x’s, b) agrupaciones de variables y’s cuyas estimaciones presentan fuertes correlaciones y c) subconjuntos de variables explicativas que presentan mayor correlación con una variable y particular. El gráfico presentado es un GH-Biplot generalizado (Gabriel, 1971) que utiliza variables latentes generadas por un análisis de correlación canónico. Se evalúan sus alcances en una aplicación en la que se explica el comportamiento de los indicadores que conforman el Índice de Desarrollo Humano en términos de otras variables del entorno social y económico a nivel estadal en Venezuela.
Palabras clave: Biplot, análisis canónico, regresión multivariante, desarrollo humano.

ABSTRACT

Multivariate multiple regression analysis is used to model the relationships between two sets of variables, the y-set of response variables and the x-set of explaining variables. In trying to have useful information about the nature of the relationships between the two sets, Ter Braak (1990) proposed a graphical display taken up again by Ramírez et al. (2005) in an independent way. In this paper, indexes of the quality approach are considered: a) those y variables better explained by x variables, b) clusters of y variables whose predictions are strongly correlated and c) subsets of x variables more correlated with a specific y variable. The graphical device considered is a generalized GH-Biplot (Gabriel, 1971) using latent variables generated by a canonical correlation analysis. The graphical display was used to analyze the Human Development Index corresponding to the 23 states of Venezuela related to several social and economic indicators.
Key words: Biplot, canonical analysis, multivariate regression, human development.

banim05.gif (4535 bytes)

acroread.gif (331 bytes) Trabajo Completo