Revista Colombiana de Estadística

Analysis of the AFM and STATIS Representation Spaces in the Bogota's 1993 Biographical Mobility Survey

A partir de los resultados descriptivos factoriales obtenidos mediante la aplicación del STATIS (Structuration de Tableaux A Trois Indices de la Statistique) a la componente sociodemográfica del estudio Movilidad Biográfica en el Área Metropolitana de Bogotá en 1993 (MBAMB-93), se verificó la similaridad de este espacio de representación con el obtenido mediante el Análisis Factorial Múltiple (AFM). Las tablas iniciales están conformadas por un colectivo de variables de tipo cualitativo, transformadas en términos de perfiles ponderados multiplicados por 100, posibilitando el uso del STATIS creado para variables cuantitativas. Cada tabla está definida por cortes quinquenales que contienen igual número de individuos, y se yuxtaponen para el análisis del AFM. La similitud en los resultados de los métodos fue más evidente en la fase de intraestructura en el análisis de las trayectorias, mientras que en la fase de interestructura para los primeros quinquenios se aprecian algunas diferencias en la representación factorial, a pesar de que las estructuras en los grupos, medidas a través del coeficiente RV, son idénticas.

Through the factorial descriptive results obtained from the application of STATIS (Structuration de Tableaux A Trois Indices de la Statistique) to the sociodemographic component of the work "Biographical Mobility in Bogotas Metropolitan Area in 1993" (MBAMB-93), we verified the equivalence of this space representation to the one obtained by MFA (Multiple Factorial Analysis). The starting matrix consists of a set of qualitative variables which are transformed in terms of weighted profiles multiplied by 100, making possible the use of STATIS, which was originally created for working with quantitative variables. Each table or group contains the same number of individuals and it is defined by quinquennial cuts. The tables are juxtaposed by MFA analysis. The methods similarities became more evident in the intrastructure analysis of the trajectories. While with the interstructure phase we observed some differences on the factorial representation, especially during the first quinquennia. However, structures within groups are identical according the RV coefficient.

Optimality Criteria for Models with Random Effects

In the context of linear models, an optimality criterion is developed for models that include random effects. Traditional information-based criteria are premised on all model effects being regarded as fixed. When treatments and/or nuisance parameters are assumed to be random effects, an appropriate optimality criterion can be developed under the same conditions. This paper introduces such a criterion, and this criterion also allows for the inclusion of fixed and/or random nuisance parameters in the model and for the presence of a general covariance structure. Also, a general formula is presented for which all previously published optimality criteria are special cases.

En el contexto de modelos lineales, los criterios de optimalidad se cons- truyen para los modelos que incluyen efectos aleatorios. Tradicionalmente los criterios basados en la información asumen que todos los efectos en el modelo se consideran fijos. Cuando los parámetros, tratamientos o molestias son considerados efectos aleatorios, un criterio adecuado de optimalidad se puede desarrollar en las mismas condiciones. En este trabajo se introduce ese criterio, que permite la inclusión en el modelo de parámetros que representan molestias fijas o al azar, además de una estructura general de covarianza. También, se presenta una fórmula general para la cual en todos los casos publicados anteriormente, los criterios de optimalidad son casos especiales.

Modelling Random Couples Using Copulas

Las cópulas se han convertido en una herramienta útil para el modelado multivariado tanto estocástico como estadístico. En este artículo se revisan propiedades fundamentales de las cópulas que permitan caracterizar la estructura de dependencia de familias de distribución bivariadas definidas por la cópula. También se describen algunas clases de cópulas, enfatizando en la importancia de la cópula Gaussiana y la familia Arquimediana. Se resalta la utilidad de las cópulas para el modelado de parejas de variables aleatorias continuas y el de las discretas. La aplicación de la cópula se ilustra con la construcción de modelos de regresión de Markov de primer orden para respuestas no Gaussianas.

Copulas have become a useful tool for the multivariate modelling in both stochastics and statistics. In this article, fundamental properties that allow the characterization of the dependence structure of families of the bivariate distributions defined by the copula are reviewed. Also, the importance of both the Gaussian copula and the Archimedean family is emphasized while some classes of copulas are described. The usefulness for modelling either discrete or continuous random couples is highlighted. The construction of first-order Markov regression models for non-Gaussian responses illustrates the application of the copula.

Study of Homogeneity of the Dispersion in one way Classification Models with Proportions and Counts Data

En el modelamiento de datos donde se evidencia la presencia de sobredispersión, usualmente se asume que para todos los efectos de tratamiento el parámetro de sobredispersión es común. Esta situación no siempre se satisface antes; por el contrario, puede ser más frecuente que la variabilidad exhibida por los datos sea mayor que la variación teórica del modelo; debiendo incorporarse en el modelamiento esta situación. En este artículo se llevan a cabo desarrollos teóricos con los cuales se evidencia si es aceptable o no la hipótesis de homogeneidad del parámetro de dispersión entre tratamientos, cuando estos se ensayan en condiciones de uniformidad del material experimental y la respuesta de interés sea conteos o de proporciones, las cuales se modelan a través de la distribución Binomial Negativa (BN) y Beta Binomial (BB), respectivamente. Se usó la Prueba de Razón de Verosimilitud como criterio para decidir acerca de la hipótesis nula de homogeneidad en el parámetro de dispersión. Para determinar la eficiencia de la prueba propuesta, mediante simulación, con procedimientos algorítmicos desarrollados en R, se evaluó la potencia de las pruebas frente al supuesto de homogeneidad del parámetro de dispersión. Bajo el supuesto que los modelos BB y BN son correctos, se propone el ajuste de un modelo lineal generalizado ponderado como una alternativa para el análisis de datos de conteo y proporción con sobredispersión.

When analyzing data in the presence of over dispersion, the usual practice is to assume a common dispersion parameter to all observations. However, there are situations where the assumption of homogeneity of the dispersion parameter does not hold. In this paper we present theoretical developments that allow contrasting the assumption of homogeneity of the dispersion parameter between treatments, in a completely randomized design, with the responses of proportions and counts, modeled through the distributions beta-binomial and negative binomial respectively. The hypothesis is contrasted through the proof of the likelihood ratio. Under the assumption that the beta-binomial and the negative binomial models are correct, it is proposed an adjustment of a generalized linear weight ed model as an alternative for the data analysis of counts and proportions when over dispersion is present. It is also evaluated, through simulation, the performance of the proposed proofs in terms of its power.

Estimation Stage in Survey Sampling: A Multiparameter Approach

Most of the real applications in survey sampling involve not one, but several characteristics of study. In this paper, a unified framework of joint estimation of the parameters of interest is presented under various sampling designs. The applications of the results of this research entails a significant gain in computational efficiency.

La mayoría de las aplicaciones en encuestas por muestreo involucran múltiples variables de estudio. En este artículo se presenta un marco de referencia para la estimación conjunta de los parámetros de interés en algunos diseños de muestreo. La aplicación de los resultados encontrados garantizan una ganancia significativa en la eficiencia computacional.

Reduction of Models in the Presence of Nuisance Parameters

En muchos problemas de inferencia estadística existe interés en estimar solamente algunos elementos del vector de parámetros que definen el modelo adoptado. Generalmente, esos elementos están asociados a las medidas de localización, y los parámetros adicionales -que en la mayoría de las veces están en el modelo solo para controlar la dispersión o la asimetría- son conocidos como parámetros de perturbación o de incomodidad ({\it nuisance parameters}) de las distribuciones subyacentes. Es común estimar todos los parámetros del modelo y hacer inferencias exclusivamente para los parámetros de interés. Dependiendo del modelo adoptado, este procedimiento puede ser muy costoso, tanto algebraica como computacionalmente, por lo cual conviene reducirlo para que dependa únicamente de los parámetros de interés. En este artículo, hacemos una revisión de los métodos de estimación en la presencia de parámetros de perturbación y consideramos algunas aplicaciones en modelos recientemente discutidos en la literatura.

In many statistical inference problems, there is interest in estimation of only some elements of the parameter vector that defines the adopted model. In general, such elements are associated to measures of location and the additional terms, known as nuisance parameters, to control the dispersion and asymmetry of the underlying distributions. To estimate all the parameters of the model and to draw inferences only on the parameters of interest. Depending on the adopted model, this procedure can be both algebraically is common and computationally very costly and thus it is convenient to reduce it, so that it depends only on the parameters of interest. This article reviews estimation methods in the presence of nuisance parameters and consider some applications in models recently discussed in the literature.

Estimation of the Population Total using the Generalized Difference Estimator and Wilcoxon Ranks

This paper presents a new regression estimator for the total of a population created by means of the minimization of a measure of dispersion and the use of the Wilcoxon scores. The use of a particular nonparametric model is considered in order to obtain a model-assisted estimator by means of the generalized difference estimator. First, an estimator of the vector of the regression coefficients for the finite population is presented and then, using the generalized difference principles, an estimator for the total a population is proposed. The study of the accuracy and efficiency measures, such as design bias and mean square error of the estimators, is carried out through simulation experiments.

Este artículo presenta un nuevo estimador de regresión para el total poblacional de una característica de interés, creado por la minimización de una medida de dispersión y el uso de los puntajes de Wilcoxon. Se considera el uso de un modelo no paramétrico con el fin de obtener un estimador asistido por modelos, que surge del estimador de diferencia gene ralizada. En primer lugar, se presenta un nuevo estimador del vector de coeficientes de regresión y luego, haciendo uso de los principios del estimador de diferencia generalizada, se propone un estimador para el total poblacional. El estudio de las medidas de precisión y eficiencias, como el sesgo y el error cuadrático medio, se lleva a cabo mediante experimentos de simulación.

A reparametrization of Triangular Distribution based on the Skew-Symmetric Distributions

En este trabajo se considera un nuevo enfoque para el estudio de la distribución triangular usando el desarrollo teórico detrás de las distribuciones Skew. La distribución triangular aquí entregada se obtiene por reparametrización de la distribución triangular usual. Se estudian las principales propiedades probabilísticas, incluidos los momentos, coeficientes de asimetría y kurtosis; además, se muestra una representación estocástica para el modelo estudiado, que proporciona un método sencillo y eficiente para la generación de variables aleatorias. Así mismo, se implementa la estimación por el método de los momentos y, a través de un estudio de simulación, se ilustra el comportamiento de las estimaciones de los parámetros.

In this paper a new approach is considered for studying the triangular distribution using the theoretical development behind Skew distributions. Triangular distribution are obtained by a reparametrization of usual triangular distribution. Main probabilistic properties of the distribution are studied, including moments, asymmetry and kurtosis coefficients, and an stochastic representation, which provides a simple and efficient method for generating random variables. Moments estimation is also implemented. Finally, a simulation study is conducted to illustrate the behavior of the estimation approach proposed.