Revista Colombiana de Estadística

Extreme Value Theory Applied to r Largest Order Statistics Under the Bayesian Approach

Abstract Extreme value theory (EVT) is an important tool for predicting efficient gains and losses in economic and environmental domains. Moreover, EVT was initially developed for use with normal and gamma parametric distribution patterns. However, economic and environmental data present a heavy-tailed distribution in most cases, which is in contrast with the above patterns. Thus, the framing of extreme events using EVT presented great difficulties. Furthermore, it is nearly impossible to use conventional models to make predictions about non-observed events that exceeded the maximum number of observations. In some situations, EVT is used to analyze only the maximum values of a given dataset, which provides few observations. In such cases, it is more effective to use the r largest order statistics. This study proposes Bayesian estimators for the parameters of the r largest order statistics. We use a Monte Carlo simulation to analyze the experimental data and observe certain estimator properties, such as mean, confiance interval, credibility interval, bias, and root mean square error (RMSE); estimation provided inferences for these parameters and return levels. In addition, this study proposes a procedure for selecting the r-optimal of the r largest order statistics based on the Bayesian approach and applying the Markov chains Monte Carlo (MCMC) method. Simulation results reveal that the Bayesian approach produced performance similar to that of the maximum likelihood estimation. Finally, the applications developed using the Bayesian approach showed a gain in accuracy compared with other estimators.

Resumen La teoría de valores extremos (EVT) es una herramienta importante para predecir ganancias y pérdidas eficientes en ambientes económicos y ambientales. Además, la EVT se desarrolló inicialmente para uso con patrones de distribución paramétricos normales y gamma. Sin embargo, los datos económicos y ambientales presentan una distribución de cola pesada en la mayoría de los casos, lo que contrasta con los patrones anteriores. Así, la formulación de eventos extremos con EVT presenta grandes dificultades. Además, es casi imposible usar modelos convencionales para obtener predicciones sobre eventos no observados que excedieron el número máximo de observaciones. En algunas situaciones, EVT es utilizado para analizar solamente los valores máximos de un conjunto de datos dado, que proporcionan poca información. En tales casos, es más eficiente usar las r estadísticas de orden superior. Este trabajo propone estimadores bayesianos para los parámetros de las r estadísticas de orden superior. Utilizamos simulaciones de Monte Carlo para analizar los datos experimentales y observar ciertas propiedades del estimador como: media, intervalos de confianza y credibilidad, sesgo y error cuadrático medio (RMSE). Este tipo de estimación proporciona inferencias para estos parámetros y niveles de retorno. También, proponemos un procedimiento para seleccionar el r-óptimo de la distribución de las r estadísticas de orden superior basadas en el en foque bayesiano y aplicando el método de Monte Carlo para cadenas de Markov (MCMC). Los resultados de la simulación muestran que el enfoque bayesiano produce un rendimiento similar al de la estimación de máxima verosemelianza. Finalmente, las aplicaciones desarrolladas utilizando el enfoque bayesiano mostraron una ganancia en la precisión en comparación con otros estimadores.

A New Extended Mixture Skew Normal Distribution, With Applications

Abstract One of the most important property of the mixture normal distributions model is its flexibility to accommodate various types of distribution functions (df’s). We show that the mixture of the skew normal distribution and its reverse, after adding a location parameter to the skew normal distribution, and adding the same location parameter with different sign to its reverse is a family of df’s that contains all the possible types of df’s. Besides, it has a very remarkable wide range of the indices of skewness and kurtosis. Computational techniques using EM-type algorithms are employed for iteratively computing maximum likelihood estimates of the model parameters. Moreover, an application with a body mass index real data set is presented.

Resumen Una de las propiedades más importantes de la mezcla del modelo de distribuciones normales es su flexibilidad para acomodar varios tipos de funciones de distribución (fd). Mostramos que la mixtura de la distribución normal sesgada y su inversa, después de agregar un parámetro de ubicación a la distribución normal sesgada, y agregar el mismo parámetro de ubicación con un signo diferente a su inversa, es una familia de fd que contiene todos los tipos posibles de fd. Además, posee una muy amplia gama de índices de asimetría y curtosis. Las técnicas computacionales que se utilizan para calcular de forma iterativa las estimaciones de máxima verosimilitud de los parámetros del modelo es el algoritmo de esperanza-maximización (EM). mas, se presenta una aplicación con un conjunto de datos reales de índice de masa corporal.

Simultaneously Testing for Location and Scale Parameters of Two Multivariate Distributions

Abstract In this article, we propose nonparametric tests for simultaneously testing equality of location and scale parameters of two multivariate distributions by using nonparametric combination theory. our approach is to combine the data depth based location and scale tests using combining function to construct a new data depth based test for testing both location and scale parameters. Based on this approach, we have proposed several tests. Fisher’s permutation principle is used to obtain p-values of the proposed tests. Performance of proposed tests have been evaluated in terms of empirical power for symmetric and skewed multivariate distributions and compared to the existing test based on data depth. The proposed tests are also applied to a real-life data set for illustrative purpose.

Resumen En este artículo, proponemos pruebas no paramétricas para probar simultáneamente la igualdad de ubicación y los parámetros de escala de dos distribuciones multivariantes mediante la teoría de combinaciones no paramétricas. Nuestro enfoque es combinar las pruebas de escala y ubicación basadas en la profundidad de los datos utilizando la función de combinación para construir una nueva prueba basada en la profundidad de los datos para probar los parámetros de ubicación y escala. Con base en este enfoque, hemos propuesto varias pruebas. El principio de permutación de Fisher se usa para obtener valores p de las pruebas propuestas. El rendimiento de las pruebas propuestas se ha evaluado en términos de potencia empírica para distribuciones multivariadas simétricas y asimétricas y se comparó con la prueba existente basada en la profundidad de los datos. Las pruebas propuestas también se aplican a un conjunto de datos de la vida real con fines ilustrativos.

A Randomized Two Stage Adaptively Censored Design With Application to Testing

Abstract A two stage randomized design is developed for two treatment clinical trials in which response variables are exponential and the observations are censored by using failure censoring and time censoring in the first and second stages respectively. The censoring time for the second stage is determined from the outcomes of the first stage. An application to testing for the equality of treatment effects is given along with a comparative study with relevant properties.

Resumen Se desarrolla un diseño aleatorizado en dos etapas para dos ensayos clínicos de tratamiento en los que las variables de respuesta son exponenciales y las observaciones se censuran utilizando la censura por fallo y la censura temporal en la primera y segunda etapas, respectivamente. El tiempo de censura para la segunda etapa se determina a partir de los resultados de la primera etapa. Una aplicación para probar la igualdad de efectos del tratamiento se da junto con un estudio comparativo con propiedades relevantes.

Bayesian Inference for the Segmented Weibull Distribution

Abstract In this paper, we introduce a Bayesian approach for segmented Weibull distributions which could be a good alternative to analyze medical survival data in the presence of censored observations and covariates. With the obtained Bayesian estimated change-points we could get an excellent fit of the proposed model to any data sets. With the proposed methodology, it is also possible to identify survival times intervals where a covariate could have significantly different effects when compared to other lifetime intervals, an important point under a clinical view. The obtained Bayesian estimates are obtained using standard Markov Chain Monte Carlo methods. Some examples with real data sets illustrate the proposed methodology and its potential clinical value.

Resumen En este artículo introducimos un nuevo modelo Bayesiano para distribuciones Weibull segmentadas, que puede ser una buena alternativa en el análisis de datos aplicados a la investigación en salud, con la presencia de censuras y covariables. Con este método basado en la estimación de puntos de cambio, hemos obtenido un excelente ajuste a los datos utilizados como ejemplos. De acuerdo con el modelo propuesto, fue posible identificar rangos de valores en las series temporales en que una variable independiente podría tener diferentes efectos. Este es un resultado importante desde el punto de vista clínico. Los estimados bayesianos fueron obtenidos usando métodos de Monte Carlo en Cadenas de Markov. Ejemplos basados en conjuntos de datos reales fueran usados para ilustrar el uso de los modelos propuestos y sus potenciales aplicaciones en investigaciones clínicas.