INTRODUCCIÓN
El sector agropecuario es de gran importancia para el crecimiento económico de los países, por ser fuente de alimentos y materias primas, y generar empleo y divisas (Cárdenas & Vallejo, 2016). En Colombia, los ingresos derivados de las actividades agropecuarias representan más del 6 % del producto interno bruto (PIB) (Departamento Administrativo Nacional de Estadística [DANE], 2017); no obstante, su crecimiento es inferior al nacional e históricamente ha caído desde un 9 %, lo cual refleja una reducción en el precio relativo de la producción agropecuaria medida a través de los deflactores del PIB (Departamento Nacional de Planeación [DNP], 2015). Además, si bien el sector mantiene una balanza comercial positiva, esta no es estática, ya que las importaciones han venido aumentando a un ritmo más acelerado que las exportaciones (Gómez, 2011), lo cual afecta el crecimiento del valor agregado de los subsectores que lo componen, es decir, como consecuencia de la relación entre importaciones-exportaciones en el sector agropecuario, productos como el sorgo, la cebada y el trigo presentan una caída importante, casi desapareciendo de la composición del PIB sectorial, mientras que productos de ciclo corto y la mayoría de cultivos permanentes, sin considerar el café, han aumentado su nivel de producción (DNP, 2015), por tanto, es importante estudiar los precios de la producción agropecuaria no transable ya que esta ha ido en aumento.
Por otra parte, en Colombia existen centros tradicionales de acopio, denominados centrales de abastos (CA), donde se comercializan y distribuyen productos agrícolas. Estos centros son de gran importancia, ya que se enfocan en el mercado a nivel nacional, y el comercio de productos agrícolas en el interior de un país y en zonas periurbanas no solo aumenta la cobertura alimentaria (Toth, Rendall & Reitsma, 2016), sino ayuda a disminuir la volatilidad de los precios (Minot, 2014), puesto que estos dependen menos de la importación de alimentos y, por tanto, existe una menor transferencia entre el mercado global y el local (Bekkers, Brockmeier, Francois & Yang, 2017), lo cual aumenta la soberanía alimentaria (Food and Agriculture Organization of the United Nations [FAO], 2011).
Teniendo en cuenta el aumento de productos agrícolas no transables y que estos pueden ser comercializados en centrales de abastos, es posible analizar la variación de los precios de venta en dichos mercados a partir de diversas características, como tendencia, estacionariedad y aleatoriedad, mediante la evaluación de la hipótesis de eficiencia débil y análisis de causalidad (ambas pruebas pueden ser aplicadas con el histórico de los precios de venta), lo cual permite determinar si existe alguna relación en la manera en la cual se generan los precios entre las centrales de abastos.
El desarrollo de este tipo de estudios es de interés para diversos inversores y productores, ya que entender la forma en que varían los precios de productos agrícolas ayuda a fortalecer políticas públicas de inversión y genera confianza en los mercados donde estos son comercializados (Karali & Power, 2013).
En concordancia con la importancia previamente descrita, en la literatura científica se encuentran diversos estudios de las series de precios de productos agropecuarios, de los cuales se identifican dos objetivos. Por un lado están aquellos que aplican modelos de predicción para estimar el retorno de la inversión o los precios de venta y, por otra parte, aquellos que buscan evaluar hipótesis sobre la naturaleza de las series o los mercados en donde son comercializados los productos; estos últimos aportan al primer enfoque en cuestión, ya que entender la dinámica de los precios ayuda a generar pronósticos acertados (Malkiel, 2003). No obstante, es importante resaltar que estos trabajos se enfocan solamente en los mercados bursátiles y que, durante la presente investigación, no fueron encontradas referencias de trabajos equivalentes a centrales de acopio y venta; por tanto, desde un aspecto teórico, se logra la aplicación de estas propuestas econométricas en un mercado diferente al bursátil (y en extensión a productos no transables), lo cual genera bases para futuros trabajos relacionados con la hipótesis de eficiencia semifuerte y fuerte, así como las aplicaciones e implicaciones que estas conllevan.
Considerando lo anterior, el presente artículo se enfoca en el análisis de relaciones entre las centrales de abastos mediante un estudio de causalidad de precios, así como en evaluar la hipótesis de eficiencia de los mercados en su variante débil (ya que mediante las pruebas aplicadas es posible identificar modelos autorregresivos estacionarios para usar en el estudio de causalidad). Para ello, el documento se organiza de la siguiente forma: en la primera parte del trabajo (Antecedentes) se exponen algunos estudios relacionados con la hipótesis de eficiencia de los mercados y el análisis series de precios de venta de productos agrícolas; posteriormente, en la sección de Materiales y Métodos, se explica de forma breve cómo se seleccionaron los productos y los respectivos mercados de abastos, y se exponen las siete pruebas aplicadas. En Resultados se analizan las hipótesis aceptadas y rechazadas; en la sección de Discusión se mencionan ciertas limitaciones encontradas durante el desarrollo de la investigación, y en la parte final del trabajo se presentan las conclusiones, las referencias y los anexos.
ANTECEDENTES
Estudios relacionados con la hipótesis de eficiencia débil
Dentro de los estudios enfocados en el análisis de la variabilidad de los precios se encuentra el trabajo desarrollado por Levy (1967), quien es posiblemente el primer autor en diferenciar la forma fuerte y débil de la hipótesis de eficiencia de los mercados (HEM) propuesta por Fama (1965). Levy indica que el nivel de eficiencia depende de las características de aleatoriedad, puesto que, ante la presencia de comportamientos como las caminatas aleatorias no es factible pronosticar precios, por tanto, no se pueden obtener rendimientos extraordinarios mediante modelos como los autorregresivos. El presente trabajo se enfoca en la variante débil de la hipótesis de eficiencia de los mercados, ya que el concepto de eficiencia ha sido cuestionado principalmente en su forma fuerte, como consecuencia del costo de la información y las asimetrías que este puede generar (Grossman & Stiglitz, 1980), cuestionamiento que no suele aplicarse en las otras formas, debido a que la información requerida suele ser pública y gratuita (Fama, 1991), como la utilizada en el presente trabajo.
Ahora bien, es importante resaltar que evaluando la hipótesis de eficiencia de los mercados se pueden obtener resultados contradictorios o no concluyentes, ya que, dependiendo del horizonte del análisis, el mercado estudiado y las pruebas aplicadas es posible aceptar, rechazar o no concluir (cuando una prueba contradice a otra). Como antecedentes relacionados con la hipótesis de eficiencia de los mercados se encuentra que de los trabajos empíricos publicados entre 1997 a 2012 en Science Direct, el 60 % niega esta hipótesis, el 35 % no la rechaza y un 5 % de los estudios indica una mejora en la eficiencia (Duarte-Duarte & Mascareñas, 2014b), por tanto, es recomendable que al tratar con más de una prueba en el mismo horizonte de estudio se considere la potencia de las mismas.
Debido a las distintas discusiones que pueden darse en torno a la evaluación de la hipótesis de eficiencia de los mercados, la aplicación de pruebas sigue siendo un tema vigente. De hecho, en Latinoamérica se encuentran trabajos realizados por Duarte-Duarte y Mascareñas, quienes determinan mediante un estudio comprendido entre 2002 y 2012 que las principales economías en la región han presentado un aumento en su eficiencia (2014a); no obstante, esos resultados contrastan con los trabajos posteriores de Talero, Duarte y Garcés (2017), quienes, a partir de métodos de simulación, evalúan dichos mercados entre 2004 y 2016, y encuentran una disminución en la eficiencia con comportamientos leptocúrticos en el retorno de sus activos, lo que implica que las series no siempre siguen una caminata aleatoria y a veces presentan persistencia; lo cual, según un análisis para Colombia, puede ser consecuencia de la composición de los mercados, ya que es posible que coexistan diferentes tipos de agentes y su porcentaje de participación explique la eficiencia o persistencia de las series (Duarte, Talero & Sierra, 2017). Entre otros trabajos relacionados con la hipótesis de eficiencia de los mercados está el desarrollado por Ruiz-Porras y Ruiz-Robles (2015), quienes señalan que el mercado mexicano presenta una disminución en su eficiencia débil posterior al año 2007. De manera general, la aceptación de la hipótesis de eficiencia de los mercados puede indicar que existen condiciones justas para comercializar en los mercados bajo estudio, lo cual puede ser explicado por 1) reformas en las economías que buscan liberalización o menos restricciones al mercado, 2) mayor velocidad en el flujo de la información posibilitado por internet, 3) introducción de nuevos productos financieros y 4) periodos poscrisis económicas y bursátiles, que llevan a corregir asimetrías del mercado (Duarte-Duarte & Mascareñas, 2014b).
Estudios sobre la variabilidad de precios de productos agrícolas
En la literatura científica es posible encontrar diversos trabajos enfocados en evaluar la eficiencia, memoria o variabilidad de diversas series de precios de productos agropecuarios, con el propósito de generar modelos de predicción de precios más acertados. Respecto al estudio sobre productos colombianos, se puede encontrar un trabajo realizado por Velásquez y Aldana (2007), quienes abordan los dos enfoques (estudio de la serie y predicción). Los autores analizan el precio promedio mensual del café colombiano en la Bolsa de Nueva York usando varios modelos alternativos, tanto autorregresivos como máquinas de aprendizaje; proponen un modelo compuesto por una componente lineal autorregresiva más una red neuronal artificial tipo perceptrón multicapa con dos neuronas en la capa oculta, y a partir de los hallazgos concluyen que el precio actual depende de los precios ocurridos en los últimos cuatro meses (indican que el mercado no presenta un comportamiento eficiente).
Años más tarde, Coronado, Ramírez y Celso (2014) estudian la dependencia no lineal en los retornos del precio del café colombiano arábico (Colombian Arabica Coffee) utilizando el test estadístico de Hinich portmanteau (H), en el periodo comprendido entre junio 29 de 1990 y julio 1 de 2010. Los autores encuentran que en el 5.78 % de los casos, los modelos de volatilidad como GARCH no logran capturar los comportamientos de no linealidad, lo que indica que no puede aceptarse la hipótesis de eficiencia del mercado en su forma débil. Posteriormente, Coronado et al. (2014) evalúan la hipótesis de mercado adaptativo propuesta por Andrew Lo (2005) para ocho diferentes productos agrícolas catalogados como commodities, mediante pruebas no lineales y análisis de bicorrelación.
Respecto al análisis de otros productos agropecuarios, Tansuchat, Chang y McAleer (2009) desarrollan un trabajo en el cual evalúan el nivel de memoria a largo plazo de diversos productos agropecuarios que cotizan en bolsa: maíz, avena, soja, harina de soja, aceite de soja, trigo, ganado vivo, alimentos para ganado, carne de cerdo, cacao, café, algodón y jugo de naranja, utilizando modelos GARCH, FIGARCH, FIEGARCH, FIAPARCH, EGARCH y APARCH, y encuentran que a largo plazo existe dependencia en los precios estudiados. En ese mismo año, Benavides (2004) presenta un trabajo que se enfoca en el contraste entre modelos (teniendo en cuenta el error cuadrado medio del pronóstico como criterio de evaluación), como el modelo GARCH, ARCH (modelo BEKK) y modelos de volatilidad, los cuales son aplicados a las series de precios del maíz y avena, y encuentran que un modelo compuesto es el que presenta mejor ajuste. Por otra parte, Tejeda y Goodwin (2009) aplican un modelo de series de tiempo multivariante, con el cual evalúan correlaciones asimétricas entre los precios del grano (maíz, soya) y del ganado, y analizan la relación entre el volumen de producción de maíz y el precio del etanol; hallan una relación negativa entre los precios del maíz y de los becerros con el volumen de producción de etanol, lo cual implica una estacionalidad en las series de precios.
Años más tarde, Lachman y Jack (2017) estudian la eficiencia en los mercados de futuros de la soya entre los mercados de Buenos Aires (Mat-Ba) y Chicago (CME-CBOT) para los años 1994 a 2015. Aceptando la hipótesis de eficiencia del mercado en MatBa, la cual se relaciona con la eficiencia en el mercado de CME-CBOT, es decir, a partir de la prueba propuesta por Johansen mediante series de precios mensuales y diarios existe cointegración entre los mercados. De manera paralela, Bouri, Chang y Gupta (2017) evalúan la hipótesis de eficiencia del mercado en su forma débil para el mercado del vino, utilizando una versión modificada de la prueba de raíz unitaria. Observan cambios estructurales en la serie, así como no linealidad, además concluyen que contrario a los resultados de la prueba tradicional, con la prueba de raíz unitaria propuesta pueden demostrar que el mercado es ineficiente.
Teniendo en cuenta los trabajos citados previamente, es posible determinar una estructura metodológica. Como primer paso es necesario evaluar la hipótesis de eficiencia de los mercados en su forma débil, puesto que si los mercados no son eficientes, estos pueden presentar asimetrías de información, lo cual puede ser reflejado en la volatilidad de las series; caso contrario, al no rechazar esta hipótesis se pueden aplicar transformaciones a las series para obtener características estacionarias mediante modelos lineales y, con ello, realizar comparaciones entre los mercados (CA) mediante pruebas de causalidad o cointegración, esto permite en el futuro el desarrollo de herramientas para la toma de decisiones.
MATERIALES Y MÉTODOS
Datos
Los datos son obtenidos a partir de los reportes semanales generados por el Sistema de Información de Precios y Abastecimientos del Sector Agropecuario (SIPSA), el cual es una división del Departamento Administrativo Nacional de Estadística (DANE) de Colombia. De cada reporte semanal generado durante el periodo comprendido entre enero de 2013 (cuando unifican reportes semiestructurados en formato Excel) y diciembre de 2017 (fecha en la cual fue realizado el análisis), se extrae de manera estructurada el precio promedio de venta por unidad de kilo [COP / Kg] de 216 productos divididos en cuatro categorías: hortalizas: 74, frutas frescas: 76, raíces y tubérculos: 39, y granos y cereales: 28. Datos recolectados para 12 centrales de abastos: Barranquilla, Bogotá, Bucaramanga, Cali, Cartagena, Ipiales, Manizales, Medellín, Montería, Neiva, Sincelejo y Villavicencio.
Una vez estructurados en tablas los precios históricos de los productos agrícolas, se revisa la ausencia de datos (i.e. datos perdidos), y se seleccionan aquellos productos que presentan a lo sumo un 10 % de datos perdidos y que tengan presencia en todas las centrales de abastos; sin embargo, debido a la ausencia de registros en varias centrales, se simplifica la cantidad de productos y su punto de venta, generando así un histórico de 621 entradas en cada mercado (central de abastos) para un total de 28 productos comercializados en seis centrales de abastos (Barranquilla, Bogotá Bucaramanga, Manizales, Medellín y Villavicencio).
Los productos estudiados se enumeran en la Tabla 1, donde se agrupan los 28 productos analizados según la categoría identificada en los reportes del SIP-SA; así mismo, se indica la cantidad porcentual de datos perdidos para cada una de las centrales de abastos estudiadas, donde nueve productos no presentan datos perdidos, ocho productos indican datos perdidos en una única central de abastos, cinco productos en dos centrales, tres productos muestran datos perdidos en tres centrales y un único producto tiene datos perdidos en las seis centrales. Además, se evidencia que pocos productos tienen una cantidad relativamente alta de datos perdidos (dos productos no registran 22 precios, y un producto, 25).
Ba/lla: Barranquilla, Bo/tá: Bogotá, B/ga: Bucaramanga, Ma/les: Manizales, Me/llín: Medellín, Vi/cio: Villavicencio, R&T: raíces y tubérculos, H: hortalizas, G&C: granos y cereales, FF: frutas frescas.
Posteriormente, y teniendo en cuenta la baja cantidad de datos perdidos, estos son imputados a partir de la interpolación simple entre los datos presentes, considerando que en la mayoría de los casos la ausencia de datos era escasa y también en la mayoría de los casos faltaba un único registro de manera consecutiva.
Métodos para la estimación de aleatoriedad y prueba de causalidad
El desarrollo metodológico se enfoca en el formato de estudio empírico utilizando fuentes secundarias de datos, donde estos son analizados mediante la aplicación de seis pruebas que permiten discernir si las series de precios son de carácter estacionario o no y una prueba para analizar causalidad. Para ello, los datos son transformados de series de precios a series de rentabilidad, lo cual permite medir el retorno en un momento específico, según la siguiente ecuación:
Donde R t es el retorno esperado en el instante t, ln es el logaritmo natural, P t es el precio promedio de venta del producto agrícola durante la semana y P -1 el precio de venta promedio de dicho producto en la semana anterior.
Prueba de raíz unitaria
Las primeras tres pruebas aplicadas durante el presente trabajo pertenecen a la familia de las raíces unitarias, las cuales, según citan Nisar y Hanif (2012, p. 418), "pueden ser usadas para evaluar la eficiencia de los mercados, puesto que dicho comportamiento demanda aleatoriedad (i.e. serie no estacionaria) en los precios (Hassan, Abdullah, & Shah, 2007)". Estas son evaluadas utilizando el paquete "urca" desarrollado en el software estadístico R por Pfaff (2008).
Raíz unitaria con deriva y con tendencia
La primera prueba se enfoca en determinar si el modelo general de regresión se comporta como el descrito en la ecuación [2]:
Donde u t es un término de error de ruido blanco (se distribuye normalmente con media = 0 y varianza = 1), t es el tiempo medido cronológicamente, Y t la realización de la serie, β 1 indica el valor de deriva, β 2 la tendencia temporal y β 3 la raíz del proceso. Con la característica de presentar un -1 ≤ β 3 ≥ 1 Donde si β 3 = 1 se conoce como raíz unitaria que indica un modelo de caminata aleatoria y, por tanto, se entiende que es un proceso estocástico no estacionario. Como hipótesis nula se evalúa que el modelo de regresión presenta un problema de raíz unitaria H 0 1 : β 1 ≠ 0, β 2 ≠ 0, β 3 = 1; H 1 1 : Caso contrario.
Raíz unitaria con deriva y sin tendencia
Del modelo general de regresión se puede presentar una forma especial en la cual β 1 ≠ 0, β 2 = 0, β 3 = 1:
Dicho modelo se conoce como caminata aleatoria con deriva (CAD), que se caracteriza por ser no estacionaria con tendencia determinista. Como hipótesis nula se evalúa que el modelo de regresión presenta un problema de raíz unitaria con tendencia, es decir: H 0 2 : β 1 ≠ 0, β 2 = 0, β 3 = 1; H 1 2 : Caso contrario.
Raíz unitaria sin deriva y sin tendencia
Del modelo general de regresión se puede presentar una forma especial en la cual β 1 = 0, β 2 = 0, β 3 = 1
El modelo es conocido como caminata aleatoria pura (CAP), el cual genera un proceso no estacionario. Como hipótesis nula se evalúa que el modelo de regresión presenta un problema de raíz unitaria con tendencia, es decir:H0 3: β 1 = 0, β 2 = 0, β 3 = 1; H¡ 3 : Caso contrario.
Prueba de rachas (prueba de Geary)
El cuarto test aplicado es una prueba no paramétrica que busca determinar si las realizaciones en una serie siguen un comportamiento aleatorio (Geary, 1935; Gujarati & Porter, 2010), para ello se estima un valor crítico Z teniendo en cuenta la siguiente ecuación:
Donde Z es una variable que se distribuye de manera normal, R es el número total de rachas, X = (2n¡n 2 )/(n) + 1 (media de la serie), n 1 representa el número total de rachas positivas, n 2 el número total de rachas negativas, n=(n 1 +n 2 ), σ 2=(2 n 1 n 2 (2 n 1 n 2 -n))/ ((n) 2 (n-1)) (varianza de la serie).
A partir del cálculo de la ecuación [5] se obtiene un estadístico, si su valor se encuentra entre el rango (-1.96,1.96) -a un 95 % de confianza- indicará que la serie presenta un comportamiento aleatorio según sus realizaciones. Como hipótesis nula se evalúa que el valor obtenido de Z representa una serie de realizaciones aleatorias, es decir: H 4 0 : -1.96 <Z<1.96; H 1 4 :Ca-so contrario. Esta prueba es evaluada utilizando el paquete "randtest" desarrollado en el software estadístico R por Caeiro y Mateus (2014).
Análisis de autocorrelaciones (prueba d, de Durbin-Watson)
La quinta prueba es el análisis de autocorrelaciones de Durbin-Watson (Savin & White, 1977), que se utiliza para detectar la presencia de auto-correlación en los residuos (errores de predicción) de un análisis de la regresión. El estadístico es calculado a continuación:
Donde
Indicando que β 3 representa el grado de correlación de la muestra de los residuos. d=2 indica que no hay auto-correlación (Durbin & Watson, 1951). Como hipótesis nula se evalúa que no existe autocorrelation en la serie, es decir: H 0 5 : P(d=2); H 1 5 :Caso contrario. En el presente trabajo es utilizado el paquete estadístico "lmtest" desarrollado en R por Zeileis y Hothorn (2002).
Estimación del coeficiente de Hurst
La sexta prueba es la estimación del coeficiente de Hurst, medida que indica el grado de independencia de las series de tiempo. Cuando el valor del coeficiente se encuentre en H=g.5, se considera que la serie tiene un comportamiento de ruido blanco. Por otra parte, si (0.5 ≤ H <1] se dice que la serie presenta persistencia o autoco-rrelaciones, de manera análoga, si [0 ≤ H ≤ 0.5) la serie presenta un comportamiento antipersistente o de correlación negativa.
Para el presente trabajo es aplicada la variante propuesta por Andrew Lo (1991), la cual tiene en cuenta la memoria interna de la serie, donde σ x 2 y j. son los estimadores de varianza y covarianza de la serie, α el tamaño de la subserie, R(N) el rango de datos de la subserie.
Como hipótesis nula se evalúa si la serie presenta un comportamiento aleatorio, es decir: H 0 6 :H=g.5; H 1 6 :Caso contrario. Ahora bien, teniendo en cuenta que el coeficiente de Hurst es una estimación y es sensible a la longitud de la serie y la cantidad de sub-series (Talero et al., 2017), es necesario determinar el número de subseries con su respectiva longitud que permitan identificar si una serie presenta un comportamiento aleatorio. Para ello se realizan múltiples réplicas de longitud equivalente a la serie de precios (L=261) con muestras generadas con comportamientos aleatorios (siguiendo caminatas aleatorias); dichas series son evaluadas con diferentes tamaños de subseries, hasta hallar aquella que estima un coeficiente de Hurst H=0.5, lo anterior mediante una prueba de intervalo de confianza.
Como resultados del ejercicio de calibración se reformula la hipótesis para que esta tenga en cuenta el intervalo de confianza identificado con una confianza de 0.95: la serie presenta un comportamiento aleatorio tipo caminata aleatoria, es decir: H 0 6 : 0.4804 ≤ H ≤ 0.5245; H 1 6 :Caso contrario. Para el presente trabajo es programada una función en el lenguaje R, la cual estima el coeficiente de Hurst (Anexo 1)
Evaluación de la causalidad entre productos para las distintas centrales de abastos
A partir de los diversos métodos aplicados para identificar aleatoriedad en las series es posible estructurar modelos autorregresivos estacionarios; sin embargo, estos solo se enfocan en un producto a la vez. Teniendo presente el objetivo de evaluar la relación entre las diferentes centrales de abastos, se procede a determinar si existe una relación entre el precio de un producto y los mercados donde es comercializado, con base en los resultados de la etapa anterior. Para ello se aplica la prueba de Granger (1986), ya que a partir de esta es posible identificar si la precedencia de un precio en una serie, generado en un mercado específico, puede causar o potencialmente predecir cambios en un futuro precio de otra serie (del mismo producto en otra CA).
Para la aplicación de la metodología se realizan tres pasos básicos: 1) seleccionar series estacionarias y que tengan presencia en todas las centrales de abastos, 2) evaluar el efecto de rezagos de cada par de series (mismo producto para cada par de CA) y 3) identificar relaciones entre los mercados. El efecto de los rezagos y la causalidad se puede expresar mediante las siguientes ecuaciones:
Donde cada una de las series presentadas indica que el valor en un instante t es expresado por sus valores anteriores, es decir, cada valor es explicado mediante un modelo autorregresivo en conjunto con el modelo regresivo desfasado de otra serie. La idea general es determinar si el valor de cada coeficiente αi βj Υi y δj es significativo. A partir de la prueba propuesta por Gardner es posible encontrar cuatro escenarios:
Que exista causalidad unidireccional del producto uno al producto dos.
Que exista causalidad unidireccional del producto dos al producto uno.
Que exista causalidad bidireccional.
Que no exista causalidad.
Como hipótesis nula se evalúa la probabilidad de que el coeficiente de una serie perteneciente a otro mercado sea significativo y, por tanto, se presenta una causalidad: H 0 7 : P(F experimental > F crítico ), H 1 7 caso contario.
Ahora bien, con el propósito de determinar el número de rezagos dentro del modelo de regresión, se propone de manera iterativa para cada par de series por analizar, calcular los distintos p-valores de las pruebas F, desde uno hasta 25 rezagos (el equivalente en semanas de medio año). Después se selecciona el número de rezagos más significativos y sobre este número se determina si existe causalidad o no.
En último término se realiza un grafo con el propósito de representar las relaciones entre los mercados, para ello se propone simbolizar cada central de abasto como un nodo y mediante flechas indicar la cantidad de productos que cumplen la hipótesis de causalidad desde ese mercado hacia otro.
RESULTADOS
Resultados del análisis de aleatoriedad
Una vez aplicadas las diferentes pruebas, los p-valores son registrados en el Anexo 2 y, al mismo tiempo, se construye una tabla en la cual se resume la cantidad de veces que no es posible (con una confianza del 0.95) rechazar cada una de las hipótesis nulas (Tabla 2). Donde las filas indican las veces en que cada una de las seis hipótesis nulas no pudo ser rechazada, para un total máximo de 28 veces equivalentes a las series de productos agrícolas analizados por cada prueba en cada una de las centrales de abastos.
De manera general, de los resultados consignados en el Anexo 2 y la Tabla 2, se puede concluir que no todas las centrales de abastos tienen la misma eficiencia para todos sus productos. Un ejemplo de lo anterior está en la serie de precios del arroz de primera (Producto P17), el cual en los mercados de Bogotá y Villavicencio no presenta un comportamiento de raíz unitaria (en las tres hipótesis de raíces unitarias), mientras que en Medellín, Manizales y Barranquilla la serie se comporta como una caminata aleatoria y, para el caso de la central de Bucaramanga, la serie presenta un comportamiento de raíz unitaria con deriva y sin tendencia. Ahora bien, con el propósito de determinar si existen tendencias en todos los mercados, todos los productos son analizados para todas las centrales de abastos en la aceptación de sus diferentes hipótesis: raíz unitaria con deriva y con tendencia (Tabla 3), raíz unitaria con deriva y sin tendencia (Tabla 4), raíz unitaria sin deriva y sin tendencia (Tabla 5), prueba de rachas (Tabla 6), análisis de autocorrelación (Tabla 7) y coeficiente de Hurst (Tabla 8).
De la Tabla 3 es posible determinar que solo para dos productos (manzana roja importada y uva red globe nacional) se encuentra un comportamiento de caminata aleatoria en las seis centrales de abastos, posiblemente por ser productos importados. Sin embargo, al analizar la variante denominada raíz unitaria con deriva y sin tendencia (Tabla 4), se encuentra que la mayoría de los productos (96.43 %) presenta dicho comportamiento en todas las centrales de abastos, con la salvedad del arroz de primera (P17), para el cual no es posible aceptar dicha hipótesis en los mercados de abastos de Bogotá y Villavicencio.
Respecto al proceso de raíz unitaria sin deriva y sin tendencia (Tabla 5), solo dos productos (manzana roja importada P12, manzana verde importada P13) presentan dicho comportamiento en todas las centrales de abastos. Ahora bien, para el caso del producto P13, de manera dual acepta dos tipos de hipótesis (caminata aleatoria y caminata aleatoria sin deriva y sin tendencia), lo cual es contradictorio y, según explican DeJong, Nankervis, Savin y Whiteman (1992), puede ser debido a que la prueba de raíz unitaria puede presentar problemas para determinar la aleatoriedad de una serie, incluso cuando no existe autocorrelación.
Para el caso de la prueba de rachas, solo en tres productos no es posible aceptar la aleatoriedad en las seis centrales de abastos: pimentón (P9), espinaca (P19) y alverja verde en vaina (P26). Ahora bien, es necesario resaltar que debido a la naturaleza de la toma de datos (precio promedio de venta durante la semana), las series transformadas no eran dicotómicas, ya que en múltiples semanas de manera consecutiva se presentaba un precio promedio, por tanto, el algoritmo propuesto por Caeiro y Mateus (2014) reduce la longitud de las series para analizar, considerando solo aquellas en las que el precio cambia, lo cual puede generar distorsión en los resultados de la prueba. Respecto al análisis de autocorrelación mediante la prueba de Dubrin-Watson, se encuentra que ninguna serie obtiene p-valores superiores a 0.05, por tanto, no es posible rechazar la hipótesis nula y las series estudiadas no presentan autocorrelación.
La prueba final indica que una vez estandarizadas las series de precios mediante su desviación estándar y teniendo en cuenta la autocorrelación propuesta por Lo (1991), en la mayoría de los productos no es posible aceptar la hipótesis de caminata aleatoria para la mayoría de las relaciones (producto-central de abastos), con la salvedad del brócoli, manzana roja importada, manzana verde importada y arveja verde en vaina (Medellín), remolacha (Manizales), papa criolla limpia (Bogotá) y alverja verde en vaina (Villavicencio). Los productos que aceptan la hipótesis nula de aleatoriedad según cada prueba son registrados en el diagrama de frecuencias de la Figura 1, donde el eje horizontal indica la cantidad de centrales en las que no se puede rechazar la hipótesis, el eje vertical, el número de veces que la prueba no es rechazada y el color indica la prueba.
Resultados del análisis de causalidad
Para el análisis son escogidos todos los productos que presentan una raíz unitaria con deriva y sin tendencia, debido a que es el patrón más común en todos los mercados y de esta manera solo se excluye del análisis el producto arroz de primera (P17). Los resultados de la cantidad de rezagos por considerar y los valores obtenidos de la prueba de causalidad se registran en los anexos 3 y 4.
De las 810 pruebas aplicadas (cada relación entre los 27 productos y la permutación de centrales de abastos 6P3), se encuentra que no es posible refutar la hipótesis de causalidad en 294 casos (36.30 %), además, en el 78.91 % de las causalidades, estas se presentan con un único rezago, 13.27 % con dos rezagos, 5.10 % con tres rezagos, 0.68 % con cuatro rezagos, 1.36 % con cinco rezagos y 0.68 % con ocho rezagos. Por otra parte, los productos en los que se confirma de manera más seguida la causalidad son: 20 ocasiones (de 30 posibles) para P8 (pepino cohombro) y 18 para P7 (lechuga batavia) y P16 (Tomate de árbol). Las veces que es aceptada la hipótesis de causalidad para cada producto se aprecian en la Figura 2.
Por otra parte, con el propósito de identificar las relaciones se genera el diagrama de la Figura 3, en el que son representadas mediante nodos las seis centrales de abastos, y su tamaño relativo indica la cantidad de veces que no es rechazada la hipótesis de causalidad desde su central hacia otra. Además, se representa la influencia de las centrales de abastos a partir de un vector que indica el número de productos que generan causalidad y la dirección de la misma: {causalidad->;causalidad<-;causalidad<->}: Barranquilla [49,19,23], Manizales [58,13,13], Villavicencio [34,30,19], Medellín [19,35,12], Bogotá [13,47,17] y Bucaramanga [10,39,18] respectivamente. Teniendo en cuenta las interacciones dobles y los efectos unidireccionales, es posible inferir que el mercado de Manizales es el que mayor influencia tiene de los presentados en el estudio, mientras que el mercado de Bucarmanga es el que menos se ve afectado por los cambios en los otros.
DISCUSIÓN
A partir de las pruebas aplicadas se concluye que no es posible rechazar la hipótesis de eficiencia de los mercados en todas las relaciones (producto/ central de abastos); no obstante, hay que tener en cuenta que los resultados de las pruebas aplicadas son no concluyentes en todas las relaciones, por lo cual se plantean dos posibles interpretaciones. La primera implica que según la dinámica de oferta y demanda de cada central de abastos, los productos pueden (o no) presentar comportamientos de aleatoriedad y, al ser diferente esa dinámica en cada central, dicho comportamiento no necesariamente debe ser igual. Por tanto, un futuro trabajo contemplado en este escenario es identificar si existen diferencias entre los precios de venta de los productos agrícolas comercializados en las centrales de abastos considerando dos grupos: aquellos en los cuales se acepta la hipótesis de eficiencia versus aquellos donde se rechaza y, posteriormente, determinar si existe cointegración entre los mercados. Lo anterior, sumado a un análisis explicativo sobre la causalidad identificada, permitiría determinar oportunidades de inversión como la selección de la central de abastos en la cual se debe vender un producto específico o el efecto que tendría dicha central de abastos sobre el cambio de precio de un producto agrícola comercializado en otra central.
La segunda interpretación se enfoca en la exactitud de las pruebas. Por un lado, la prueba de raíz unitaria permite identificar la serie que presenta un comportamiento estocástico en sus diferentes versiones (considerando deriva o tendencia); sin embargo, durante el presente trabajo se rechaza la hipótesis en un 28.57 % de las ocasiones, lo que indica que en la mayoría de las pruebas se determina que las series siguen un proceso no estacionario. Sin embargo, según DeJong et al. (1992), mediante la prueba aumentada de Dickey-Fuller se puede considerar en al menos un 50 % de los casos el comportamiento no estacionario cuando el proceso es autorregresivo, es decir, la prueba aplicada tiende a aceptar el comportamiento no estacionario en más ocasiones de las garantizadas (Gujarati & Porter, 2010), por tanto, para futuros trabajos se recomienda trabajar con variantes de la prueba de raíz unitaria como la propuesta por Bouri et al. (2017).
Por otra parte, la aplicación de la prueba de rachas fue realizada considerando una limitante, ya que al trabajar con el precio promedio semanal, el precio de ciertos productos se mantiene constante en el tiempo; lo cual, al tener en cuenta el comportamiento del algoritmo desarrollado por Caeiro y Mateus (2014), deriva en la transformación de la serie original a una más corta ignorando los periodos en los cuales no hay cambios (garantizando así una serie dicotómica). Por tanto, para futuros trabajos se recomienda estudiar el comportamiento de los precios de manera diaria con el propósito de plasmar las rachas inherentes de las series.
Respecto a la exactitud de la prueba d, el hecho de encontrar un valor d significativo no es garantía de que no exista autocorrelación (Gujarati & Porter, 2010), debido a que la prueba puede ser sensible a características como la longitud de la serie (con una tendencia a mejorar entre más datos existan) (Tillman, 1975). A pesar de ello, según los resultados se determina que para ninguna relación es posible refutar la hipótesis nula para un análisis semanal de los precios, lo cual para futuros trabajos puede ser contrastado con otra frecuencia de datos (particularmente, precios diarios).
Respecto a la última prueba, el coeficiente de Hurst se caracteriza por poseer una metodología relacionada más con la estimación que con el cálculo (Resta, 2012), lo que implica que mediante diversas metodologías pueden obtenerse valores distintos, además, que el nivel de memoria de la serie suele disminuir con la longitud de la misma (Peters, 2015). Durante el presente trabajo se aplica la variante propuesta por Andrew Lo (1991), la cual incorpora la autocorrelación para el reescalamiento de los datos, procurando así evidenciar relaciones de la serie con sus respectivos rezagos, aun cuando esta puede poseer un tamaño alto. Para futuros trabajos se recomienda hacer contrastes entre diferentes estimaciones del coeficiente de Hurst calibradas para longitudes específicas, con el fin de disminuir la incertidumbre sobre la efectividad o poder de la prueba.
En cuanto a las pruebas de causalidad, se recomienda para futuros trabajos llevar a cabo estudios enfocados en la dinámica de abastecimiento y flujos de productos en el marco de la logística entre centrales, con el propósito de determinar si la causalidad identificada se debe a que los productos son comercializados de una central a otra o, por otra parte, si elementos como cambios climáticos, políticos y demás, no tienen un efecto simultáneo en la geografía nacional.
CONCLUSIONES
Mediante el desarrollo metodológico propuesto para el presente trabajo se hace una extrapolación del concepto de mercado eficiente desde entorno bursátil al contexto de oferta y demanda de productos agrícolas en un centro de acopio. Además, a partir de los resultados parciales obtenidos fue posible hacer un análisis comparativo entre las centrales de abastos con el fin de determinar si el comportamiento de cada una es independiente de las otras. Esta propuesta, si bien se desvía de la aplicación teórica respecto a valores futuros (como en el caso de los commodities) y no contempla diversos elementos que afectan el mercado agrícola, tales como informalidad, concentración excesiva de tierra, falencias logísticas, ausencia de créditos y capacitación, entre otros, es un acercamiento novedoso con el cual se generan antecedentes empíricos en mercados donde se comercializa una gran cantidad de productos no transables. Esto ayuda para que en futuros trabajos se identifiquen oportunidades de inversión o comercialización (considerando los productos en cada CA), así como la formulación de políticas públicas que beneficien a los productores.
Por otra parte, respecto a las pruebas aplicadas se concluye que si bien la mayoría de los procesos históricos sugieren un comportamiento no estacionario, los resultados indican que existen diferencias entre las centrales de abastos y, por tanto, deben ser estudiadas como mercados diferentes; además, se concluye que los centros en Manizales, Barranquilla y Villavicencio influyen sobre los precios de los mercados de Bogotá, Bucaramanga y Medellín, por tanto, para futuros trabajos relacionados con la generación de precios y sus efectos es necesario no estudiar de manera independiente las centrales de abastos, sino incorporar los efectos de otras centrales.