Introducción
Buena parte de la historia electoral de Colombia está caracterizada por el dominio de los partidos Liberal y Conservador en las elecciones locales y nacionales. Un punto de inflexión se da con las reformas electorales efectuadas entre las décadas de 1990 hasta el 2000 -en vigencia de la Constitución de 1991- y la entrada de nuevos partidos al escenario político que se consolidaron y desplazaron los tradicionales.
En el caso particular de las elecciones presidenciales, los movimientos políticos tradicionales obtuvieron las mayores votaciones hasta las elecciones de 2002, fecha a partir de la cual empezaron a ser desplazados por representantes de partidos independientes o nuevas fuerzas políticas cuyos candidatos disidentes de los partidos tradicionales lograron simpatizar con el electorado.
Para explicar este cambio en los patrones de votación de los colombianos en las elecciones presidenciales se han hecho importantes estudios desde campos probabilísticos (Bautista, 2005) y análisis multivariados (Marin- Jaramillo, 2014). Sin embargo, son pocos los escritos que desde una perspectiva cuantitativa indaguen por los factores socioeconómicos que determinan la decisión de voto en Colombia.
Para las elecciones en Colombia, hay dos hechos relevantes. Por un lado, la influencia directa de los grupos paramilitares en la elección de candidatos regionales (Acemoglu et al., 2013) y, por otro, la reducción del número de votantes por acciones de violencia paramilitar y guerrillera que redujo la competencia electoral y benefició partidos tradicionales (Gallego, 2018a). Súmese a lo dicho que la ayuda militar externa aumentó la violencia política por parte de grupos insurgentes o paramilitares que influenciaron los resultados de candidatos políticos apoyados por sus jefes (Dube & Naidu, 2015). Con esto, se ha llegado a señalar que el Estado tiene poco interés en acabar con las formas de violencia y así mantener intereses políticos o económicos en zonas con dominio político de candidatos apoyados por líderes que apoyan el conflicto y la acción en contra de grupos paramilitares y de guerrilla (Fergusson et al., 2014).
Así mismo, la postura política de los candidatos a favor de promover la negociación con la guerrilla ha logrado mayor aceptación de votantes en regiones con nivel moderado de violencia (Weintraub et al., 2015). Todo esto, sin dejar de lado las condiciones climáticas en el país que afectan el clientelismo político en épocas de desastres (Gallego, 2018b) y los flujos de población migrante hacia Colombia que inciden en la participación política (Rozo & Vargas, 2019) y favorecen a nuevos partidos.
Bajo este contexto, el presente artículo analiza la relación entre los resultados de las elecciones presidenciales y el nivel de desarrollo municipal mediante la aplicación de metodologías de análisis multivariado y modelos de regresión bayesianos. Se construyen índices electorales, los cuales se usan como insumo principal en un modelo de regresión beta bayesiano, con el fin de explicar el efecto del desarrollo económico y la violencia en las decisiones de votación municipal durante el periodo 1986-2014.
Aparte de esta introducción, este artículo se encuentra dividido en cinco secciones. En la primera se realiza una revisión del estado del arte sobre comportamiento electoral y desarrollo. Posteriormente, en la segunda, se elabora una descripción de la aproximación metodológica utilizada en la investigación. En la tercera se presentan los datos utilizados para luego mostrar en la cuarta parte los principales resultados y la discusión. Finalmente, se presentan las principales conclusiones.
I. Estado del arte y formulación de hipótesis
Existen múltiples teorías sobre los determinantes individuales de las preferencias de votación. Las teorías psicológicas indican que la decisión electoral es definida por la identificación partidaria, la actitud frente a los temas del debate electoral y la simpatía por el candidato. Así mismo, los medios de comunicación tienen gran influencia en las personas indecisas o con predisposiciones hacia algún candidato (Goodin & Klingemann, 2001). Los factores psicológicos afectan la distribución de los votos en regiones con sistemas políticos pluralistas (Blais & Carty, 1991) y donde además existe correlación entre la decisión del voto y la edad, educación, creencias religiosas, tamaño de población y concentración de los votos (Dow & Endersby, 2004; Glasgow & Álvarez, 2005; Paap et al., 2005).
Por el contrario, estos factores pierden relevancia en lugares donde se presenta predominancia electoral de un partido específico (Chen & Tokuda, 2005). Desde una perspectiva sociológica, las decisiones de votación se basan en información política condicionada por características sociales de los individuos como lugar de residencia, ocupación, afiliación religiosa, entre otras (Montecinos, 2007).
Existen otras aproximaciones que explican los resultados electorales a partir de las características del movimiento o el candidato y sus maniobras políticas. Así, los votos pueden depender de la formación del candidato, la votación por el partido en las elecciones anteriores, el gasto en campaña, la tradición política en la zona, el nivel promedio de educación en la región, la edad y el género del candidato (Burden & Greene, 2000; Epstein & o’Halloran, 1999; Klesner, 2005) y la formación de coaliciones antes y después de las votaciones en los resultados electorales futuros (Bandyopadhyay & Chatterjee, 2006).
A lo anterior se agregan varias situaciones relevantes: la satisfacción con el gobierno de turno, la tradición política de la familia del votante, la experiencia pública del candidato, la religión, la identificación de los votantes con las ideologías del partido y del candidato; el ingreso de los votantes y la urbanización, industrialización y ubicación geográfica (Archer, 1987; Banducci & Karp, 2000; Bobo & Gilliam, 1990; Caldeira & Patterson, 1982; Klesner, 2005; Ordeshook & Shvetsova, 1994). Influyen también en modo importante el grado de heterogeneidad de los partidos, el tamaño del electorado, la integridad del candidato y la integridad política (Arenas- Gómez & Bedoya-Marulanda, 2011; Soto-Zazueta & Cortez, 2012), la participación del candidato en elecciones pasadas, el costo de las elecciones y la heterogeneidad espacial en la votación, entre otras (Archer, 1987; Canache et al., 2000; Dow, 1998; Lupia, 1994).
Desde un enfoque regional, se destaca el trabajo pionero de Krehbiel (1916), quien buscó establecer una relación espacial entre desarrollo agrícola y la votación por un partido concreto -conservador-. Más adelante, Prescott (1959) formaliza los métodos de geografía electoral y convierte esta área en una subdivisión de la geografía política. A partir de allí, varios estudios han mostrado que el tamaño y la relevancia de la región, el control político de candidatos y partidos, la religión, la presencia política, el desempleo y la inflación en la región, inciden en el control electoral de las zonas con importante potencial electoral (Sass, 2000; van der Brug et al., 2003).
Otro grupo de investigaciones ha llegado a relacionar los resultados regionales y los factores que influyen en la votación, encontrando que los principales determinantes son: la participación regional de partidos (Altman, 2004); el número de partidos políticos participantes; el desempleo regional y afiliación política (Golosov, 2006; Jones et al., 1992; Nadeau & Blais, 1993); la participación de nuevos partidos, la votación por partidos dominantes, la calidad de las propuestas, los resultados de encuestas sobre intención de voto y la formación política de los candidatos (Damore & Hansford, 1999; Gimpel & Schuknecht, 2002; Paolino, 2005).
Ahora bien, el gobierno debe satisfacer los gustos de los votantes para evitar que se formen grupos disidentes que lleven al electorado a mostrar inconformismo frente al gobierno, generando un costo que debe ser asumido por el Estado para contrarrestar el efecto del pluralismo electoral (Kuran, 1989)
Recientemente, se han propuesto aproximaciones estadísticas y econo- métricas que buscan advertir de alguna forma los resultados electorales. Por ejemplo, Leigh y Wolfers (2006) elaboraron modelos econométricos para pro- nosticar los resultados de las elecciones australianas de 2004 y Arrow, et al. (2008) plantearon modelos de predicción con un error cercano al 5 % en los resultados de las elecciones presidenciales de los Estados Unidos. Por su parte, Campbell et al. (2006) intentaron predecir alrededor del 75 % de los resultados de los colegios electorales en las elecciones estadounidenses.
En el campo del muestreo probabilístico, Bautista (2005) propone un método de este tipo basado en encuestas probabilísticas, construcción de índices de votación y simulaciones, que le permite intentar anticiparse a los resultados de las elecciones colombianas de 2002.
En esta misma línea, algunos autores muestran que las características raciales del votante, los niveles de crimen e inseguridad, el nivel de empleo regional, la diversidad política de partidos y la imagen de favorabilidad hacia el candidato, inciden en la dispersión y volatilidad en los resultados electorales y que un partido o candidato tenga mayor probabilidad de aumentar votación (Abrajano & Alvarez, 2005; Bovitz & Carson, 2006; Cho, 2005). Se agrega que aspectos como los niveles de corrupción, el crecimiento económico y la fraccionalización de partidos repercute sustancialmente en las elecciones (Abramowitz & Segal, 1986; Akarca & Tansel, 2006; Bawn, 1999; Krause & Méndez, 2009; Markus & Converse, 1979).
Adicionalmente, los años de democracia, el sistema de gobierno, las escalas laborales en las regiones y la identificación de los votantes con las políticas de los candidatos explican la volatilidad electoral (Alfaro, 2006; Mainwaring & Zoco, 2007; Pattie et al., 1997).
A su vez, en los análisis multivariados existen aportes importantes que vale la pena destacar. Lincoln y Prior (1971) estudiaron el comportamiento electoral de izquierda y derecha en municipios escoceses para las elecciones de 1969 mediante un ACP. También, Rodrigues y Lima (2009) examinaron los resultados de elecciones parlamentarias en 2004 en la Unión Europea mediante metodología ACP con contraste logarítmico. En Colombia, Pacheco y Bautista (1989) plantearon ACP por perfiles sobre comportamiento electoral departamental para elecciones presidenciales entre 1974-1990 y Marín-Jaramillo (2014) implementaron un análisis de correspondencias que controlan por año de votación y tamaño de población, para encontrar patrones de votación municipal.
A pesar de los múltiples estudios mencionados, no existe alguno que -desde una perspectiva cuantitativa- indague por los factores socioeconómicos que determinan la decisión de voto en Colombia.
Por lo anterior, este artículo pretende (i) aportar al estudio de los efectos del desarrollo municipal, la violencia y las condiciones socioeconómicas en las decisiones de votación para las elecciones presidenciales durante 1986-2014 y,
(ii) contribuir en el análisis de los resultados electorales a partir de patrones de votación mediante metodologías multivariadas y bayesianas basadas en índices electorales que permiten calcular una probabilidad de votación municipal.
La hipótesis principal que se plantea es la siguiente: la probabilidad de votar por candidatos de derecha se aumenta cuando las regiones no cuentan con medios de comunicación que informen a los votantes sobre el candidato, hay mayor acceso a educación, altos indicadores de desarrollo y niveles de violencia. Mientras que si los índices de pobreza y de población migrante son altos y los niveles de violencia y educación son bajos se aumenta la probabilidad de votación para candidatos de izquierda.
II. Metodología
Para realizar un análisis comparativo de las unidades estadísticas es necesario una metodología que contraste los individuos a partir de las variables continuas semejantes entre sí. De esta manera, podría afirmarse que las unidades se aparentan si producen similarmente el mismo tipo de resultado.
Por tanto, el análisis de componentes principales (ACP) es importante al utilizar representaciones geométricas para comparar individuos y estudiar relaciones entre variables de forma independiente. Lo anterior, interpretado como un mismo examen, ofrece la ventaja de posicionar puntos en sus respectivas nubes de puntos y no partir de una distribución de datos para realizar algún tipo de conjetura (Bécue et al., 2005).
Todo ello permite generar nuevas variables que expresan información del conjunto de datos original, reducir la dimensión del espacio contenido en los datos, eliminar aspectos que aportan poca información, facilita la interpretación de la información contenida en los datos, determina los factores que contengan la mayor variabilidad de los datos y permite que las nuevas variables generadas cumplan con la propiedad de independencia y no correlación (Pardo & Del Campo, 2007).
En el estudio basado en componentes principales (ACP) se elabora una matriz donde las columnas representan variables de valores numéricos continuos y las filas los individuos. En general, el objetivo es la búsqueda de un sub-espacio que se encuentre lo más cercano posible al conjunto original de datos, hecho que se logra maximizando la varianza general (Lebart et al., 2006). Para esto, es necesario obtener los valores y vectores propios de la matriz de covarianza o de correlación de los datos, donde el primer componente surge de la combinación lineal de las variables, usando como coeficientes el primer vector propio asociado al valor propio más alto. La notación usual es ACP (X, D, M) donde X representa la tabla de datos, mientras que D y M muestran las matrices de pesos para los individuos y las variables (Escofier y Pagès, 1992).
Para la construcción de un índice con esta metodología se realiza un ACP, asegurando que exista alta correlación entre las variables de interés con alguno de los ejes, que generalmente corresponde al primer eje y se selecciona el vector propio asociado a este.
El peso de cada variable en el índice corresponde a la participación del componente del vector propio asociado a la variable en la suma total de coeficientes. Finalmente, se construye el índice como la suma ponderada de estas variables de acuerdo con su peso.
A. Modelo de regresión beta bayesiano para la media y la precisión
Una variable aleatoria Y tiene función de densidad beta si:
donde p>0, q>0, Γ(.) representa la función gamma y I (0,1) (y) es la función indicadora que señala que esta variable sólo puede tomar valores en ese intervalo. Una reparametrización en términos de la media y la precisión (Cepeda, 2001; Ferrari & Cribari-Neto, 2004; Jorgensen, 1997) es posible si , lo que lleva a que la varianza sea .
A partir de esta reparametrización es posible definir un modelo beta doblemente generalizado (Cepeda, 2001), donde la media y la dispersión siguen la estructura:
donde β = (β 0 , β 1 , . . . , β k ) t y γ = (γ 0 , γ 1 , . . . , γ p ) t son los vectores del modelo de regresión para la media y la varianza, x i y z i son las variables de la media y la varianza para la i-ésima observación. En este caso, la escogencia de las funciones de enlace para (2) y (3) corresponde a que cumplen con las propiedades deseadas para que la estimación sea posible bajo la distribución beta, sin que sea necesario especificar alguna restricción en la estimación. De modo más específico, es necesario que la precisión sea positiva y que la media se encuentre en el intervalo (0,1). A pesar de esto, otras funciones de enlace son posibles.
Así, es posible ajustar un método bayesiano al modelo presentado previamente, asumiendo distribuciones normales independientes para las priors. Sin embargo, π (β, γ | data) es analíticamente intratable, por lo que se deben obtener muestras de las distribuciones posteriores condicionales de π (β | γ, data) y π (γ | β, data) a partir del algoritmo Metrópolis- Hasting. En este punto, se plantean funciones de kernel de transición para ambas distribuciones condicionales, de forma que la distribución posterior π (β | γ, data) corresponde a la distribución posterior condicional obtenida de la combinación de una distribución prior normal y la variable de trabajo dada por (4), asumiendo distribución normal, donde el superíndice c indica los valores actuales.
La función de distribución del kernel de transición para obtener muestras de la distribución posterior condicional π (γ β, data) corresponde a la combinación de la distribución prior normal de γ y la variable de trabajo dada por (5).
Entonces, dados los valores iniciales para los parámetros de la regresión, las muestras para sus distribuciones posteriores se obtienen aplicando el algoritmo iterativo presentado en Cepeda et al. (2012).
Para ambas variables de trabajo la elección de las priors sigue el estándar de la literatura bayesiana. Aunque es posible asumir otro tipo de prior, no existe ningún tipo de evidencia para aceptar otro tipo de distribuciones. Además, los cálculos se vuelven sumamente complicados, lo que no justifica su uso. En este caso se opta por un modelo bayesiano, pues de acuerdo con lo presentado en algunos estudios (Cepeda-Cuervo et al., 2016), el ajuste es más eficiente que el obtenido mediante la aproximación clásica y no hay evidencia empírica que muestre problemas de sesgo.
Valga anotar que una gran desventaja de este tipo de modelos frente a la aproximación clásica radica en que los procedimientos de post-estimación y ajuste de modelos no se encuentran tan ampliamente desarrollados. En la aproximación clásica, la mayoría de los análisis después de la estimación y residuales emplean toda la teoría de decisión y examen de residuos modificados, donde se incluyen modificaciones a los residuos teniendo en cuenta la matriz de información de Fisher (Ferrari et al. 2011).
Con todo, es posible calcular una pseudo matriz hessiana. Se determinará una vez que se cuenta con las estimaciones y no se utiliza para realizar la estimación como tal, con la que es posible obtener algunas medidas de influencia de datos atípicos. Por ende, en lo relativo al análisis después de la estimación este artículo se limitará a observar los ajustes bajo criterios de información, los resultados de los intervalos de credibilidad y los análisis de residuos estandarizados.
III. Datos utilizados y resultados
Con el propósito de construir una medida de tendencia de votación municipal, para este artículo se utilizaron los resultados electorales municipales por candidatos en las elecciones presidenciales colombianas entre 1986 y 2014 (Tabla 1). En las variables de control se consideraron los promedios de diferentes valores que reflejan el grado de desarrollo y la violencia en los diferentes municipios (Tabla 2). Así, se tienen los siguientes proxys de la situación de violencia en los municipios: la tasa de desplazamiento por expulsión por cada cien mil habitantes que sirve para conocer la presión demográfica en las regiones cuando existe desplazamiento, la tasa de homicidios por cada cien mil habitantes que permite mostrar el nivel de actividad delincuencial, los eventos Map/Muse que evidencian situaciones relacionadas con minas terrestres para mostrar formas de violencia entre grupos al margen de la ley hacia el Estado.
Año de elección | Nombre candidato | Partido | Código candidato |
---|---|---|---|
1986 | Virgilio Barco | Liberal | Bar86 |
Álvaro Gómez | Conservador | Gom86 | |
Jaime Pardo | Unión Patriótica | Par86 | |
1990 | César Gaviria | Liberal | Gav90 |
Álvaro Gómez | Movimiento de Salvación Nacional | Gom90 | |
Rodrigo Lloreda | Conservador | Llo90 | |
Antonio Navarro | Alianza democrática M19 | Nav90 | |
1994 | Antonio Navarro | Compromiso Colombia | Nav94 |
Andrés Pastrana | Conservador | Pas94 | |
Ernesto Samper | Liberal | Sam94 | |
1998 | Harold Bedoya | Fuerza Colombia | Bed98 |
Andrés Pastrana | Conservador | Pas98 | |
Noemí Sanín | Sí, Colombia | San98 | |
Horacio Serpa | Liberal | Ser98 | |
2002 | Luis Eduardo Garzón | Polo Democrático | Gar2 |
Noemí Sanín | Sí, Colombia | San2 | |
Horacio Serpa | Liberal | Ser2 | |
Álvaro Uribe | Primero Colombia | Uri2 | |
2006 | Carlos Gaviria | Polo Democrático | Gav6 |
Horacio Serpa | Liberal | Ser6 | |
Álvaro Uribe | Primero Colombia | Uri6 | |
2010 | Germán Vargas Lleras | Cambio Radical | Lle10 |
Antanas Mockus | Partido Verde | Moc10 | |
Rafael Pardo | Liberal | Par10 | |
Gustavo Petro | Polo Democrático | Pet10 | |
Noemí Sanín | Conservador | San10 | |
Juan Manuel Santos | Partido de la U | Sant10 |
Fuente: elaboración propia.
Variable | Código | Fuente de información | Periodo |
---|---|---|---|
Cobertura en Salud | CS | MPS | 2008-2010 |
Desplazamiento por expulsión | DE | DPS | 2005-2010 |
Homicidios | Hom | DANE/PONAL | 2005-2010 |
Eventos Map/Muse | EMM | PAICMA | 2000-2010 |
Índice de Pobreza Multidimensional | IPM | DNP | 2005 |
Analfabetismo | Ana | DNP | 2005 |
Mortalidad Infantil | MI | MPS | 2005-2010 |
Índice de Penetración de Internet | IPI | MINTIC | 2010 |
Necesidades Básicas Insatisfechas | NBI | DANE | 1993 y 2005 |
Gasto en inversión como porcentaje del gasto total | GI | DNP | 2000-2010 |
Fuente: Elaboración propia
Para el desarrollo municipal se utilizaron los siguientes proxys: el porcentaje de personas en el régimen de salud contributivo para mostrar las posibilidades que tienen los hogares de recibir atención en salud, el porcentaje de población en situación de pobreza desde una perspectiva multidimensional para exponer el nivel de desigualdad presente en la región, el porcentaje de población analfabeta indicará el nivel de población que no accede a educación y no tiene posibilidades de ejercer actividades de forma independiente, el número de niños menores de cinco años muertos por cada cien mil nacidos vivos que indica el grado de desarrollo en la atención a primera infancia en las regiones, el porcentaje de hogares con conexión a internet muestra el nivel de conectividad digital que tiene la población; el porcentaje de hogares que tienen al menos una necesidad básica insatisfecha y el gasto en inversión como porcentaje del gasto total, constatan las carencias de algunos servicios en la población y la proporción de recursos que tienen las regiones para ser utilizados en las necesidades de la población.
Se recurre a la metodología de ACP para el cálculo de un índice de tendencia de votación durante el periodo de interés, sobre la base de datos del porcentaje de votos por municipio obtenido por cada candidato en cada año (se utilizó el paquete FactoClass de R). De acuerdo con los resultados de sus correlaciones y su representación sobre el círculo de correlaciones, se identifican tres grupos de candidatos (Figura 1). El primer grupo corresponde a los candidatos (Tabla 1) Gom86, Gom90, Llo90, Pas94, Pas98, Uri2, San2, Uri6, Sant10, San10, Ram14 y Zul14, los cuales pueden ser identificados con tendencias políticas de derecha. El segundo grupo (Tabla 1) está compuesto por Bar86, Gav90, Sam94, Ser98, Ser2, Ser6, Par10 y Sant 14, todos candidatos liberales. El tercer grupo (Tabla 1) se conforma por Par86, Nav90, Nav94, Gar2, Gav6, Moc10, Pet10, Lop14 y Pen14, la mayoría de los cuales se identifican con tendencias de izquierda (Giraldo & Muñoz, 2014).
Los candidatos Bed98, San98 y Lle10 (Tabla 1) no quedaron clasificados en ninguno de los grupos, pero su contribución al total de votaciones y al índice era tan pequeño que tampoco constituyeron un grupo propio, por lo que quedaron por fuera de la construcción del índice.
A continuación, se realiza un nuevo ACP sobre cada uno de ellos y se construye un índice de votación municipal para cada grupo, que refleja la probabilidad de votación.
La Tabla 3 muestra estadísticas descriptivas de los datos y las Figuras 3, 4 y 5 ofrecen los resultados del índice para cada municipio dentro de la base de datos, de acuerdo a tres categorías: (i) probabilidad baja de votación que corresponde a índices entre 0 y 33 %; (ii) probabilidad media que corresponde a índices entre 34 % y 66 % y, (iii) probabilidad alta, que corresponde a índices superiores al 67 %. Se observa que los grupos 1 (Figura 5) y 2 (Figura 6) presentan la mayor probabilidad de votación, mientras que el grupo 3 (Figura 7) tiene una baja probabilidad de votación. Dada la baja probabilidad de votación por el grupo 3 y que los índices del grupo 1 y el grupo 2 tienen comportamientos inversos1, solo se ajusta el modelo beta bayesiano (Cepeda et al., 2013) para el grupo 1.
Grupo 1 | Grupo 2 | Grupo 3 | |
Mínimo | 0,06 | 0,02 | 0,01 |
1er cuantil | 0,26 | 0,23 | 0,05 |
Mediana | 0,35 | 0,38 | 0,08 |
Media | 0,37 | 0,38 | 0,09 |
3er cuantil | 0,48 | 0,51 | 0,12 |
Máximo | 0,7 | 0,81 | 0,38 |
Fuente: Elaboración propia
Se realizan pruebas de correlación (Tabla 4) entre las variables que se utilizarán en el modelo y se encuentra que la correlación más alta se presenta entre IPM y Ana e IPI y NBI, con una correlación cercana al 0,78, seguida por las correlaciones entre NBI y Ana de 0,66 y NBI e IPI con correlación de 0,60. En este caso, aunque las correlaciones entre Ana, NBI e IPM son mayores al 0,75, los gráficos de dispersión entre las variables (Figura 2) enseñan que las relaciones parecen ser más polinómicas que lineales cuando se considera IPM contra las otras dos variables y que existen municipios que no se ajustan completamente a una relación lineal cuando se analiza Analfabetismo contra NBI, pues hay datos atípicos y heteroscedasticidad en el gráfico de dispersión.
En vista de lo planteado, se consideran las variables porque estas diferencias obtenidas en los gráficos se interpretan como mediciones desde diferentes perspectivas de la información sobre el desarrollo municipal. De ahí que se estima más grave el problema de variable omitida que de correlación entre las variables explicativas. A pesar de esto, se debe tener en cuenta este aspecto a la hora de interpretar los resultados.
CS | DE | Hom | EMM | IPM | Ana | MI | IPI | NBI | GI | |
CS | 1,00 | -0,04 | 0,07 | -0,05 | -0,04 | 0,05 | 0,00 | 0,11 | -0,09 | 0,12 |
DE | -0,04 | 1,00 | 0,47 | 0,56 | 0,36 | 0,32 | 0,10 | -0,15 | 0,35 | -0,09 |
Hom | 0,07 | 0,47 | 1,00 | 0,45 | -0,01 | -0,04 | -0,02 | 0,04 | -0,04 | 0,03 |
EMM | -0,05 | 0,56 | 0,45 | 1,00 | 0,11 | 0,13 | 0,02 | -0,01 | 0,20 | -0,02 |
IPM | -0,04 | 0,36 | -0,01 | 0,11 | 1,00 | 0,78 | 0,21 | -0,60 | 0,78 | -0,19 |
Ana | 0,05 | 0,32 | -0,04 | 0,13 | 0,78 | 1,00 | 0,15 | -0,41 | 0,66 | -0,19 |
MI | 0,00 | 0,10 | -0,02 | 0,02 | 0,21 | 0,15 | 1,00 | -0,10 | 0,18 | -0,06 |
IPI | 0,11 | -0,15 | 0,04 | -0,01 | -0,60 | -0,41 | -0,10 | 1,00 | -0,45 | 0,06 |
NBI | -0,09 | 0,35 | -0,04 | 0,20 | 0,78 | 0,66 | 0,18 | -0,45 | 1,00 | -0,20 |
GI | 0,12 | -0,09 | 0,03 | -0,02 | -0,19 | -0,19 | -0,06 | 0,06 | -0,20 | 1,00 |
Fuente: elaboración propia.
Para el grupo 1, originalmente se ajusta un modelo según todas las variables (Tabla 2) tanto para la media como para la precisión y se contrasta con uno en el que se consideran todas las variables para la media y una precisión constante. Esto, con parámetros para las priors de medias de cero para la media y la precisión y varianzas de 100 para la media y 10 para la precisión, valores estándar asignados en la literatura para ejercicios con priors no informativas. En este contexto existe un mejor ajuste por criterios de información y análisis de residuos para el segundo modelo.
A partir de lo expuesto, se analiza este modelo con precisión constante, en el cual los intervalos de credibilidad mostraron que solo las variables IPM, Ana, IPI, NBI y GI son estadísticamente diferentes de cero (Tabla 5), por lo que se adecúa un segundo modelo excluyendo estas variables (Tabla 6) con el fin de observar su efecto en el ajuste. De acuerdo con los resultados de los criterios de información y los resultados de los ajustes de los residuos (Figura 3), se observa un mejor encaje en el modelo saturado, por lo que se escoge este último para los análisis y posterior interpretación.
Intercepto | -0,54 | 0,15 | -0,84 | -0,28 |
CS | 0,01 | 0,11 | -0,22 | -0,218 |
DE | 0,001 | 0,001 | -0,001 | 0,002 |
Hom | 0,001 | 0,001 | -0,001 | 0,002 |
EMM | 0,001 | 0,001 | -0,001 | 0,016 |
IPM | 0,56 | 0,2 | 0,13 | 0,96 |
Ana | -1,07 | 0,29 | -1,55 | -0,38 |
MI | 0,001 | 0,001 | -0,001 | 0,001 |
IPI | -3,5 | 0,88 | -5,07 | -1,87 |
NBI | -0,005 | 0,001 | -0,007 | -0,001 |
Inv | 0,31 | 0,055 | 0,17 | 0,42 |
Precisión | 1,92 | 0,082 | 0,34 | 2,65 |
AIC | 806,82 | |||
BIC | 860,38 | |||
N | 962 |
Fuente: elaboración propia.
Valor estimado | Desviación estándar | Intervalo de credibilidad | ||
---|---|---|---|---|
Intercepto | -0,41 | 0,075 | -0,57 | -0,26 |
Hom | 0,000 | 0,000 | -0,001 | 0,001 |
IPM | 0,414 | 0,14 | 0,14 | 0,69 |
Ana | -1,21 | 0,15 | -1,52 | -0,91 |
IPI | -4,09 | 0,72 | -5,44 | -2,74 |
NBI | -0,005 | 0,001 | -0,007 | -0,003 |
Inv | 0,34 | 0,04 | 0,26 | 0,42 |
Precisión | 2,44 | 0,08 | 2,28 | 2,65 |
AIC | 1642,61 | |||
BIC | 1676,69 | |||
N | 962 |
Fuente: elaboración propia.
A continuación, se le realiza un análisis de distancia de Cook (Figura 4), en donde se observan al menos tres individuos atípicos que influyen en las estimaciones que corresponden a los municipios de Boyacá-Boyacá, Argelia-Antioquia y Nutiscua-Norte de Santander. En el caso de Boyacá y Nutiscua se reconocen valores de mortalidad infantil muy alta, por encima del tercer cuartil, lo que influye enormemente en la distancia de Cook. En el caso de Argelia, este municipio tiene valores altos en eventos MAP/MUSE y desplazamiento, también por encima del tercer cuartil, hecho que afecta la distancia de Cook.
En ambos modelos se verifica una posible presencia de heterocedasticidad, lo que sugiere que sería interesante apreciar modelos que consideren varianza o incluir más variables para valorar si esta situación se origina por un problema de variables omitidas. A pesar de estos problemas, los resultados de ambos modelos indican que los municipios con mayor analfabetismo y necesidades básicas insatisfechas con menor cobertura de internet tienen una menor probabilidad de votar por el grupo 1. Sin embargo, municipios con mayor inversión como porcentaje del gasto total y mayor IPM tienen mayor probabilidad de votar por este grupo.
Por último, es significativo resaltar que los resultados obtenidos para el IPM son contrarios a los arrojados por las otras variables de desarrollo, por lo que estos deben ser interpretados con precaución. En lo que respecta a la violencia, no se observa un efecto significativo de ninguna de las variables que se utilizaron con proxy, por lo que la violencia no influencia la decisión de voto, lo cual es completamente contrario a lo esperado.
Discusión
La estrategia empírica utilizada en este artículo busca estimar la probabilidad de que un candidato asociado a un determinado partido político obtenga mayor votación, dados ciertos condicionantes regionales sugeridos por la literatura. Ahora bien, los resultados son producto de cálculos con diferentes variables relacionadas con desarrollo y violencia municipal que, por el tipo de método utilizado, requerían variables y series completas que para algunos casos no funcionaron hasta llegar a las estimaciones presentadas.
Las conclusiones de este estudio podrían cambiar al utilizar otras variables en áreas distintas del desarrollo y la violencia municipal. No obstante, el ejercicio se diseñó y se realizó con la mejor aproximación a los patrones electorales a la luz de las condiciones municipales de violencia y desarrollo, enfrentando el vacío existente en la literatura de elecciones con una metodología multivariada. El enfoque proyectado permitió revelar dos hechos importantes: por un lado, el nivel de violencia no influye en la probabilidad de votación y por otro, mayor acceso a educación y medios de comunicación conduce a elecciones más equilibradas para que los votantes puedan elegir al candidato de su preferencia.
En general, los resultados encontrados proporcionan evidencia a favor del mecanismo sugerido en el artículo, siendo robusto al controlar patrones y grupos de votación e indicadores de violencia y desarrollo. En todo caso, se pueden reconocer transformaciones de las variables o estimaciones que tengan en cuenta la influencia de datos atípicos en las variables explicativas, ya que en los modelos estimados se evidencia una posible presencia de heterocedasticidad. Esto se puede corregir con modelos que tengan en cuenta varianza o incluyan más variables para confirmar si esto se debe a una cuestión de variables omitidas.
Conclusiones
Los resultados de este artículo siguen la línea de los estudios para el caso de elecciones en Colombia realizados por Weintraub et al. (2015), Rozo y Vargas (2019), sobre la incidencia de los medios de comunicación en las preferencias de los votantes. Lo mismo, a Goodin y Klingemann (2001) con Leigh y Wolfers (2006), Arrow et al. (2008), Campbell et al. (2006), Bautista (2005) en términos de probabilidad de votación y desde el punto de vista multivariado aplicado a elecciones a Lincoln y Prior (1971), Rodrigues y Lima (2009), Pacheco y Bautista (1989), Marín-Jaramillo (2014).
Bajo este marco teórico y metodológico, el trabajo presentado explica la relación entre los resultados de votación de los municipios colombianos con su nivel de violencia y desarrollo. Se utilizó la metodología de análisis en componentes principales sobre datos de elecciones presidenciales en el periodo comprendido entre 1986 y 2014. Esta metodología permitió detectar tres grupos de candidatos y con ellos, crear un índice de votación para cada uno de estos grupos, utilizando nuevamente el análisis en componentes principales.
Una vez construidos estos índices, se realizaron mapas que permitieron comprobar que los grupos de candidatos con afiliaciones a políticas de derecha y los candidatos con afiliaciones al partido liberal tenían resultados de votación opuestos. En adición, en el caso de los candidatos cuyas posturas son más cercanas a la izquierda, existe una baja probabilidad de votación.
Posteriormente, se ajustó un modelo de regresión beta bayesiano para la media y la precisión, el cual mostró que, a menor educación y acceso a medios de comunicación por internet, mayor es la probabilidad de votar por los candidatos identificados con posturas de derecha y menor la probabilidad de votar por candidatos liberales. En lo que respecta al desarrollo aproximado desde las variables de necesidades básicas insatisfechas e índice de pobreza multidimensional, los resultados son ambiguos.
Sobre la violencia aproximada con la tasa de homicidios, no existe certeza que esta variable influya en las decisiones electorales municipales. Por tanto, se puede concluir que el incremento en la educación y la cobertura de los medios de comunicación puede llevar a obtener unas elecciones más equitativas entre los dos grupos de candidatos.