Introducción
Dentro del panorama de estudios sociovariacionistas de la morfosintaxis del español, uno de los temas que más ha ocupado a los especialistas es la variación del pronombre sujeto (Silva-Corvalán, 2001), por lo que se reconoce como una de las variables prototípicas de este nivel en ese enfoque teórico. Como muestran los ejemplos (1) y (2), el sujeto puede ser nulo o expreso en diversos contextos.
Sí / yo trabajé en (battanteh) bastante (patte:) parte/ cocinando. [CA-10-12M]1
No/ (rettaurante) restaurante no/ trabajé en casa (e) de familia. [CA-10- 2M]
Aunque la tradición gramatical sostiene que el español, excepto en los casos de ambigüedad y énfasis, no requiere la presencia del pronombre sujeto por tener explícita la marca de persona en la mayor parte de las terminaciones de los verbos conjugados (Alarcos, 1994), los estudios sociolingüísticos demuestran su carácter variable y la influencia específica o conjunta de factores estructurales, semánticos, pragmáticos y, en menor medida, extralingüísticos (Silva-Corvalán, 2001).
Blas (2005, pp.121-122) resume los principales factores asociados con la expresión de los sujetos pronominales (ESP) en español: a) el cambio de referencia con respecto al sujeto que le precede; b) los contextos en los que se hace necesario distinguir entre el sujeto y otras funciones sintácticas; c) el significado de ciertos verbos; d) el tiempo verbal; e) la necesidad de deshacer posibles ambigüedades en la morfología verbal; f) la expresión de información focal; g) la persona y el número gramaticales; h) la compensación funcional por la pérdida de /-s/ final de segunda persona en las variedades del español donde se produce este fenómeno; i) el cambio de turno conversacional; j) el énfasis expresivo; k) la tendencia a fijar el orden de palabras no marcado en español: sujeto-verbo-objeto, l) la existencia de diferencias paramétricas relevantes entre diversos dialectos del español; m) la influencia de una lengua de sujeto obligatorio como el inglés.
A pesar de la amplia bibliografía sobre el tema acumulada a lo largo de estos 40 años de estudios sobre esa variable (Carvalho et al., 2015), como resultado de las investigaciones desarrolladas en diferentes dialectos del español en América, en los Estados Unidos y en España, hay pocos trabajos sobre las variedades lingüísticas colombianas. Hasta hoy solo se registran trabajos sobre tres variedades: Barranquilla (Orozco, 2015; Orozco & Guy, 2008), Cali (Travis, 2005; 2007) y Medellín (Orozco & Hurtado, 2021). De esos trabajos, solo los de Barranquilla y Medellín analizan todos los pronombres sujetos, mientras que los trabajos sobre Cali investigan la ESP yo.
Vale mencionar también que, aunque cada vez los criterios metodológicos son más compartidos en las investigaciones, Silva-Corvalán (2001) ha cuestionado en varias ocasiones la confiabilidad de las comparaciones entre los estudios por las diferencias notorias entre los corpus, en los criterios seguidos en los análisis y en el problema de investigación. Esta debilidad fue una de las razones para proponer proyectos panhispánicos como el Proyecto para el Estudio Sociolingüístico del Español de España y América PRESEEA (Moreno, 1996), que no solo contempló la recolección de corpus con los mismos criterios metodológicos, sino también la aproximación a temas de investigación que compartan requisitos básicos comunes. Fue en ese marco que se creó el grupo de análisis de expresión del sujeto pronominal, el cual ofrece una guía con un mínimo de variables lingüísticas y sociales que deben analizarse en toda investigación que se realice con los corpus del PRESEEA (Guía del PRESEEA) sobre este objeto de estudio, para facilitar estudios contrastivos entre distintas comunidades de habla del español que generen mayor fiabilidad en sus resultados (Bentivoglio et al., 2011).
El objetivo es analizar los condicionantes sociolingüísticos que motivan la expresión del sujeto pronominal en el español hablado en tres variedades del Caribe colombiano, Cartagena, Barranquilla y Valledupar, cuyos corpus sociolingüísticos se recogieron en el marco del PRESEEA. De ese modo, se busca no solo contribuir a explicar el fenómeno en variedades poco o nunca exploradas, sino que también, al utilizar los corpus y seguir de cerca los criterios de codificación utilizados en la guía mencionada, se inserta en el marco del Proyecto Panhispánico y garantiza y facilita las comparaciones internas.
En relación con el español hablado en Colombia, la propuesta de clasificación dialectal más conocida y aceptada por los investigadores nacionales y extranjeros es la de Montes (1982), que, con base en un acercamiento geolingüístico, afirma que el español de Colombia puede agruparse en dos superdialectos, divididos a su vez en dialectos y subdialectos, como lo muestra la Tabla 1. Desde una perspectiva sociolingüística, Rodríguez-Cadena (2004) propone una clasificación diatópica intradialectal para la variedad caribeña del español de Colombia. La autora toma en consideración los fenómenos presentes, con mayor o menor intensidad, en todas esas variedades, para proponer tres subregiones como también se observa en la Tabla 1.
Siguiendo especialmente criterios fónicos y léxicos, y, en menor medida, morfosintácticos, ambas clasificaciones proponen variedades dentro del español caribeño colombiano, que quedan representadas, grosso modo, por los corpus de Barranquilla, Cartagena y Valledupar. De modo que su análisis genera no solo un conocimiento de los subdialectos, sino también una visión de conjunto del dialecto colombiano. Al mismo tiempo se revisa si, en lo que respecta a la expresión pronominal, también esta o estas variedades colombianas se comportan como el español antillano o caribeño en que las han incluido los dialectólogos (Henríquez, 1921; Zamora & Guitart, 1982); dialecto que se diferencia mejor en la tasa de PPS de otras variedades americanas y peninsulares (Cameron, 1993; Otheguy et al., 2007).
A partir de un estudio preliminar de algunas variables lingüísticas (Pérez & Camacho, 2019), se considera que las variedades estudiadas se van a incluir todas en el español caribeño, como se señaló también para Barranquilla (Orozco, 2015), y se van a comportar como un dialecto bastante uniforme en cuanto al fenómeno estudiado. Entre las contribuciones del trabajo se destacan las siguientes: resultados completos de todas las variables significativas que se codificaron según la Guía del PRESEEA, fiabilidad en el contraste de los resultados de las variedades analizadas y grado de confiabilidad para cotejar sus resultados con otras variedades estudiadas en el mismo marco, ampliación del trabajo de Barranquilla, al presentar resultados de varias comunidades de habla del Caribe colombiano, lo que ofrece una visión más panorámica de la expresión del sujeto de este dialecto colombiano.
Universo de investigación y procedimientos metodológicos
La variedad del español del Caribe colombiano en este estudio está constituida por los corpus colectados en tres ciudades de esa región colombiana: Barranquilla (Rodríguez, 2008-2010), Cartagena (Vásquez & Cuartas, 2017) y Valledupar (Calderón, 2005). Estos corpus fueron recolectados y transcritos bajo los criterios del PRESEEA (Moreno, 1996). El primer corpus tiene 72 informantes y los dos restantes, 54 cada uno, con un tiempo de duración por entrevista de 45 a 60 minutos. Las entrevistas son semiestructuradas y, en su mayoría, recogen diferentes secuencias textuales: narrativa, descriptiva, argumentativa, explicativa y dialogal2. La muestra del estudio está constituida por grabaciones de 54 informantes del Caribe colombiano, 18 por cada corpus. Esos informantes, seleccionados al azar del interior de su celda, están distribuidos según variables sociales preestratificatorias como se observa en la Tabla 2.
La Guía del PRESEEA (Bentivoglio et al., 2011) sugiere excluir los siguientes contextos, porque son oraciones de sujeto vacío u oraciones con sujeto tácito/ explícito obligatorio: i) con los verbos impersonales hacer y haber, ii) cláusulas con se impersonal, iii) oraciones relativas con sujeto relativizado, iv) expresiones idiomáticas, v) usos enfáticos con mismo(a), vi) sujetos focales3. Como en otros trabajos (Claes, 2011; Lastra & Martín, 2015), se excluyeron, además, las oraciones en tercera persona del plural impersonal, oraciones con sentido imperativo, marcadores del discurso y verbos en primera persona del plural incluyente, con la finalidad de circunscribir el estudio al contexto estrictamente variable donde pueda realizarse cualquiera de las dos variantes en oraciones con verbos finitos. Se seleccionaron de la segunda parte de cada entrevista los primeros 150 casos por hablante, para un total de 8200 casos, con el propósito de acercarnos al uso más "espontáneo" en una entrevista semiestructurada.
Esta investigación analiza 15 variables independientes, 4 sociales (ver Tabla 2) y 11 lingüísticas: 1) persona y especificidad del sujeto, 2) modo, 3) tiempo verbal, 2) modo, 3) tiempo verbal, 4) progresividad, 6) ambigüedad, 7) tipo de cláusula, 8) correferencialidad, 9) turno, 10) clase semántica del verbo4, 11) perseverancia5.
El análisis de regresión logística escalonada con predictores sociales fijos se realizó mediante la aplicación del Programa Rbrul (Johnson, 2009), que ofrece evidencia estadística en tres niveles de análisis: relevancia estadística del efecto, es decir, las variables que son significativas porque se enmarcan en el nivel máximo aceptable de desvío, que es de 0,05 y, por lo tanto, dotadas de razonable significancia (significance); el grado de alcance del efecto (range), entendido como diferencia entre el menor y mayor peso relativo, que determina la validad de los datos estadísticos, y la jerarquía de la influencia de las variables, definida por el orden de los pesos relativos en el interior de cada grupo de factores (Tagliamonte, 2006). Además, se determina el efecto de cada grupo de factores por variable con base en una lectura de pesos relativos de relevancia probabilística: cuanto mayor grado de influencia, más próxima de .99. El programa Rbrul permite analizar interrelación entre predictores, que se realiza en la investigación más amplia, pero por razones de espacio no se incluye aquí.
Con base en lo expuesto, este trabajo busca responder a las siguientes preguntas de investigación: (1) ¿Cuál es la distribución de la presencia y ausencia de los pronombres sujetos en el español del Caribe colombiano? (2) De los grupos de factores lingüísticos y extralingüísticos investigados, ¿cuáles son los que influyen significativamente en la expresión de los pronombres sujetos en el español del Caribe colombiano? (3) El dialecto estudiado, comparado con otros del español, ¿muestra semejanzas o diferencias en los índices porcentuales de expresión de los pronombres sujetos y en los grupos de factores significativos?
Resultados generales
La Tabla 3 muestra los porcentajes de presencia y de ausencia del PPS por cada variedad analizada y para el dialecto caribeño colombiano en conjunto. La aparente coherencia interna del dialecto -mostrada por la similitud en las tasas pronominales y en la selección de los principales factores lingüísticos, en un estudio contrastivo preliminar de los subdialectos (Pérez & Camacho, 2019)- se va a corroborar en este análisis de regresión logística por extenso con todos los predictores, en el que "subdialecto" fue descartado como significativo.
La distribución de las variantes presentada en la Tabla 3 refleja la predominancia de los sujetos nulos en las distintas variedades del español caribeño colombiano6, lo que confirma, en ese caso, la preservación del parámetro pro drop del dialecto (55.8 %), una característica paramétrica de la lengua española en general. La tasa de pronombres sujetos expresos (44.2 %) permite identificar lingüísticamente esta variedad directamente con el dialecto caribeño, como ya fue agrupado por dialectólogos (Henríquez, 1921), cuyas tasas de presencia de PPS superan el 30 % (Cameron, 1993; Otheguy et al., 2007). Esta afirmación se puede verificar en la siguiente comparación7 de los porcentajes de expresión del sujeto pronominal en distintas variedades recientemente investigadas del español americano y peninsular, presentada en la Tabla 4.
Los resultados de la Tabla 4 también confirman que el dialecto colombiano estudiado, por lo menos en términos porcentuales, se comporta como el español caribeño antillano (ECA) -Cuba, Puerto Rico, República Dominicana-, que se caracteriza por la tasa más elevada de sujetos pronominales de los dialectos continentales o de tierras altas de América (Iquique, Xalapa, Ciudad de México, Xalapa, Yucatán, Continentales) y peninsulares (Sevilla, Granada). La variedad de Barranquilla, única que se había estudiado en esta región colombiana, revelaba ya un comportamiento similar a los hallados aquí. A continuación, el análisis de grupos de factores lingüísticos y sociales que afectan la variable dependiente.
Predictores lingüísticos y extralingüísticos
El modelo estadístico para los predictores internos y externos aparece en la Tabla 5.
a) Persona y especificidad del sujeto8: el pronombre uno se presenta con alto porcentaje y elevado peso relativo (.80), sin alcanzar valores categóricos, lo que coincide con otros trabajos (Cameron, 1993; Lastra & Martín, 2015). Las segundas del singular favorecen en términos generales la presencia del sujeto pronominal; sin embargo, las no específicas (tú: .62; usted: .54) la favorecen mucho más que las específicas (tú: .50; usted: .53). Es importante aclarar que las diferencias son más evidentes en tú que en usted, pero debe matizarse cualquier generalización para el último por el bajo número de ocurrencias.
Estos resultados son similares a otros trabajos que hacen la distinción entre específico y no específico para esta persona (Cameron, 1993; Hurtado, 2001). Camerón (1993) había señalado tendencias opuestas entre los dialectos de San Juan y Madrid con respecto a la expresión de tú [-/^específico]. Aunque no han faltado críticas a las razones ofrecidas para tales diferencias (Silva-Corvalán, 2001), trabajos más recientes parecen confirmar parcialmente diferencias dialectales al respecto: algunas variedades favorecen la presencia en el uso específico (Manjón-Cabeza et al., 2016; Michnowicz, 2015) y otras favorecen la presencia en el uso no específico (Alfaraz, 2015; Hurtado, 2001; Pérez & Camacho, 2019). La primera persona del singular también favorece la presencia pronominal yo (.54), ubicándose después de uno, tú y usted entre las personas que mejor la favorecen, en concordancia con los trabajos sobre el español del Caribe antillano (Alfaraz, 2015, 2018; Cameron, 1993; Ortiz, 2016).
La tercera persona del singular no favorece la presencia pronominal él/ella (.41), resultados similares a trabajos que codifican separadamente los pronombres uno(a) y él/ella (Cameron, 1993; Cerrón-Palomino, 2014; Claes, 2011). La principal diferencia entre nuestros resultados y los de los trabajos en que este factor resulta significativo radica en que estos últimos agrupan la expresión pronominal por la desinencia verbal. En este último procedimiento, son la primera y la tercera del singular las que más favorecen la presencia (Lastra & Martín, 2015; Orozco, 2015), y se desplaza la segunda del singular, incluso como un factor no significativo. Las personas del plural también desfavorecen la presencia pronominal -ustedes (.48), ellos/as (.32), y nosotros/as (.25)- como con la inmensa mayoría de los trabajos. Las personas del plural siempre se disputan la posición entre los que más favorecen la ausencia, según las decisiones metodológicas de los investigadores. Cameron (1993) concluye que, si se conciben los sujetos plurales como conjuntos, se encuentra que el discurso está típicamente estructurado de modo que la gran mayoría de dichos sujetos ocurren en contextos donde los miembros del conjunto son inferibles o están presentes explícitamente dentro del discurso inmediatamente anterior. Tales contextos favorecen la expresión del sujeto nulo. Por lo tanto, los sujetos plurales suelen ser nulos en general.
Correferencialidad: los resultados corroboran la relevancia teórica de ese predictor como uno de los de mayor fuerza predictiva, además de constatar en los datos de la variedad caribeña una hipótesis ya confirmada en otros trabajos. La situación de cambio completo del referente favorece la presencia del pronombre (.67). Por otro lado, el mantenimiento del referente del sujeto de la oración anterior promueve claramente la ausencia del pronombre sujeto en la oración en análisis (.34). Cuando el correferente del sujeto de la oración analizada es un complemento de la oración anterior, se favorece sutilmente la ausencia del PPS (.48), quizá por el hecho de que esa relación contribuye a desambiguar el referente de la oración en estudio; sin embargo, contrasta con los resultados de Granada (Manjon-Cabeza et al., 2016) y Sevilla (Repede, 2019), donde es el factor que más favorece la presencia pronominal. Los valores encontrados en el peso son muy similares a los obtenidos en trabajos de otras variedades del español (Claes, 2011; Lastra & Martín, 2015; Orozco, 2015).
Perseverancia: este predictor ocupó la tercera posición en la jerarquía. Su poder predictivo en la expresión del sujeto pronominal indica que debe incluirse en los análisis de futuras investigaciones, ya que comienza a ubicarse entre las variables más significativas de los trabajos recientes que la incluyen (Orozco, 2015; Pérez, 2010). Los resultados muestran que un pronombre sujeto expreso en la oración anterior promueve el pronombre sujeto expreso en la oración analizada (.60); y un sujeto tácito promueve el sujeto nulo en la oración examinada (.43). Otros tipos de sujetos y oraciones (.47) tienden a no favorecer la ESP. Estos resultados son muy similares a los de la variedad de Barranquilla: pronombre (.62), otro (.49) y nulo (.45) (Orozco, 2015); lo que confirma la pertinencia de los tres factores para el predictor y el hecho de que sujetos expresos favorecen sujetos expresos, y nulos favorecen nulos. Así, en el español caribeño colombiano, la expresión pronominal del sujeto está motivada por el efecto perseverancia, un fenómeno que se extiende más allá de la ESP. Por otra parte, al ser los pronombres distintos los que favorecen la presencia, se evidenciaría la fuerza del cambio de referencia como predictor y su interrelación con perseverancia. Sin embargo, como en trabajos previos (Flores-Ferrán, 2004; Travis, 2005, 2007; Pérez, 2010), sujetos de la misma persona del singular, especialmente yo, también comienzan a favorecer la aparición.
d) Modo: en cuanto al modo, los resultados muestran que el indicativo tiene un efecto discreto en la expresión del PPS (.57), y la principal deducción es que los verbos en subjuntivo no constituyen un contexto favorecedor para la presencia del sujeto pronominal (.43). Estos resultados son equiparables a los de Ciudad de México (Lastra & Martín, 2015), aunque ellos incluyeron también el imperativo, que agruparon finalmente con el subjuntivo, lo que con seguridad contribuyó al efecto bastante negativo de expresión pronominal en lo que denominan "no indicativo". Concordamos con esos investigadores en que los resultados son consistentes con el uso regular del subjuntivo en oraciones subordinadas y, en consecuencia, con una probable correlación de corta distancia entre el sujeto y los elementos anteriores. Es necesario resaltar, sin embargo, que la gran mayoría de los casos tienen el verbo en modo indicativo (7703), en comparación con los verbos en subjuntivo (397); por eso, es muy probable que las formas indicativas predominen en todas las estructuras. Esas cuestiones necesitan ser profundizadas en futuros análisis detallados.
e) Tiempo verbal: en lo que respecta al tiempo, el futuro morfológico favorece moderadamente la presencia del PPS (.55) y escasamente la favorecen el presente (.53) y el imperfecto (.53), sin diferencias probabilísticas entre los últimos en variados análisis con Rbrul. El condicional tiene un efecto neutro (.51) y el futuro perifrástico (.45) y el pretérito (.42) desfavorecen la presencia pronominal. Otros trabajos presentan algunas constantes en cuanto a la ESP en los tiempos más recurrentes: el imperfecto a favorecerla, el pretérito a desfavorecerla y el presente ocupa una posición intermedia neutra (Claes, 2011; Lastra & Martín, 2015; Orozco, 2015; Repede, 2019); sin embargo, los agrupamientos de factores no siempre son idénticos. De ese modo, estos últimos coinciden en líneas generales con la propuesta de Silva-Corvalán (2001), para quien son la semántica y la pragmática de los diferentes tiempos verbales en el discurso lo que se correlaciona con la expresión del sujeto. Según la autora, dada la función pragmática del tiempo en el discurso, se podría esperar un número menor de sujetos con verbos del Tipo A (pretérito), y porcentajes que irían en aumento con los verbos de Tipo B (presente, ¿futuro?) y del Tipo C (imperfecto, condicional, subjuntivo). Esta predicción se basa en el presupuesto de que los pronombres sujetos expresados atraen la atención hacia el referente del sujeto y consecuentemente disminuyen la atención prestada al evento. Ya que las funciones de los tiempos propuestas son características del discurso narrativo, que es el tipo de discurso quizá más frecuentemente analizado, el examen de esa hipótesis requiere considerar variedad de géneros o tareas discursivas, cruzamiento y control de estas y de otros factores que tienen interrelación con la presencia del sujeto (Silva-Corvalán, 2001).
No obstante, es importante resaltar algunos aspectos: primero, pocos trabajos corroboran hasta ahora la mayor frecuencia de presencia del sujeto en variedades de géneros discursivos (Travis, 2007; Lastra & Martín, 2015; Repede, 2019), y la secuencia discursiva que se muestra significativa para la expresión del pronombre en una investigación no parece serlo en otra. Además, esas investigaciones no cruzan tiempo y género discursivo simultáneamente con la variable en estudio. Segundo, como los resultados de este y otros trabajos, los tiempos agrupados en un mismo tipo por Silva-Corvalán (2001) no tienen un comportamiento parecido en el favorecimiento o no de la presencia pronominal. Sin embargo, los cruzamientos y el control con el género y otros fuertes predictores propuestos siguen mereciendo revisión en los análisis.
f) Turno: este predictor se justifica por el hecho de que la retoma del turno en la entrevista sociolingüística fuerza al hablante a tornar explícito el sujeto pronominal y la permanencia del turno favorece la ausencia (Bentivoglio, 1987; Martínez, 2012; Manjón-Cabeza et al., 2016). Con una fuerza moderada en los cálculos de Rbrul, la hipótesis se corrobora en esta investigación: el cambio de turno favorece la expresión pronominal (.55) y el mismo turno la desfavorece (.45). Bentivoglio (1987) señala que al inicio de un nuevo turno, principalmente por interrupción del interlocutor, el hablante tiende a tornar explícito el pronombre (yo), porque deduce que el referente no está más disponible en el inventario mental del interlocutor y, consecuentemente, tiende a reestablecerlo. En su investigación sobre el comportamiento del pronombre tú y yo en el español de Madrid, Davidson (1996) argumenta que el uso de pronombres se debe a finalidades pragmáticas y metalingüísticas, entre las cuales se incluyen la negociación de turnos de habla y el involucramiento del hablante.
El cruzamiento de persona con cambio de turno muestra que la primera, segunda y tercera del singular favorecen la ESP en ese contexto. De todas las personas del singular, es la tercera la que especialmente más favorece la expresión pronominal (Pérez, 2019). Esos resultados están en concordancia con el análisis de uso de pronombres de tercera persona en la variedad de Caracas, que también seleccionó el cambio de turno como un factor significativo para la ESP (Martínez, 2012). Con toda seguridad, es la tercera del singular la que va a interrelacionarse con ese factor, porque, como demuestran estos datos y los de Caracas, las formas plurales no favorecen la ESP.
g) Clase semántica del verbo: el rango del predictor evidencia una fuerza moderada. Este efecto es similar al del trabajo sobre la tercera persona en Caracas (Martínez, 2012), pero difiere del resultado del trabajo sobre la primera persona en Caracas (Pérez, 2010); únicos trabajos que hasta ahora también utilizaron estrictamente la clasificación de ADESSE. Con otros trabajos que analizan la variable, comparte la selección como significativa (Bentivoglio 1987; Hurtado, 2001; Cerrón-Palomino, 2014; Orozco, 2015; Manjón-Cabeza et al., 2016). Excepcionalmente, no ha sido seleccionada como significativa en Ciudad de México (Lastra & Martín, 2015) y Yucatán (Michnowicz, 2015).
En los datos de la variedad aquí analizada, los factores que favorecen la presencia pronominal, aunque con una baja significancia, son los dicendi (.54) y los de proceso existencial (.53). Los de proceso mental (.51) y de proceso relacional (.50) tienen un efecto neutro. Los predictores desfavorecedores de la presencia pronominal son de modulación (.47) y de proceso material (.45), con claro efecto negativo en este último tipo. Estos resultados coinciden, groso modo, con los resultados de la variedad de Caracas, al agruparse las primeras y terceras personas. Aunque es necesario un análisis más profundo, cuando se comparan estos resultados con los trabajos que estudian la variedad de Caracas, hay indicios de una asociación entre ciertos factores de la semántica verbal y una persona específica para favorecer la ESP. El trabajo de Pérez (2010) sobre la primera persona seleccionó los siguientes factores como favorecedores de la presencia pronominal: de proceso verbal (.66) y de proceso mental (.52), y el factor que no contribuye para la presencia del pronombre es claramente el de modulación (.30). El trabajo de Martínez (2012) sobre la tercera persona seleccionó los siguientes factores como promotores de la presencia pronominal: de proceso existencial (.61) y de proceso mental (.54), y el factor que no contribuye para la presencia del pronombre es el de modulación (.43). Sin olvidar las personas que no incluyen los trabajos de Caracas, al agrupar ambos resultados hay similitudes en líneas generales con los resultados de esta investigación, que analiza todos los pronombres sujetos.
Las clasificaciones semánticas o léxicas de los verbos han resultado importantes en los estudios sobre la expresión del sujeto pronominal; sin embargo, no siempre los mismos tipos de verbos la favorecen, y recientes análisis de los verbos más frecuentes (Erker & Guy, 2012; Orozco, 2015) demuestran que verbos que se agrupan en un mismo factor se comportan de manera opuesta. Como la clasificación de ADESSE permite un análisis más detallado, en la medida en que los procesos se dividen en subprocesos, en Pérez (2019) se hizo un análisis de los subprocesos y se halló efectivamente que clases dentro de una macroclase se comportan de manera similar, pues todas sus clases favorecen o desfavorecen la expresión del sujeto, pero otras se comportan de manera opuesta. También el análisis de tasas de los verbos más frecuentes demostró que verbos dentro de una misma categoría se comportan de manera opuesta. Allí también se postula que la clase semántica o los verbos más frecuentes se correlacionan con la persona gramatical, lo que parece venir demostrándose en un reciente análisis pormenorizado de los verbos (Orozco & Hurtado, 2021).
h) Morfología verbal: los trabajos del PRESEEA han analizado aisladamente este predictor (Lastra & Martín, 2015; Manjón-Cabeza et al., 2016; Repede, 2019), pero al no mostrarse significativo, no se incluyó en los análisis de regresión logística. En este trabajo tuvo un comportamiento moderadamente significativo, según los cálculos de Rbrul. Los resultados muestran que los tiempos compuestos tienden a favorecer los sujetos pronominales expresos (.54), en cuanto los tiempos simples revelan un efecto en sentido contrario (.46). Por los resultados de San Juan (Claes, 2011) y de Barranquilla (Orozco, 2015), en que los (perfectos) compuestos no favorecen la expresión pronominal o tienen un efecto neutro, respectivamente, este factor parece no evidenciar un efecto similar en las diversas variedades.
i) Ambigüedad morfológica: fue la última variable lingüística seleccionada con un ligero poder predictivo, como ha ocurrido en el estudio de la tercera persona en Caracas (Martínez, 2012); sin embargo, ya resultó bastante significativa en muchos trabajos sobre expresión del sujeto (Cerrón-Palomino, 2014; Lastra & Martín, 2015; Michnowicz, 2015; Manjón-Cabeza et al., 2016, Repede, 2019). En este trabajo, la ambigüedad morfológica ligeramente favorece la presencia pronominal (.53) y los casos de no ambigüedad la desfavorecen (.47). Estos resultados coinciden con el estudio de la tercera persona en Caracas (Martínez, 2012). La ligera significancia en casos de ambigüedad morfológica y las evidencias de otros trabajos que muestran un efecto más claro de ese factor cuando se analiza la ambigüedad morfológica y textual juntamente (Bentivoglio, 1987; Hurtado, 2001; Pérez, 2010) indican que está interrelacionado con la correferencia (Pérez, 2019).
j) Sexo del hablante: es el predictor externo con mayor rango, aunque con efecto moderado en el modelo. Como se muestra en la Tabla 5, ser mujer es un factor que favorece ligeramente la presencia del PPS (.54) y ser hombre la desfavorece (.46). Estos resultados son similares a los hallados para otras variedades en trabajos recientes que presentan peso probabilístico (Alfaraz, 2015; Orozco; 2015; Pérez, 2010) y también en trabajos que solo exponen porcentajes (Lastra & Martín, 2015; Repede, 2019). Estos resultados requieren la discusión del papel de la mujer en el uso de la expresión pronominal del sujeto.
Labov (2001) analiza el papel de las mujeres en la variación y el cambio lingüísticos para reformular lo que denominó "paradoja del género", que está relacionada con el prestigio y la innovación. Según Labov (2001), cuando se trata de cambios con conciencia social, desde arriba, las mujeres utilizan más las formas de prestigio que los hombres; pero cuando se trata de cambios sin conciencia social, desde abajo, son las mujeres las que usan más frecuentemente las formas innovadoras, es decir, presentan un comportamiento innovador y menos conformista con las normas que no son abiertamente prescritas. Los resultados de este trabajo, aunque con reservas motivadas por los índices de frecuencia, parecen indicar que las mujeres estarían liderando el cambio en ese sentido, lo que encuentra una explicación cuando se considera que la expresión del pronombre, incluso teniendo el uso recomendado en ciertos contextos por la tradición gramatical, no es una variante estigmatizada en la amplia comunidad de habla hispánica. Según Labov (2001), un análisis más adecuado de los cambios liderados por las mujeres debe relacionar la variable género con el estatus social, correlación que no fue posible analizar en esta investigación y que podría contribuir a comprender mejor los datos a la luz de los postulados labovianos.
k) Nivel educativo: no se registra ningún trabajo sobre una variedad monolingüe que revele influencia de este predictor en la presencia o ausencia del pronombre sujeto; tampoco se mostró significativo en la comunidad bilingüe de Nueva York (Otheguy et al., 2007). En este trabajo fue seleccionado en el modelo, aunque con escasa fuerza. Los datos evidencian influencia mínima en los niveles primario (.52) y secundario (.51), casi neutro en este último, para la presencia pronominal; y una influencia más definida en el nivel superior a desfavorecer la expresión del pronombre (.47). Como si el contacto con la variedad estándar, mucho más fuerte en la formación superior, estuviese generando cierto control sobre la ESP. Aunque no haya sido seleccionada en el modelo estadístico, solo en Ciudad de México (Lastra & Martín, 2015) se presentan porcentajes para nivel educativo: primario (24.2 %), secundario (20.9 %) y superior (20.1 %). Esos resultados sugieren un agrupamiento diferente al aplicado en este trabajo, de modo que es el nivel primario el que mejor contribuye a la presencia pronominal, más que los niveles medio y superior; lo que parece ser una influencia sutil de la lengua estándar, que se adquiere en la escuela. La limitada significancia de las variables sociales en la expresión del sujeto pronominal es una constante en la literatura lingüística en español (Silva-Corvalán, 2001).
Discusión y conclusiones
En esta investigación se aplicaron a las variedades del Caribe colombiano (Barranquilla, Cartagena y Valledupar) prácticamente las mismas hipótesis y preguntas de investigación sobre la ESP de la Guía del PRESEEA. Los resultados ampliarían el conocimiento sobre la ESP al develar las semejanzas o las diferencias (o ambas) entre los subdialectos del Caribe colombiano y en relación con otros dialectos de lengua española en América y en España, sometidos al mismo marco metodológico. En caso de que los grupos de factores trascendieran las diferencias dialectales, esa situación contribuiría en la postulación de un comportamiento general de la lengua española. Con fundamento en lo expuesto, este trabajo sometió la variable ESP a una serie de procedimientos metodológicos basados en datos estadísticos que sirven para verificar la motivación interna y externa de sus dos variantes, presencia o ausencia del pronombre, y que tienen como finalidad última responder a tres preguntas de investigación.
En respuesta a la primera pregunta, (1) sobre la distribución de la presencia y ausencia de los pronombres sujetos en el español del Caribe colombiano, este estudio confirma que las variedades estudiadas de Barranquilla, Cartagena y Valledupar se comportan como un dialecto coherente en cuanto a la expresión del sujeto pronominal, ya que el análisis de regresión logística excluyó el predictor subdialecto. En ese sentido, se corrobora la hipótesis propuesta en un análisis contrastivo preliminar (Pérez & Camacho, 2019), que mostraba similitud en tasas y grupo de factores significativos entre los subdialectos. Por esta razón, se presentaron resultados generales para el español caribeño colombiano. Las tasas pronominales generales (44.2 %) revelan que el dialecto caribeño colombiano se comporta como el español caribeño antillano (ECA) y se diferencia claramente de otros dialectos americanos y peninsulares. El hecho de recaer sobre las dos personas del discurso, tú -especialmente el tú no específico- y yo respectivamente, el mayor grado de incidencia de presencia pronominal y la alta tasa de uno son otros de los factores que refuerzan un comportamiento similar al ECA, según lo planteado por estudiosos de esta variedad (Ortiz, 2016). Por otra parte, si se comparan las tasas con Medellín, otra variedad colombiana estudiada, se observa vigencia en la propuesta de clasificación dialectal del español en Colombia (Montes, 1982).
En respuesta a la pregunta (2), sobre qué grupos de factores lingüísticos y extralingüísticos ejercen influencia significativa en la expresión de los PPS en el español del Caribe colombiano, se revela la siguiente jerarquía de predictores que favorecen la presencia y la comparten con uno de los subdialectos ya estudiado, el de Barranquilla: persona y especificidad del sujeto > correferencialidad > perseverancia > modo > tiempo verbal > turno > clase semántica del verbo > sexo/género > morfología verbal > ambigüedad morfológica > nivel educativo. Los primeros y más significativos predictores tienden a coincidir con muchas comunidades de habla hispana y ejercen casi la misma fuerza en peso relativo.
En cuanto a los criterios morfosintácticos, las personas del singular, uno, tú, usted y yo, el modo indicativo, los tiempos futuro morfológico, presente, imperfecto, los tiempos compuestos y las formas morfológicamente ambiguas favorecen la presencia del pronombre. En cuanto a condicionamientos semántico-discursivos, los tipos dicendi y existencial, los sujetos inespecíficos, el cambio de referencia, el cambio de turno y la presencia pronominal en el sujeto de la oración anterior favorecen la presencia del sujeto. En cuanto a los predictores sociales, el sexo/género fue el que mejor se mostró como favorecedor de la presencia del sujeto, que parece también ser el factor que mejor se puede apreciar probabilística o porcentualmente en varios dialectos estudiados, lo que podría ser una primera constante entre las variables externas. Y para el nivel educativo, lo que queda más definido es que el superior no favorece la presencia pronominal, quizá como resultado del efecto de la formación en el uso de la variedad estándar.
Al cruzar las variables, se puede observar que persona, correferencia y perseverancia se interrelacionan entre ellas y con otras variables de efectos moderados, lo que ratifica la fuerza del efecto de estos predictores sobre la variable dependiente. Por ejemplo, un factor con baja fuerza, como ambigüedad morfológica, adquiere alta significancia cuando se cruza con cambio de referente. Esa expresividad parece demostrar que son los factores de naturaleza textual y pragmática los que convergen para resaltar la relevancia que no es posible detectar en un análisis aislado de la variable. Por su lado, el efecto de los predictores sociales en la ESP permite inferir que esas macrocategorías probablemente no revelan, con la claridad necesaria, cómo las características sociales y contextuales contribuyen a la presencia pronominal. Es posible que esa sea la principal razón por la cual los factores sociales no se muestren significativos en muchas de las investigaciones sobre el ESP o quizá la principal razón por la que un solo grupo haya sido seleccionado como más significativo por el programa estadístico.
Por último, los resultados obtenidos ofrecen una respuesta positiva a la pregunta (3) sobre posibles semejanzas y diferencias entre la variedad estudiada, el español caribeño y otras variedades del español, en términos de frecuencia de tasas de presencia de PPS y de predictores. En efecto, los resultados muestran no solamente la existencia de semejanzas con el español caribeño en relación con las tasas y la posición del sujeto pronominal, sino también en relación con los predictores más significativos y con factores específicos que parecen ser más recurrentes en los dialectos antillanos. Se resalta, además, que los resultados de los predictores y factores asimismo indicaron considerable convergencia con el comportamiento de los diferentes dialectos del español, lo que parece un indicio significativo de superación de límites dialectales o una evidencia de una gramática subyacente a todas las variedades del español. De esa manera, la expresión del PPS en las variedades del Caribe colombiano apunta a una atenuación del parámetro pro-drop, que parece gobernar el español general, lo que permite también rechazar el principio postulado por la tradición gramatical en lengua española, que, fiándose en la rigidez del parámetro pro-drop, reafirma razones más estilísticas que morfosintácticas para las situaciones de expresión del PPS.