INTRODUCCIÓN
Las caseínas son las proteínas más abundantes de la leche y representan el 80% de las proteínas lácteas (Kaskous 2020; Martien et al. 1994). Estas se agrupan en αS1-caseína (α -CN), aS2-caseína (α -CN), β-caseína (P-CN) y K-caseína (k-CN) (Broyard y Gauchieron 2015; Rehan et al. 2019). El perfil de caseínas de las razas bovinas especializadas en producción de leche ha sido mejorado genéticamente, lo que ha aumentado los rendimientos en productos como queso y leches ácidas. Así, la industria alimentaria obtiene el máximo beneficio cuando emplea como materia prima leche de buena calidad con valores elevados de proteína (Solarte et al. 2011; Wedholm et al. 2006).
Sin embargo, es importante considerar que el consumo de leche de vaca está asociado con una mayor incidencia de enfermedades en humanos (Aune et al. 2015; Clarke y Trivedi 2014; Miluchová et al. 2013). Al final de la década de 1990, algunas investigaciones sugirieron que el consumo de la variante A1 de la β -caseína, presente en la leche de vaca, es un factor de riesgo de diabetes mellitus tipo 1, cardiopatía isquémica, síndrome de muerte súbita del lactante (Sids), aterosclerosis, autismo, esquizofrenia y alteraciones del funcionamiento neurológico (Bekuma y Galmessa 2019; Jaiswal et al. 2014; McLachlan 2001; Sun et al. 2003). Se ha determinado que la variante A1 de la β -caseína produce el péptido bioactivo beta-casomorfina-7 (BCM-7) mediante el proceso de digestión. Este heptapéptido atraviesa las microvellosidades intestinales y sistémicamente conduce al desarrollo de las enfermedades mencionadas (Jaiswal et al. 2014; Jianqin et al. 2016).
En virtud de lo anterior, se resalta la importancia de realizar investigaciones encaminadas a conocer la genética de los hatos bovinos y su relación directa con la composición de las proteínas lácteas, tanto para mejorar la producción de quesos y leches ácidas, como para mejorar la calidad sanitaria de la leche que conduzca al consumo de productos lácteos inocuos para la salud humana.
Diversos estudios realizados en ganado bovino lechero demuestran la utilidad de usar marcadores genéticos para mejorar características productivas de importancia económica como una forma de ayudar en la selección de caracteres cualitativos y cuantitativos de animales de alto desempeño. Estos marcadores aportan información sobre la identificación, distinción y estimación de distancias genéticas entre poblaciones, líneas puras e híbridos (Dias et al. 2009).
El objetivo de esta investigación fue evaluar la diversidad y estructura genética de 5 SNP de caseínas de la leche, obtenidos con chips genómicos en vacas y toros de raza Holstein en Antioquia (Colombia).
MATERIALES Y MÉTODOS
Esta investigación fue realizada en la región lechera del departamento de Antioquia, que cubre zonas de bosque muy húmedo montano bajo (bmh-mb), con una temperatura que oscila entre 12 y 18°C y un promedio anual de lluvias entre 2000 y 4000 mm/año, en una faja altimétrica de 1800 a 2800 m s. n. m. Esta investigación fue avalada por el Comité de Ética en Investigación de la Universidad Nacional de Colombia, sede Medellín, considerando que cumple con los estándares para este tipo de investigación (número de la carta de aprobación: cemed-015, 2012).
Extracción de ADN
La muestra incluyó 113 animales de la raza Holstein: 86 muestras de sangre provenientes de vacas y 27 muestras provenientes de semen de toros comerciales. Para el primer grupo se colectaron 5 ml de sangre periférica en tubos al vacío con Edta como anticoagulante y se almacenaron a 4°C hasta su procesamiento. Posteriormente, se realizó la extracción de ADN mediante el método DNeasy Blood & Tissue Kit. Para la extracción de ADN, a partir de semen, se compraron pajillas comerciales de 250 y 400 μl y se empleó el método QIAamp® DNA Mini Kit, Protocol 1, para la obtención del material genómico.
Genotipificación de animales con chips de alta densidad
Las pruebas de genotipificación fueron realizadas en un laboratorio especializado de la Universidad de Milán (Italia). Para la genotipificación se usaron 2 beadchips de Illumina (Illumina Inc., San Diego, CA) de diferente densidad: el beadchip BovineHD, que contiene 777.962 marcadores, y el chip BovineSNP50 v2, con 54.609 marcadores. Con el chip SNP50 v2 fueron genotipificados 65 animales y, con el beadchip HD, 48. Después de aplicar el control de calidad (call rate > 0,90), fueron seleccionados 5 SNP comunes en los 2 beadchips para la realización de este estudio. La edición de los genotipos fue realizada con los programas SAS v9.1 y PLINK 1.9. Los animales genotipificados fueron muestreados en 8 municipios de 3 zonas diferentes del departamento de Antioquia (norte, centro y oriente) y un grupo denominado extranjero, que corresponde a los toros élite provenientes de diferentes países del mundo y que son ampliamente usados en el departamento de Antioquia (tabla 1).
Selección de marcadores
Los 5 SNP seleccionados para realizar el presente estudio fueron asociados con las proteínas mayoritarias de la leche (αS1-caseína, αS2-caseína, β-caseína y K-caseína), de acuerdo con los resultados obtenidos por Schopen et al. (2011) y Fang et al. (2019) (tabla 2).
Análisis genético
La frecuencia de los diferentes alelos f(A) y f(B) se realizó determinando la proporción de cada forma del gen entre el número de copias totales de la población en estudio. Se identificaron los homocigóticos (2 copias del mismo alelo) y los heterocigóticos (1 copia de cada alelo) y se calculó la frecuencia F de cada alelo contando los homocigóticos y añadiendo la mitad de los heterocigóticos, según el método descrito por Hartl (2000).
A partir de las frecuencias alélicas f(A) y f(B) y genotípicas f(AA), f(AB) y f(BB) de los 5 SNP, se determinó la deficiencia o exceso de heterocigotos para el locus en cada población y para la población total con la prueba exacta de Hardy Weinberg (HW), según Guo y Thompson (1992). La diversidad genética se determinó mediante la comparación de la heterocigosidad observada (HO) y la heterocigosidad esperada (He) entre las poblaciones para los 5 SNP seleccionados (Guo y Thompson 1992). La estructura genética se calculó mediante los estadísticos F de Wright: FIT, que corresponde a la endogamia global; FIS, que mide la subdivisión intrapoblacional; y el FST, que mide la subdivisión poblacional (Wright 1969). Esta se calculó tanto para la población global como para las subpoblaciones, utilizando para esto, el análisis de varianza molecular (amova), que permite analizar la variación entre, y dentro de, poblaciones con su respectiva significancia estadística, bajo la hipótesis nula de que los alelos o genotipos tienen la misma distribución en todas las subpoblaciones. También se determinó el flujo génico (Nm) como lo describe Provine (2001).
Todos los análisis de frecuencias alélicas y genotípicas, estructura genética y diversidad genética fueron realizados usando el programa GenAIEx 6.501 (Peakall y Smouse 2012).
RESULTADOS
Los alelos A y B para los SNP BTA-32346-no-rs y ARS-BFGL-NGS-15809 presentan una frecuencia alélica muy diferente en cuanto a la población global y las subpoblaciones (tabla 3). Para los alelos A y B del SNP BTA-77380-no-rs en la población global, las frecuencias fueron 0,08 y 0,92, respectivamente; mientras que para el SNP BTB-00821654 en la población global para los alelos A y B fueron 0,05 y 0,95.
Las frecuencias genotípicas mostraron que el genotipo de mayor ocurrencia en la población global es el BB y el de menor frecuencia es el AA en los SNP ARS-BFGL-NGS-15809, BTA-77380-no-rs y BTB-00821654, mientras que el genotipo más frecuente en los SNP ARS-BFGL-NGS-8140 y BTA-32346-no-rs es el AB. La frecuencia del genotipo AB para el SNP ARS-BFGL-NGS-8140 en la población global fue 0,48, que corresponde a una mayor cantidad de animales heterocigotos en la población. Por último, para el SNP BTB-00821654, el genotipo predominante en la población global fue el BB, con una frecuencia genotípica de 0,91 (tabla 4).
En el análisis genético para los 5 SNP, se determinó que la mayoría de las sub-poblaciones se encuentra en equilibrio de Hardy Weinberg (p > 0,05), a excepción de las subpoblaciones norte y oriente, específicamente para las regiones BTA-32346-no-rs y BTB-00821654, respectivamente (p < 0,05) (tabla 5).
Chi-cuadrado (x2) tabulado para 1 grado de libertad = 3,8415. *Significativo: p ≤ 0,05.
Fuente: elaboración propia.
La heterocigosidad observada (HO) y esperada (He) mostraron valores similares para cada SNP, excepto para BTA-32346-no-rs, en el que los valores de Ho y He fueron significativamente diferentes (p < 0,05) (tabla 6). En cuanto a la heterocigosidad total (HT), se tiene que es alta para los SNP ARS-BFGL-NGS-8140 y BTA-32346-no-rs, con valores de 0,47 y 0,45, respectivamente. Esto indica que el número de individuos heterocigotos en las subpoblaciones estudiadas es alto. Además, estos 2 SNP presentan un número efectivo alto de alelos (1,86 y 1,79, respectivamente). Para los 3 SNP restantes ARS-BFGL-NGS-15809, BTA-77380-no-rs y BTB-00821654, las heterocigosidades son bajas (0,13, 0,14 y 0,09 respectivamente, al igual que el número efectivo de alelos (1,15, 1,17 y 1,10, respectivamente).
N: tamaño de la muestra, Ne: numero efectivo de alelos, HO: heterocigosidad observada, He: heterocigosidad esperada, HT: heterocigosidad total. *Significancia estadística: p ≤ 0,05.
Fuente: elaboración propia.
Finalmente, según el estadístico FST, la población global posee una baja estructura genética, como se puede observar en la tabla 7, con valores que oscilan entre -0,002 y 0,041, a pesar de que se evaluó una subpoblación de toros extranjeros.
DISCUSIÓN
En la selección genética, muchas frecuencias alélicas y genotípicas cambian significativamente, alterando la estructura genética de las poblaciones, hasta el punto de que algunas variantes se fijan en la población, mientras que otras desaparecen en un tiempo menor al que lo harían en condiciones naturales (Melka y Schenkel 2012). Entre los genes que más han mostrado cambios en sus frecuencias alélicas en las razas bovinas se encuentran los que expresan las caseínas de la leche (CSN1S1, CSN1S2, CSN3 y CSN2), los cuales codifican para αS1-caseína, αS2-caseína, K-caseína y β-caseína, respectivamente. La β -caseína forma parte del pool de caseínas de la leche y se conocen 13 variantes proteicas codificadas por el gen CSN2; por ello, es el más polimórfico entre los genes que codifican proteínas lácteas. Las variantes más comunes en ganado Holstein para la β -caseína son A1 y A2. La frecuencia del alelo A1 en diferentes razas varía entre 0,06, en la raza Guernsey; 0,3-0,4, en la raza Holstein; y 0,72, en Danish Red (Kaminski et al. 2007). Solarte et al. (2011) encontraron un valor de 0,12 en un hato colombiano de raza Holstein para el alelo A1. En un estudio realizado por Ramesha et al. (2016), se encontró una frecuencia para el alelo A1 de 0,169 en la raza Holstein, también más baja que la reportada por Kaminski et al. (2007). Esto se debe muy posiblemente a que los toros sementales usados en la actualidad son genotipificados para este gen, por lo que se conocen sus formas alélicas; los toros seleccionados son aquellos con la forma alélica tipo A2 (Ramesha et al. 2016). En la presente investigación se analizó el SNP BTA-77380-no-rs asociado a β -caseína como lo reportan Schopen et al. (2011) y se determinó una frecuencia alélica, para el alelo A, de 0,08 y una de 0,92 para el alelo B. Este SNP está igualmente ubicado en el cromosoma 6, cercano al gen CSN2 que codifica para β -caseína (BTA6, posición 85449173-85457867), por lo que se sugiere que presenta frecuencias alélicas para los alelos A/B, cercanas a las variantes alélicas A1/A2 del gen CSN2 y se asume desequilibrio de ligamiento.
Es importante tener en cuenta que el consumo de leche tipo A1 (con presencia de β -caseína A1) está asociado a varias enfermedades en humanos (Jianqin et al. 2016; Kaskous 2020; Küllenberg et al. 2019; Laugesen y Elliott 2003). Por su parte, la forma A2 de la β -caseína ha sido asociada a disminución de colesterol total y disminución de la concentración de cLDL, las cuales forman un rol importante en la prevención de un amplio rango de enfermedades vasculares en humanos (Hanusová et al. 2010; Kaminski et al. 2007). Por lo anterior, es beneficioso que la frecuencia de la β -caseína A2 se incremente en la población (Kaskous 2020).
La K-caseína, por otro lado, juega un papel clave en la formación, estabilización y agregación de las micelas de caseínas de la leche, un aspecto importante en la industria quesera. En este sentido, los polimorfismos del gen CSN3 han sido usados en la selección asistida por marcadores moleculares para mejorar las características de la leche requerida en la producción de queso (Alipanah et al. 2007). Por ejemplo, el alelo B del gen CSN3 (cromosoma 6, posición 85645780-85658911), se asocia con resistencia térmica, menor tiempo de coagulación, micelas de diferentes tamaños, mejores cuajadas (Azevedo et al. 2008), mayor producción de proteínas y mayor producción de quesos (Patel et al. 2007). Garcia et al. (2009), reportaron una frecuencia de 0,173 para el alelo B, similar a la reportada por Ashraf et al. (2016), quienes obtuvieron una frecuencia de 0,20 para el mismo alelo. En este sentido, la frecuencia del alelo A es en promedio 4 veces mayor, considerando que el objetivo de la selección genética en la raza Holstein en muchos países, ha sido aumentar volúmenes de leche, más que mejorar las características composicionales de la misma, contrario a lo que sucede en otras razas como la Jersey (Ren et al. 2011; Zepeda et al. 2015).
Al evaluar la frecuencia alélica para el SNP BTB-00821654 en esta investigación, se obtuvo una frecuencia baja para el alelo A, de 0,05, por lo que se sugiere que es un alelo con tendencia a desaparecer por deriva genética. Posiblemente, este polimorfismo se asocie a los cambios realizados para mejorar los rendimientos en la composición de las proteínas lácteas, en este caso para K-caseína, como lo evidenciaron Schopen et al. (2011).
Por otro lado, la leche que contiene una mayor proporción de las isoformas α -caseína y α -caseína con menor grado de fosforilación posee mejores propiedades de coagulación para hidrolizar dichas isoformas más eficientemente por quimosina durante la elaboración de queso (Bijl et al. 2014). Además, las concentraciones de las isoformas de α -caseína y α -caseína en la leche varían considerablemente entre las vacas, por lo que es de gran interés evaluar la variación genética de las isoformas de α s1-caseína y α s2-caseína (Fang et al. 2017).
En una investigación realizada por Solarte et al. (2011), se determinó que la frecuencia para el alelo A de α s2-caseína presentó un valor de 0,99, lo que indica que este alelo está fijado en la población estudiada. En la presente investigación, la frecuencia para el alelo A del SNP ARS-BFGL-NGS-8140, asociado a α -caseína (Fang et al. 2017), fue de 0,63, indicando igualmente que está fijado en la población.
Por otra parte, en este estudio fueron determinadas la Ho y la He. Para el SNP BTA-32346-no-rs, asociado a α -caseína, se determinó un valor de Ho de 0,50 y de He de 0,44, valores que son significativamente diferentes (p < 0,05). Esto indica que hay diversidad genética entre las subpoblaciones para dicho polimorfismo. Además, la frecuencia de genotipos AB es alta y, por lo tanto, el número efectivo de alelos (Ne) tiende a ser cercano a 2 (Ne = 1,79). En un estudio realizado por Solarte et al. (2011), en una población de ganado Holstein colombiano, se determinó un valor de He de 0,40 y de Ho de 0,38 para el gen α s1-caseína (cromosoma 6, posición 85411601-85429256), resultado similar al obtenido para la presente investigación para los 2 polimorfismos evaluados. Por otra parte, los valores de Ho y He para el SNP BTA-77380-no-rs, asociado al gen de β-caseína, fueron 0,15 y 0,14. Estos resultados son similares a los reportados por Solarte et al. (2011), quienes determinaron valores de Ho de 0,21 y de He de 0,16.
Para los SNP ARS-BFGL-NGS-15809, asociado a αS1-CN; BTA-77380-no-rs, asociado a β -CN; y BTB-00821654, asociado a K-CN, los valores de HT fueron 0,13, 0,14 y 0,09, respectivamente. Se observa que son valores bajos, lo que indica una deficiencia de heterocigotos en la población estudiada para estos 3 polimorfismos, muy posiblemente como consecuencia de realizar procesos de selección animal en los hatos, puesto que los genes de caseínas están asociados directa o indirectamente con características de calidad de la leche (Mir et al. 2014; Zambrano et al. 2012). Considerando lo anterior, se sugiere que existe una pérdida de la variabilidad genética de la raza para estos polimorfismos, por la concentración de ciertas formas alélicas asociadas a un alto rendimiento en la producción de leche, y la disminución significativa de otras formas alélicas asociadas a la calidad de la proteína láctea.
Los valores de FST fueron bajos para todos los polimorfismos evaluados en esta investigación, oscilaron entre -0,002 y 0,041, lo que indica que la estructura genética es baja. Resultados similares fueron reportados por Echeverri et al. (2015), quienes determinaron un valor de FST de 0,045, para el gen de K-CN, indicando que la población presenta poca estructura genética para este gen, en sub-poblaciones de ganado Holstein evaluadas en el departamento de Antioquia. De igual manera, el FST reportado para el gen αS2-CN también fue bajo (-0,0015), lo que indica un ligero desarrollo de estructura genética para las subpoblaciones evaluadas en el departamento de Nariño (Solarte et al. 2011). Para todos los SNP evaluados en esta investigación, el coeficiente de diferenciación genética (FST) fue bajo, indicando que la diferenciación genética entre las subpoblaciones evaluadas es mínima, aun cuando se usó una subpoblación de toros extranjeros.
Es importante tener en cuenta la fuerte selección animal que ha ocurrido en los últimos 50 años en los países desarrollados, que ha mejorado características de producción y calidad de la leche e, indirectamente, ha seleccionado formas alélicas más rentables en términos económicos, tales como el gen de K-CN, el cual mejora el rendimiento quesero. Incluso se han aumentado las frecuencias alélicas de genes que afectan o, por el contrario, mejoraran la salud humana, como las formas A1 o A2 del gen de β-CN. Estos genes han sido y serán seleccionados como herramientas altamente útiles en la selección asistida por marcadores moleculares (Olenski et al. 2010).
CONCLUSIONES
Las frecuencias alélicas y genotípicas de 3 de los SNP evaluados indican que se ha fijado 1 de los alelos en todas las subpoblaciones, lo que lleva a suponer que en la población global existe un alto grado de endogamia que genera una disminución de la heterocigosidad, provocada posiblemente por factores como la selección genética a la que han sido sometidas las subpoblaciones. Esta selección desemboca en la concentración de ciertas formas alélicas, en la disminución significativa de otras y, en general, en la pérdida de la variabilidad genética, la cual ha conducido a la producción de animales más susceptibles a enfermedades infecciosas como mastitis, metritis, cojeras, entre otras, que son potenciadas por la alta demanda fisiológica y energética de las vacas durante la gestación, la lactancia y el corto periodo de recuperación.
Es importante resaltar que en esta investigación se usó una subpoblación de toros extranjeros con frecuencias alélicas y genotípicas similares con respecto a las sub-poblaciones definidas en el departamento de Antioquia. Los resultados indican que los alelos de los toros muy posiblemente están fijados en las subpoblaciones como consecuencia de la selección genética a la que ha sido sometida la raza Holstein a través de los años.