Introducción
Los polimorfismos de nucleótido sencillo (SNP) son sustituciones de una única base en posiciones específicas dentro del Acido Desoxirribonucleico (ADN). Su valoración en estudios genéticos es muy usada debido a que son los polimorfismos más abundantes en el genoma humano, representan alrededor del 85 % de la variación genética humana, tienen una baja tasa de mutación, (del orden de 10-8) por tanto son muy estables, y pueden analizarse en amplicones producto de la Reacción en Cadena de la Polimerasa (PCR) de tamaño pequeño, entre otros atributos1. Para su detección se usan diversas metodologías como la secuenciación directa, hibridización alélica específica (ASO), los microarreglos, las sondas de Hibridación TaqMan, la espectrometría de masas (MALDI-TOF), la secuenciación masiva en paralelo (MPS) y la minisecuenciación por SNaPshot®2,3.
La caracterización de un conjunto de SNP puede emplearse en estudios de asociación y se relacionan con el riesgo de desarrollar alguna patología; la detección de la base polimórfica es importante para evaluar el componente genético de las enfermedades complejas. Los estudios funcionales basados en polimorfismos son eficientes porque se centran en los SNP con mayor probabilidad de estar asociados y permiten a su vez identificar tanto alelos comunes como raros en regiones funcionales4.
Esta valoración es útil en entidades multifactoriales como el Síndrome Metabólico (SM) el cual es una agrupación de hallazgos clínicos como hipertensión, obesidad, dislipidemia e hiperglicemia o insulino resistencia, en la que convergen diversos factores ambientales, el estilo de vida y un componente genético5-7. Según la Organización Mundial de la Salud (OMS), la prevalencia mundial de obesidad se ha duplicado en las últimas tres décadas y, al menos un tercio de los adultos mayores de 20 años tienen sobrepeso u obesidad.
Con el aumento de la obesidad, se espera que la prevalencia del SM también aumentará en paralelo, dado que casi la mitad de la carga de diabetes y una cuarta parte de la carga de enfermedad cardíaca es atribuible al sobrepeso u obesidad5.
Hasta el momento se han identificado más de 200 polimorfismos de tipo SNP en cerca de 100 genes, que han sido relacionados en diversas investigaciones con los criterios diagnósticos de SM. Entre los genes propuestos como candidatos a contribuir al desarrollo de SM están los genes del Receptor Beta 3-Adrenérgico (ADBR3), la Apolipoproteína A5 (APOA5), la Adiponectina (ADIPOQ) y del receptor activador de la proliferación de los peroxisomas tipo gamma (PPARG) (8-10.
El gen ADBR3 localizado en el cromosoma 8, juega un papel importante en la regulación de la termogénesis y la lipolisis en tejido adiposo blanco y es un gen candidato en sujetos obesos, debido a que mutaciones funcionales alteran la lipólisis estimulada por catecolaminas causando una disminución en la tasa metabólica basal11. El gen APOA5 se localiza en el cromosoma 11, codifica para una proteína involucrada en el metabolismo de los triacilgliceroles y la glucosa, y ha sido asociado a hipertrigliceridemia y riesgo de desarrollar SM12. El gen ADIPOQ localizado en el cromosoma 3, codifica para una proteína específica del tejido adiposo que circula en el plasma, cuyos niveles están inversamente correlacionados con la resistencia a la insulina y expresión reducida en presencia de obesidad13,14. El gen PPARG localizado en el cromosoma 3, codifica para receptores nucleares encargados de regular la expresión de diversos genes implicados en el metabolismo de los lípidos y la glucosa; su expresión ha sido comprobada en diversos tejidos como el adiposo donde juegan un papel crucial en la diferenciación celular y la regulación en la expresión de otros genes involucrados en el metabolismo energético15,16.
En estos genes se han estudiado diferentes SNPs para establecer su asociación con el SM, en este estudio se seleccionaron dos polimorfismos de cada uno de estos genes, de acuerdo con los criterios clínicos de la base de datos clinvar, así: del gen ADBR3 el rs4994 (Trp64Arg) y rs4998 (250G>C), del gen APOA5 el rs3135506 (Ser19Trp) y rs2075291 (Gly185Cys), del gen ADIPOQ el rs1501299 (SNP276) y rs2241766 (Gly15=) y del gen PPARG el rs1801282 (Pro12Ala) y rs1800571 (Pro85Gln) (8,12,17-19.
Dado que no se encontró reportado en la literatura ningún diseño metodológico para detectar simultáneamente estos polimorfismos de interés clínico, este trabajo presenta el diseño y validación de cebadores, así como el desarrollo de una PCR múltiple, seguida de minisecuenciación con la metodología SNaPshot® y detección por electroforesis capilar, para su identificación. Se seleccionó la minisecuenciación con SNaPshot® porque es una técnica robusta, posee mayor sensibilidad que la secuenciación estándar, es de bajo costo, rápida, requiere poca cantidad de ADN, permite la detección de variantes menores y pueden ser empleados amplicones de PCR pequeños. Adicionalmente permite identificar hasta 29 SNP de diferentes loci en una sola reacción y la literatura científica muestra su utilidad en la detección y validación de SNP20.
Metodología
La detección de los SNPs se realizó mediante la minisecuenciación que se basa en la alta precisión del ADN polimerasa para la incorporación del nucleótido de interés. Los segmentos de ADN que contenían los SNPs a evaluar se amplificaron en una PCR múltiple y posteriormente cada fragmento amplificado fue hibridado con un cebador no marcado (sonda) específico para cada SNP y diseñado para unirse al ADN diana de tal forma que su extremo 3' finalizaba en el nucleótido inmediatamente adyacente al SNP. Posteriormente una ADN polimerasa extendió la cadena incorporando un único dideoxinucleótido trifosfato (ddNTP) marcado con un fluorocromo específico para cada base nitrogenada, usando el kit SNaPshot® (Applied Biosystems). El ddNTP se unió en la posición del SNP, o en la complementaria de acuerdo con el diseño de la sonda. Los productos se separaron por electroforesis capilar en un secuenciador de ADN automatizado2.
El diseño y desarrollo del ensayo para la detección múltiple de los ocho SNPs asociados con el SM, se desarrolló así:
Ubicación de los SNPs
Se identificaron los genes y SNPs de interés clínico relacionados con el SM en la base de datos dbSNP y ClinVar disponibles en NCBI. Como criterios de inclusión se contemplaron: la ubicación del SNP en una región codificante, que generará una mutación no sinónima, estar validado teniendo en cuenta que el alelo de menor frecuencia fuese mayor de 0,001 y haber sido secuenciado en el proyecto de los Mil Genomas (https://www.internationalgenome.org/). La ubicación y variación en la secuencia de los ocho SNPs se presenta en las tablas 1 y 2. Se revisaron todos los SNPs ubicados dentro de los cebadores diseñados, para elegir solo los que reportaban una frecuencia alélica del menor alelo (MAF) mayor de 0,001.
Diseño de Cebadores
Los cebadores para la amplificación por PCR, y para la minisecuenciación fueron diseñados para tener una temperatura de hibridación alrededor de 60 °C y una longitud del producto de 80 a 350 pb, usando el software Primer 3 (https://primer3. ut.ee/). Se seleccionaron secuencias de cebadores de minisecuenciación corriente arriba y corriente abajo adyacente al sitio SNP, con una longitud y temperatura de fusión (Tm) apropiadas21,22.
Las secuencias de la base de datos del National Centre for Biotechnology Information fueron comparadas utilizando la herramienta de búsqueda de alineación de nucleotidos Basic Local Alignment Search Tool (BLAST), para probar los cebadores (de PCR multiplex y SNaPhot) contra posibles secuencias repetitivas y homologías de secuencia. Para evitar posibles estructuras en horquilla y las interacciones cebador-cebador en la PCR multiplex, estos se probaron utilizando el software AutoDimer (https://strbase.nist.gov/AutoDimerHomepage/AutoDimerProgramHomepage.htm). Además, se revisaron las posibles variantes de las bases nitrogenadas y la frecuencia descrita dentro de la zona de los primers diseñados, para reemplazarlas siguiendo la nomenclatura IUPAC (https://www.bioinformatics.org/sms/iupac.html), ampliando así el éxito de la amplificación, si estaba presente.
El diseño de los cebadores de SNaPshot® para la detección de varios SNPs fue una parte fundamental en el desarrollo de la técnica, los cebadores debían permitir que el ddNTP marcado se incorporara exactamente en la posición correspondiente al polimorfismo, no debía existir hibridación cruzada entre los cebadores y debían poderse diferenciar en una electroforesis. Para diferenciarlos se les incorporó una cola de nucleótidos con secuencias no homólogas de polinucleotidos (dTAGGTGCCACGTCGTGAAAGTCTGACAA) de distinto tamaño en el extremo 5' de cada cebador logrando que los productos finales de la minisecuenciación tuvieran diferencias en el tamaño del fragmento evaluado de al menos cuatro nucleótidos de longitud y evitar así la superposición de los productos23,24.
Seguidamente se confirmaron las temperaturas de anillamiento y el tamaño de los segmentos amplificados usando UCSC In-Silico PCR con una concentración de sales de 50 mM y de cebadores de 50 nM. Las secuencias de los cebadores para la amplificación por PCR y para la reacción de minisecuenciación se muestran en las Tablas 1 y 2, respectivamente.
Muestras
Se recolectaron muestras de sangre periférica de 20 donantes no emparentados previo consentimiento informado. El ADN genómico fue aislado, usando el kit comercial PrepFilerTM® Forensic DNA® (Applied Biosytems).
PCR múltiple
Se diseñó una PCR múltiple para amplificar los ocho SNPs seleccionados, en una sola reacción de amplificación con volumen final de 25 μL así: 12,5 μL de 2X de PCR Multiplex QIAGEN®, los primer en concentración final 0,2 μM, 3 μL de H2O y 20 ng de ADN genómico. Las condiciones de termociclado fueron 95 °C por 15 min, luego 30 ciclos de 94 °C por 30 s, 60 °C por 90 s, 72 °C por 60 s, y una extensión final a 72 °C por 60 min.
Purificación del amplificado
El exceso de cebadores y dNTPs del amplificado fue eliminado mezclando 2,5 μL del producto amplificado con 1 μL de ExoSAP-IT (Amersham Biotech®). Se llevó a incubación a 37 °C por 45 min, seguido de incubación a 85 °C por 15 min, para inactivar la enzima.
Minisecuenciación múltiple
Se realizó una segunda secuenciación con un volumen final de 6 μL, incluyendo 2,5 μL de reacción de SNaPshot® (Applied Biosystems), 2 μL del producto de PCR y 1,5 μL de la mezcla de cebadores de extensión diseñados (las concentraciones finales estuvieron entre 0,15 y 0,6 μmol/L). Las condiciones de termociclador fueron: 30 ciclos de 96 °C por 10 s, 55 °C por 5 s y 60 °C por 30 s.
Purificación de los productos de SNaPshot®
Para remover los ddNTPs no incorporados, se mezclaron 6 μL del producto de minisecuenciación, con 1 unidad de fosfatasa alcalina de camarón (SAP, Amersham Biotech®). Se incubó a 37 0C por SG min, seguido de SG "C por 1S min para inactivar la enzima.
Detección de SNPs por electroforesis capilar
Se mezclaron G,S μL del producto de la minisecuenciación purificado con 12 μL de formamida Hi-DiTM y G,3 μL de marcador de peso GeneScan-12G LIZ® (Applied Biosystems), posteriormente se denaturaron las muestras a 9S "C por S min. Las electroforesis fueron corridas en un analizador genético ABI 31G usando polímero POP-4 para visualizar cada uno de los ddNTPs incorporados. Los datos se analizaron con el software GeneMapper® ID v3.2 (Applied Biosystems) para asignar los alelos y determinar el perfil genético de la muestra25.
Validación del método diseñado
La validación del diseño de los primers y de la PCR múltiplex, se realizó siguiendo los criterios de la norma ISO-NTC/IEC 17G2S de 2G17 para validación de métodos26. Las cuales se mencionan a continuación:
Umbral analítico
Se calculó como el valor que, en las condiciones analíticas empleadas por el laboratorio, permitió establecer la altura de un pico a partir de la cual el pico observado, era en realidad un producto de PCR. Los valores de la señal de fluorescencia se tomaron las unidades de fluorescencia relativa (RFU) de cada pico24,27.
Especificidad
Fue evaluada como la capacidad del método para detectar la ubicación y secuencia del gen de interés en el genoma humano. Se determinó mediante el análisis de los resultados obtenidos por secuenciación directa y por minisecuenciación.
Exactitud
Se determinó como la capacidad del método de PCR múltiple y del método SNaPshot® para detectar inequívocamente cada uno de los SNPs de interés, comparando los resultados obtenidos por minisecuenciación y por secuenciación directa.
Precisión
Se evaluó mediante la repetibilidad obtenida en cinco muestras, procesadas tres veces por un mismo funcionario; y mediante reproducibilidad, valorada a partir de la evaluación de los resultados obtenidos en las mismas cinco muestras procesadas a ciegas, por otro funcionario, utilizando otro termociclador del laboratorio28.
Resultados
Detección de los SNPs
Con los cebadores diseñados se secuenciaron 20 muestras controles para los polimorfismos: rs4994 (Trp64Arg) y rs4998 (250G>C) del gen ADBR3, rs3135506 (Ser19Trp) y rs2075291 (Gly185Cys) del gen APOA5, rs1501299 (SNP276) y rs2241766 (Gly15=) del gen ADIPOQ y rs1801282 (Pro12Ala) y rs1800571 (Pro85Gln) del gen PPARG. Las secuencias obtenidas fueron interrogadas en BLAST y en todos los casos se pudo confirmar que los fragmentos amplificados correspondían a la secuencia esperada de cada gen, lo cual puede ser verificado con la Figura 1 donde se observa el resultado de la secuenciación de una muestra para el polimorfismo ApoA5.
A continuación, se realizó el montaje de la PCR múltiple con los cebadores diseñados. La amplificación se verificó en un gel de agarosa Biomol® (1GGV por 3G min) al 2 %. Posteriormente se realizó la minisecuenciación por SNaPshot®, usando las sondas específicas diseñadas para la detección de cada polimorfismo. En todos los 20 controles evaluados se obtuvieron resultados para los ocho SNPs investigados. Los resultados se muestran en la Figura 2.
Algunos fragmentos mostraron una señal fluorescente más fuerte que otros debido a la química del fluorocromo con el que estaba marcado el ddNTP, sin embargo, este hecho no afectó la lectura del electroferograma. El análisis de los electroferogramas realizado por el software GeneMapper® del analizador genético ABI 310 permitió establecer el tamaño en pares de bases y la altura en unidades RFU de los picos. En la Tabla 3 se pueden observar las características que permitieron la detección de cada alelo, mediante la interpretación de los electroferogramas.
En cada corrida se incluyeron controles negativos y positivos. En la Figura 3 se muestran los electroferogramas obtenidos de un control negativo, donde se observan únicamente los picos del marcador de peso molecular, y de un control positivo, donde se observan los picos de los alelos de cada polimorfismo detectado. El genotipo de cada polimorfismo se estableció mediante la asignación alélica realizada con base en el color del pico detectado, la altura del pico y al tamaño en pares de bases del fragmento. El método diseñado permitió detectar en cada uno de los polimorfismos, tanto del alelo ancestral como del alelo mutado, identificando así, perfiles homocigotos y heterocigotos en las muestras analizadas. En los electroferogramas obtenidos de tres de las muestras evaluadas, se muestran en la Figura 4 y en la Tabla 4 se observa el genotipo asignado a cada una de ellas.
Validación del ensayo
Se realizó evaluando 20 controles y comparando el alelo detectado por secuenciación directa con el método de Sanger, usando el kit BigDye Terminator v3.1 Cycle Sequencing y el ensayo diseñado para minisecuenciación. En todos los casos el alelo detectado fue el mismo.
Con los electroferogramas obtenidos se determinó la altura y el peso en pares de bases de cada alelo y se calculó el promedio y desviación estándar. Las desviaciones estándar obtenidas estuvieron entre 0,01 y 0,09 pares de bases para los ocho SNPs, lo que permitió realizar la asignación alélica de manera inequívoca. El tamaño detectado para los alelos de cada polimorfismo, fue ligeramente diferente al tamaño esperado, sin embargo, esto no afectó en ningún caso la asignación alélica porque en el diseñó se tuvo en cuenta que la minisecuenciación de cada polimorfismo, generara fragmentos que difirieran en tamaño en cuatro o más pares de bases, descartando así la posibilidad de obtener picos sobrepuestos de dos SNPs adyacentes. A partir de la evaluación de la altura de los picos detectados en todos los controles se estableció el umbral analítico para asignar los alelos, en 100 unidades RFU.
La especificidad de cada par de cebadores diseñados, así como la exactitud del método de PCR múltiple diseñado, seguido de minisecuenciación por SNaPshot® se confirmó comparando los resultados obtenidos por secuenciación directa y por minisecuenciación de los productos amplificados. En los 20 controles evaluados el resultado de la secuenciación mostró que se amplificó la región esperada en cada uno de los genes y el alelo detectado fue idéntico.
Los resultados obtenidos de los cinco ensayos de una misma muestra demostraron la repetibilidad del método porque se detectaron invariablemente los mismos alelos en cada muestra, en todas las repeticiones analizadas. Así mismo los resultados obtenidos de la reproducibilidad del ensayo, evaluando las mismas muestras montadas y procesadas a ciegas, por un segundo funcionario, usando un termociclador diferente, arrojaron en todos los casos, el mismo resultado para el perfil genético de los ocho SNPs de interés mostrando la alta precisión del método.
Los electroferogramas obtenidos de las corridas electroforéticas fueron leídos y analizados por tres funcionarios de manera independiente y los perfiles asignados en todas las lecturas realizadas, fueron idénticos.
Discusión y Conclusión
El SM es el nombre dado al conjunto de condiciones clínicas que comprende obesidad central abdominal, hipertensión sistémica, insulina resistencia o diabetes mellitus tipo 2 y dislipidemia aterogénica. Es un estado protrombótico y proinflamatorio, asociado con aceleración de la enfermedad cardiovascular aterosclerótica, hiperuricemia o gota, enfermedad renal crónica y apnea obstructiva del sueño5. Es considerado de herencia multifactorial y se han reportado numerosos genes candidatos a estar asociados con algunos de los criterios para su diagnóstico; entre estos están los genes ADBR 3, APOA5, ADIPOQ y PPARG8,9,19.
En la literatura se han reportado estudios que asocian estos genes con el SM, sin embargo, ninguno de ellos evalúa en forma conjunta los cuatro genes, ni hay reportados estudios de asociación genética del SM en población latinoamericana, por lo que es indispensable realizar este tipo de investigaciones en nuestra población. La evaluación de muestras en estudios de asociación requiere de la tipificación de gran cantidad de muestras para lograr detectar la asociación y para ello se requiere contar con técnicas de genotipado que sean altamente específicas y que se permitan evaluar simultáneamente y de forma rápida, el mayor número posible de SNPs de interés, en un solo montaje25.
En este trabajo se presenta el diseño y validación de una PCR múltiple, seguida de minisecuenciación por SNaPshot, para detectar ocho polimorfismos ubicados en estos cuatro genes. El análisis de los SNPs mediante este ensayo diseñado y validado permitió la identificación de los alelos de cada polimorfismo usando esta metodología que es más sencilla, rápida y económica, que la secuenciación directa y los resultados fueron completamente reproducibles24.
Todos los cebadores se diseñaron para usarse específicamente en esta minisecuenciación múltiple, tuvieron un rendimiento óptimo y permitieron identificar en forma inequívoca cada uno de los alelos de los ocho SNPs. Así mismo la minisecuenciación por SNaPshot permitió corroborar que este método es altamente preciso dado el uso de ADN polimerasas para la incorporación de los nucleótidos y la posibilidad de desarrollar ensayos para la detección de varios polimorfismos ubicados en diferentes genes, en una sola reacción de PCR seguida de una sola minisecuenciación, lo cual optimiza tiempo y dinero2,25.
El ensayo también fue completamente validado siguiendo criterios de la norma ISO-NTC 17025:2017 y demostró ser altamente específico, exacto y reproducible, proporcionó resultados de identificación inequívoca de los SNPs sin ninguna identificación errónea2, lo que permite afirmar que el método de minisecuenciación con SNaPshot® descrito aquí, es un método simple pero robusto y preciso, que permite la detección rápida de múltiples polimorfismos y el análisis simultáneo de los ocho SNP. Ningún SNP experimentó un cambio de alelo en ninguna de las réplicas, y la posición en la que se detectaron los picos correspondientes a cada SNP, no sufrieron desplazamientos en los diferentes electroferogramas24,26,29,30.
La intensidad de las señales en la mayoría de los SNP presento variaciones, aunque fueron equilibradas, esto debido a la diferencia de intensidad de la señal emitida por el fluorocromo con que estaba marcado cada ddNTP25. También la movilidad de los fragmentos varió ligeramente las posiciones de los SNP en los electroferogramas, debido al tamaño de los fragmentos a detectar y al analizador genético, el polímero y tamaño del capilar, factores que afectan la movilidad electroforética25,28. Aunque estos aspectos en ningún momento dificultaron la asignación alélica de cada SNP, es importante realizar la validación del ensayo para establecer las condiciones de aceptabilidad, antes de ser usado para el análisis de muestras, adicionalmente consideramos indispensable, conservar todas las condiciones seguidas durante la validación, al analizar las muestras, para garantizar la reproducibilidad de los resultados. También es importante resaltar que para que un ensayo de detección múltiple de varios SNPs en una sola PCR seguida de una solo minisecuenciación sea robusto, se requiere optimizar el diseño y la concentración de los cebadores para la PCR y para la minisecuenciación de cada conjunto de SNP y, aunque esto demanda mucho tiempo y trabajo, permite la optimización del método2.
Finalmente consideramos que este trabajo aporta una herramienta de evaluación de estos polimorfismos con un diseño novedoso que podrá ser aplicado en un muestreo de población colombiana, para determinar si existe o no asociación de alguno de estos polimorfismos con el SM. Así mismo se constituye en un aporte para que otros investigadores desarrollen diseños mediante minisecuenciación para la detección de diversos SNPs de interés, dada la reproducibilidad, precisión, capacidad para analizar múltiples SNPs en forma simultánea, el consumo de tiempo y el costo por genotipo.