Servicios Personalizados
Revista
Articulo
Indicadores
- Citado por SciELO
- Accesos
Links relacionados
- Citado por Google
- Similares en SciELO
- Similares en Google
Compartir
Acta Biológica Colombiana
versión impresa ISSN 0120-548X
Resumen
CORTESE, lliana Julieta; CASTRILLO, María Lorena; ZAPATA, Pedro Darío y LACZESKI, Margarita Ester. EFECTO DEL FILTRADO DE SECUENCIAS EN EL ENSAMBLADO DEL GENOMA DE Bacillus altitudinis 19RS3 AISLADO DE Ilex paraguariensis. Acta biol.Colomb. [online]. 2021, vol.26, n.2, pp.170-177. Epub 18-Ene-2022. ISSN 0120-548X. https://doi.org/10.15446/abc.v26n2.86406.
El filtrado de secuencias es un paso esencial sin importar el tipo de tecnología aplicada para la secuenciación de un genoma, en el cual las lecturas de baja calidad o una parte son eliminadas. En un ensamblado la construcción de un genoma se realiza a partir de la unión de lecturas cortas en cóntigos. Algunos ensambladores miden la relación que existe entre secuencias de una longitud fija (k-mer) que puede verse afectada por la presencia de secuencias de baja calidad. Un enfoque común para evaluar los ensamblados se basa en el análisis del número de cóntigos, la longitud del cóntigo más largo y el valor del N50, definido como la longitud del cóntigo que representa el 50 % de la longitud del conjunto. En este contexto, el presente estudio tuvo como objetivo evaluar el efecto del uso de lecturas crudas y filtradas en los valores de los parámetros de calidad obtenidos en el ensamblado del genoma de Bacillus altitudinis 19RS3 aislada de Ilex paraguariensis. Se realizó el análisis de calidad de ambos archivos de partida con el software FastqC y se filtraron las lecturas con el softwareTrimmomatic. Para el ensamblado se utilizó el software SPAdes y para su evaluación la herramienta QUAST. El mejor ensamblado para B. altitudinis 19RS3 se obtuvo a partir de las lecturas filtradas con el valor de k-mer 79, que generó 16 cóntigos mayores a 500 pb con un N50 de 931 914 pb y el cóntigo más largo de 966 271 pb.
Palabras clave : análisis de secuencias; biología computacional; control de calidad; genomas bacterianos.