SciELO - Scientific Electronic Library Online

 
vol.43 número1Un modelo Birnbaum-Saunders para el análisis conjunto de datos de supervivencia y longitudinales de insuficiencia cardíaca congestive índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Revista Colombiana de Estadística

versión impresa ISSN 0120-1751

Resumen

ZHONG, Yi; HE, Jianghua  y  CHALISE, Prabhakar. Validación cruzada anidada y repetida para el modelo de clasificación con datos de alta dimensión. Rev.Colomb.Estad. [online]. 2020, vol.43, n.1, pp.103-125.  Epub 05-Jun-2020. ISSN 0120-1751.  https://doi.org/10.15446/rce.v43n1.80000.

Con la llegada de las tecnologías de alto rendimiento, los conjuntos de datos de alta dimensión están cada vez más disponibles. Esto no sólo ha abierto una nueva visión acerca de los sistemas biológicos, sino que también plantea desafíos analíticos. Un problema importante es la selección de subconjuntos de variables y la predicción de resultados futuros. Es crucial que los modelos no sean sobreajustados y que den resultados precisos con nuevos datos. Además, la identificación confiable de variables informativas con alto poder predictivo (selección de características) es de interés en entornos clínicos. Proponemos un procedimiento de dos etapas para la selección de variables y la construcción de modelos de clasificación, el cual utiliza un método de validación cruzada anidada y repetida. Evaluamos nuestro enfoque utilizando tanto datos simulados como dos conjuntos de datos de expresión génica disponibles públicamente. El método propuesto mostró una precisión predictiva comparativamente mejor para casos nuevos en comparación con el método estándar de validación cruzada.

Palabras clave : Área bajo la curva ROC; Validación cruzada; Red elástica; Bosque aleatorio; Máquina de vectores de soporte.

        · resumen en Inglés     · texto en Inglés     · Inglés ( pdf )