El trastorno bipolar es una condición relativamente frecuente. Su prevalencia en diversas situaciones de la atención primaria de muchos países (por ejemplo, Estados Unidos, Hungría, Finlandia, España, Bélgica, Canadá, Francia y Brasil) alcanza valores entre 7,6 y 9,8 % 1,2, y la prevalencia a lo largo de la vida se encuentra entre el 1 y el 2 % en la población mayor de 20 años 3.
Es un trastorno mental crónico y grave que se caracteriza por la aparición irregular y frecuentemente alternada de episodios de activación (manía- hipomanía) o inhibición (depresión) entremezclados con períodos de eutimia. La gravedad de dichos episodios varía mucho y pueden verse desde cuadros clínicos con sintomatología leve hasta episodios muy graves que requieren hospitalizaciones prolongadas. Esta variabilidad en la gravedad de los síntomas ha llevado a plantear la existencia de un espectro bipolar 3, cuya frecuencia en la población general es de hasta 6,5 % 4,5. El trastorno bipolar es potencialmente letal (el riesgo de suicidio es veinte veces mayor que en la población general) 6, y tiene unas repercusiones sociales y económicas importantes que pueden atenuarse si se hacen un diagnóstico y un tratamiento adecuados.
Se ha encontrado que, a menudo, en la evaluación del médico tratante los síntomas hipomaníacos de la enfermedad bipolar pasan desapercibidos y se tiende a subvalorar los síntomas depresivos 7,8. Estos hallazgos han justificado el desarrollo de instrumentos de autorreporte para diagnosticar categorías relacionadas con el espectro bipolar, entre los cuales se encuentran: el cuestionario de depresión bipolar II 9, el cuestionario de autorreporte de síntomas afectivos (MOODS-SR) 10,11, la lista de chequeo delahipomanía12,las escalas análogo-visuales múltiples parabipolaridad, la escala de maníaauto calificada de Altman14,el inventario rápido de sintomatología depresiva 15, el inventario de manía por autorreporte 16 y la escala del estado interno17.
Las medidas de los resultados reportados por los pacientes (Patient Reported Outcome Measures, PROM) vienen ganando importancia en la atención en salud 18,19. Aunque habitualmente las PROM se han relacionado con medidas de la calidad de vida, también se incluyen en esta categoría reportes del estado de salud, el autorreporte de disfuncionalidad, el de satisfacción del paciente y la autoevaluación de síntomas, entre otros 18,20.
Aunque la utilidad de los instrumentos de autoevaluación en pacientes con trastornos del estado de ánimo se ha cuestionado en diferentes estudios 21, algunos autores han encontrado un funcionamiento similar de las escalas de evaluación empleadas por el médico tratante y la autoevaluación de la depresión 22. Hay estudios que sugieren que, independientemente de la gravedad de su cuadro clínico, los pacientes con sintomatología maníaca pueden calificar sus síntomas de manera válida y confiable 23, y que tales instrumentos resultan de utilidad en la práctica 24. Además, se ha encontrado que con este tipo de instrumentos se detectan manera adecuada los efectos del tratamiento, por lo cual pueden ser de gran utilidad para vigilar el resultado de las intervenciones terapéuticas 25. Otras ventajas de los instrumentos de autoevaluación incluyen la posibilidad de efectuar una medición más frecuente de los síntomas, la utilidad que pueden tener en las intervenciones de psicoeducación y la capacidad de detectar con mayor facilidad cambios rápidos en el cuadro clínico, como sucede en variedades de ciclos rápidos de la enfermedad bipolar 26.
Hasta donde tenemos conocimiento, no existen instrumentos de autoevaluación de los síntomas de la enfermedad bipolar que se hayan desarrollado y validado en poblaciones hispanoamericanas; el único instrumento que encontramos disponible fue la escala de autorreporte para medición de síntomas maniacos en enfermedad maniaco depresiva (EMUN-AR) 27, basada en la escala para manía de la Universidad Nacional de Colombia (EMUN) 28, cuyas propiedades psicométricas no se han determinado aún. Además, el instrumento no fue diseñado para hacer el diagnóstico sino para evaluar la evolución del trastorno 27.
El objetivo del presente estudio fue validar la escala EMUN-AR para determinar sus propiedades psicométricas. Según la información disponible, este es el primer instrumento desarrollado en una población hispanoparlante, que utiliza la medición de los resultados reportados por los propios pacientes.
Materiales y métodos
La escala se validó utilizando la metodología de análisis de Rasch para ítems politómicos mediante modelos de escala de clasificación. Los pacientes se evaluaron entre el 2012 y el 2016, en diferentes servicios de hospitalización de instituciones de atención psiquiátrica en Bogotá (Clínica Fray Bartolomé de las Casas, Clínica Santa Clara, Hospital La Victoria, Clínica Nuestra Señora de la Paz, Hospital Simón Bolívar), en Chía (Hospital San Juan de Dios) y en Manizales (Hospital San Juan de Dios).
Se consideraron como elegibles los pacientes con diagnóstico consignado en la historia clínica de trastorno bipolar en episodio maníaco, hipomaníaco mixto, que supieran leer y escribir, y que expresaran su aceptación de participar en el estudio luego de tramitar un consentimiento informado.
Los pacientes elegibles fueron evaluados por dos investigadores, psiquiatras con experiencia clínica en el diagnóstico y el tratamiento de la enfermedad bipolar, quienes de manera independiente hicieron una entrevista semiestructurada basada en criterios del DSM-IV, durante el curso de los primeros ocho días a partir del ingreso del paciente.
Después de la evaluación, un investigador independiente, también médico psiquiatra, contrastaba el diagnóstico efectuado por cada psiquiatra; en caso de que no hubiera concordancia, se trataba de llegar a un consenso informal con la participación de los dos psiquiatras y el investigador independiente. En la muestra del estudio, se incluyeron solo los pacientes sobre cuyo diagnóstico hubo acuerdo o consenso entre los investigadores.
La escala evaluada consta de 26 ítems, cada uno con tres dimensiones calificadas de manera ordinal, mediante los cuales se evalúan los síntomas del trastorno bipolar aparecidos durante la semana anterior a su utilización.
Esta escala se desarrolló para medir los síntomas de la enfermedad maníaco-depresiva a partir del reporte del propio paciente y desde una perspectiva dimensional, asumiendo que los síntomas depresivos pueden ser parte constitutiva del síndrome maníaco, por lo que en nueve de los 26 ítems se evalúa la sintomatología depresiva 27. La escala permite evaluar el síndrome maníaco en tres dimensiones: frecuencia, intensidad y grado de inadaptación generado por los síntomas.
Los 26 ítems, distribuidos en estas tres dimensiones, se miden en una escala de tipo Likert con diez categorías, que van de “nada” a “muchísimo” para la intensidad y, de “nunca” a “todo el tiempo”, para la frecuencia. Para el grado de inadaptación, la escala tiene cuatro categorías, también en escala ordinal, que van de “ninguna molestia” a “mucha molestia”.
El puntaje total de la escala resulta de la suma de los puntos de cada uno de los ítems, de manera que los puntajes más altos reflejan los cuadros clínicos de mayor gravedad. Además, se diseñó un instrumento en el que se registraron variables como el sexo, la edad, los medicamentos que estaba recibiendo el paciente en el momento de la evaluación y el tiempo de evolución de la enfermedad.
Análisis estadístico
Se hicieron análisis descriptivos de las variables demográficas, clínicas y de los puntajes de la escala en cada una de sus tres dimensiones. Para resumir las variables continuas, se usaron medias o medianas con sus correspondientes medidas de dispersión: desviación estándar (DE) o rango intercuartílico (RIC). En el caso de las variables categóricas, se reportaron frecuencias y porcentajes.
El tamaño de la muestra se ajustó a la recomendación de un mínimo de 200 observaciones como número aceptable para los análisis factoriales 29 y un mínimo de 250 como número adecuado para el análisis con el modelo de Rasch 30.
Se efectuó un análisis factorial exploratorio para hacer una primera aproximación a la estructura de dominios del instrumento en cada una de sus dimensiones. Este análisis preliminar se basó en la recomendación de disponer tempranamente de posibles dimensiones latentes antes del análisis de Rasch31.
Considerando que cada ítem estaba calificado en una escala ordinal, se calcularon matrices de correlación policórica, a partir de las cuales se hicieron pruebas de viabilidad de factorización (la de esfericidad de Bartlett y la de Kaiser-Neyer-Olkin o KMO) 32. Para determinar el número de factores, se utilizaron un análisis paralelo 33 y un método de extracción de factores de mínimos cuadrados ponderados y, posteriormente, una rotación ortogonal y una oblicua, para determinar la estructura factorial que permitiera la mejor interpretación. Para estos procedimientos, se utilizó el programa R. Teniendo en cuenta que todos los ítems del instrumento en cada uno de sus tres componentes (intensidad, frecuencia y grado de molestia) se miden en una misma escala ordinal, para el análisis de Rasch se usaron los siguientes procedimientos en un modelo de escala de calificación:
Evaluación de la unidimensionalidad mediante la evaluación de los valores de cuadrado medio de ajuste con información ponderada (infit): el rango aceptable está entre 0,6 y 1,5 y los valores correspondientes a la desviación estándar de los coeficientes estandarizados menores de dos. Otra forma de asumir la unidimensionalidad es cuando, en el análisis de componentes principales de residuos, la varianza explicada por la medición es mayor del 40 % y el valor propio de la varianza no explicada en el primer contraste es menor a dos valores propios34.
Determinación de los índices de confiabilidad de personas e ítems: se calcularon los coeficientes de confiabilidad usando el análisis de componentes principales de residuos. Como medida adicional de confiabilidad, se estimaron las medidas de separación (número de niveles en los cuales pueden agruparse tanto los ítems como los individuos). Se consideran adecuadas las medidas de separación superiores a dos para las personas y a tres para los ítems 35.
Examen de la calidad del ajuste de cada uno de los ítems al modelo mediante la estimación del cuadrado medio (median square, MSQ) de los parámetros estadísticos de ajuste infit, es decir, el ajuste sensible a los casos atípicos (outliers) y el ajuste sensible a los patrones internos(outfit).
Evaluación de la calidad de las categorías de respuesta de los ítems, para lo cual se evaluó qué tan adecuado era el orden de las categorías en la detección de una mayor intensidad del atributo (mayor gravedad del episodio de la enfermedad maniaco depresiva). Además, se evaluaron las curvas de probabilidades de las categorías.
Evaluación de los mapas de personas e ítems. Estos análisis se hicieron con el programa Winsteps™.
Consideraciones éticas
El estudio fue aprobado por el Comité de Ética de la Facultad de Medicina de la Universidad Nacional de Colombia.
Resultados
En el estudio participaron 267 pacientes, de los cuales 114 eran mujeres (42,7 %). La media de edad fue de 40,3 años (DE=12,7 años). La mediana de evolución de la enfermedad fue de 12 años (RIC=16 años).
El tipo de episodio más frecuentemente encontrado fue el maniaco (76,4%;n=204), seguido del depresivo, el mixto yel no especificado (6,7% paracada una de estas tres categorías;n=17) y, por último, del hipomaníaco (4,5%;n=12).
En total, 251 (94 %) pacientes recibían tratamiento con moduladores del ánimo, 208 (78 %), con antipsicóticos, 163 (61 %), con benzodiacepinas y, 16 (6 %), con antidepresivos.
La mediana del puntaje en la dimensión de frecuencia fue de 67 (RIC=71) y, en la de intensidad, de 71 (RIC=78) (en estas dos dimensiones los posibles rangos de los puntajes estuvieron entre 0 y 260).En la dimensión de la molestia, la mediana fue de 18 (RIC=29), dimensión en la que los puntajes estuvieron entre 0 y78.
En los componentes de intensidad y frecuencia, los ítems que tuvieron la mayor mediana de puntaje fueron la hiperbulia y la euforia, en tanto que aquellos con las menores medianas fueron los relacionados con los episodios depresivos (cuadro 1). En el grado de molestia, las medianas de la puntuación estuvieron por debajo de 2 en todos los ítems.
En los componentes de frecuencia, intensidad y nivel de molestia, respectivamente, las medianas (RIC) según los diagnósticos fueron las siguientes: episodio maníaco: 64,5 (71,5), 69,5 (78) y 13,5 (25,5); episodio depresivo: 63 (61), 81 (78) y 35 (18); episodio mixto: 100 (39), 105(76) y 39 (22); episodio no especificado: 81 (42), 74 (46) y 24 (15);episodio hipomaníaco: 23 (77), 37,5 (87) y 13,5 (36,5).
Análisis factorial
En los análisis de viabilidad de la factorización de las matrices de correlación, se encontraron los siguientes resultados: para la dimensión de intensidad, el KMO fue de 0,91; para la dimensión de frecuencia, de 0,91, y para la de molestia, de 0,93. En las tres dimensiones, el test de esfericidad de Bartlett arrojó un valor de p menor de 0,0001. Según el criterio de análisis paralelo, se sugirieron cuatro factores en las dimensiones de frecuencia y molestia, y cinco en la dimensión de intensidad. Estos factores explicaron el 63 % de la varianza en la dimensión de intensidad, el 60 % en la dimensión de frecuencia y el 51 % en la de molestia.
Los resultados del análisis factorial se presentan en el cuadro 1. La estructura de dominios fue similar en cada una de las tres dimensiones de la escala, especialmente en las dimensiones de intensidad y frecuencia; esta estructura factorial puede resumirse de la siguiente manera.
Factor 1 (F1): representa un síndrome de activación y está compuesto por los síntomas típicos del episodiomaníaco.
Factor 2 (F2): corresponde a un síndrome de inhibición en el cual se agrupan los síntomas típicos de un episodiodepresivo.
Factor 3 (F3): agrupa síntomas relacionados con las consecuencias sociales del estado de activación oinhibición.
Factor4(F4):correspondeaundominiorelacionadoconideasdepresivas.
Factor 5 (F5): representa un síndrome de descontrol caracterizado por irritabilidad, hostilidad yagresividad.
Los factores 3 y 5 tienden a agruparse en uno solo, cuando los síntomas se miden según su frecuencia o el grado de molestia que generan. Esta agrupación corresponde a un dominio relacionado con los síntomas de inadaptación.
Análisis de Rasch
Unidimensionalidad. En los cuatro dominios encontrados en el análisis factorial exploratorio, la varianza explicada por la medición superó en todos los casos el 40 %, y el valor propio de la varianza no explicada en el primer contraste fue menor de dos valores propios (cuadro 2).
Para el componente de frecuencia, los valores de cuadrado medio del infit se ubicaron entre 0,74 para el ítem 6 (fuga de ideas) y 1,54 para el ítem 12 (ideación de muerte o suicidio). Para el componente de intensidad, estos valores se encontraron entre 0,71 para el ítem 6 (fuga de ideas)y 1,56 para el ítem 12 (ideación de muerte o suicidio). Para el componente del grado de molestia, dichos valores se encontraron entre 0,81 para el ítem 15 (hiperactividad) y 1,15 para el 19 (disminución de la necesidad de dormir). Los valores globales de los cuadrados medios del infit y el outfit estuvieron dentro de los rangos considerados adecuados (cuadro 3).
Determinación de los índices de confiabilidad de personas e ítems. Todos los valores de confiabilidad, tanto para las personas como para los ítems, tuvieron valores superiores a 0,8. Los índices de separación fueron superiores a 2 para las personas y, a 3, para los ítems (cuadro 3).
Examen de la calidad del ajuste de cada uno de los ítems al modelo. Para el ítem 12 (ideación de muerte o suicidio), los cuadrados medios (MNSQ) del infit arrojaron valores ligeramente superiores a 1,5 en los componentes de intensidad y frecuencia y valores superiores a tres en los resultados estandarizados como un puntaje z (standardized as a z-score, ZSTD) de los tres componentes (cuadro 4). Esto sugiere que este ítem puede presentar problemas de ajuste dentro de la escala. Para los demás ítems no se encontraron valores anómalos de MNSQ, lo cual indica un adecuado ajuste en el modelo de medición.
Evaluación de la calidad de las categorías de respuesta de los ítems
Las medidas de las categorías de cada componente de la escala, mostraron los siguientes resultados:
Frecuencia: las medidas para cada uno de los diez niveles consecutivos en los que se evalúan los ítems, fueron 0,97; -1,04; 0,46; 0,21; -1,04; 1,63; -0,81; -0,35; 1,46, y -1,49.
Intensidad: las medidas correspondientes a cada uno de los diez niveles fueron 1,04; -0,83; 0,49; 0,23; -1,38; 1,29; -0,78; 0,19; 0,86, y -1,10.
Nivel de molestia: las medidas en cada uno de los cuatro niveles en los que se evalúan los ítems (de 0 a 3), fueron -0,12; -0,17, y 0,9.
Como puede verse, no hubo un ordenamiento en las medidas según el nivel. Las curvas de probabilidad evidenciaron que solo tres categorías captaron la variabilidad de la medida de cada componente (figura 1).
Evaluación de los mapas de personas e ítems
En las dimensiones de intensidad y frecuencia la media de las personas fue cercana a la desviación estándar media por debajo de la media de dificultad de los ítems; en el grado de molestia esta diferencia fue de una desviación estándar. En las tres dimensiones, aproximadamente la mitad de los pacientes con síntomas maníaco-depresivos de menor intensidad no quedó adecuadamente cubierta por los ítems de la escala, lo cual indica que el instrumento mide cuadros graves de la enfermedad.
En los componentes de intensidad y frecuencia los ítems 8 (intensidad de voz baja) y 12 (ideación de muerte o suicidio) fueron los mejores indicadores de la gravedad del cuadro. En el componente del nivel de molestia el mejor indicador fue el aumento de sociabilidad.
En cuanto la frecuencia e intensidad de los síntomas de manía clásica (urgencia del pensamiento, megalomanía, hiperbulia, aumento de energía y afecto eufórico), estos son síntomas fácilmente reportados que no permiten definir la gravedad del episodio (se presentan, incluso, en cuadros no tan graves). En el grado de molestia, los síntomas depresivos (irritabilidad, aburrimiento y labilidad) fueron los reportados con más facilidad, por lo que no resultan buenos indicadores de la gravedad del episodio (figura 2).
Discusión
El presente estudio se hizo en una muestra conformada principalmente por pacientes que habían presentado un episodio maníaco, pero con poca representación de otro tipo de episodios de la enfermedad maniacodepresiva (especialmente, pacientes con episodios hipomaníacos). Los valores encontrados en las medianas de los ítems reflejan esta característica de la muestra: los puntajes más bajos se encontraron en los ítems que miden características depresivas y de inhibición. Los valores bajos en las medianas de los ítems, especialmente en el componente de nivel de molestia, pudieron deberse a que los pacientes estaban recibiendo tratamiento.
En cada uno de los tres componentes del instrumento, se detectó una gradación de los síntomas (el episodio mixto fue el más grave, seguido del depresivo o del no especificado, luego del maníaco y, por último, del hipomaníaco). Esta gradación concuerda con la observación clínica (los episodios hipomaníacos son formas menos graves) y con los hallazgos reportados en otros estudios en los que las formas mixtas resultaron ser las más graves 36.Esto sugiere que la escala detectó adecuadamente diferentes niveles de gravedad de los episodios, independientemente de su tipo; el instrumento no fue diseñado para medir solamente episodios maniacos, sino también episodios de enfermedad maníaco-depresiva, trastorno en el que se considera que la mayoría de episodios tiene características mixtas.
Según los resultados del análisis factorial, el instrumento midió un síndrome constituido por cuatro dominios, en los que se destacaron un componente de activación, otro de inhibición y otro de descontrol y desajuste; la proporción de la varianza explicada por los factores en todos los casos, superó el mínimo recomendado 37.
Los resultados del análisis son similares a los reportados en estudios previos en Colombia al utilizar instrumentos de evaluación a cargo del médico tratante 28, en los que, además del componente de activación, se reconocen componentes depresivos y de agresividad (de forma similar a los de descontrol y desajuste detectados con los instrumentos de autoevaluación).
La diferencia que resulta llamativa entre la estructura factorial medida mediante la autoevaluación y la medida mediante el reporte del clínico, es que en la primera se diferencia el síndrome de activación en dos componentes (motor y cognoscitivo), mientras que, en la segunda, es el componente de inhibición el que se descompone (inhibición e ideas depresivas). Esto podría indicar que la medición por parte del médico tratante hace poco énfasis en la sintomatología depresiva cuando se miden los síntomas de la enfermedad maníaco-depresiva. En este sentido, podría decirse que la EMUN-AR tiene una mayor capacidad para detectar la sintomatología mixta que la versión disponible de la escala utilizada por el médico tratante.
En cuanto al análisis de Rasch, se encontró que el instrumento tiene una adecuada dimensionalidad de los factores subyacentes, lo cual es de destacar ya que, si hay violaciones al supuesto de unidimensionalidad, las estimaciones de los parámetros de la escala y de los ítems pueden resultar sesgados por una mala especificación del modelo 38.
Los indicadores de confiabilidad del modelo de Rasch resultaron adecuados (se consideran como buenos los valores mayores de 0,8 excelentes, los mayores de 0,9) 39. Además, los índices de separación de ítems fueron adecuados, lo cual indica una correcta jerarquía de ítems y de personas. Se encontró que solamente uno de los ítems (ideación de muerte o suicidio) presentó indicadores marginales de mal funcionamiento, lo que se explicaría por varias razones:
este ítem constituyó un indicador de la gravedad del episodio y la muestra tuvo niveles más bajos del atributo de los que la escala permite detectar;
el ítem tuvo un mal ajuste y debe retirarse del instrumento;
los indicadores marginales de mal ajuste sugieren que este debía evaluarse nuevamente, aplicándolo en una muestra con una variabilidad mayor o incluyendo en la escala ítems adicionales que expandan el espectro depresivo u otros síntomas adicionales,y
el ítem podría dividirse en dos componentes independientes (muerte o suicidio), pues la causa de los parámetros estadísticos de ajuste podría ser una mala formulación del ítem.
Se consideró que esta última razón debía ser evaluada prioritariamente, por la cual se propuso ajustar el instrumento original e introducir esta modificación.
El desempeño de la escala de medición de los ítems evidenció que solamente tres de los diez niveles de medición utilizados resultaron adecuado: los pacientes no fueron capaces de discernir entre tantos puntos de medición (pudieron discriminar adecuadamente tres niveles en cada uno de los tres componentes de la escala).
El hallazgo de niveles de medición redundantes en los ítems se acompañó de una falta de orden en la detección de diferentes volúmenes de intensidad del atributo, lo que exige reajustar este sistema de medición: con solo tres niveles se podría evaluar adecuadamente cada síntoma en cualquiera de los tres componentes. Este hallazgo podría explicarse por la poca exposición de los pacientes a sistemas de medición de esta complejidad (son los médicos tratantes los que más están habituados a utilizar tales sistemas).
En cuanto a los mapas de personas e ítems, se destaca lo siguiente:
la escala EMUN-AR resultó ser más eficaz para medir cuadros graves de la enfermedad bipolar;
los cuadros leves no pudieron medirse adecuadamente;
si el paciente detectaba la baja intensidad de la voz y reportaba ideaciones de muerte o suicidio entre sus síntomas, el cuadro tenía más probabilidad de ser grave, y
si el aumento de sociabilidad era percibido por el paciente como molesto, había mayor probabilidad de que presentara un cuadro grave.
Teniendo en cuenta estos resultados, el diseño de un instrumento que permita medir todo el espectro de episodios de la enfermedad maníaco- depresiva, debe incluir ítems que cubran el espectro de menor gravedad. Dada la deficiente cobertura de síntomas correspondientes a episodios menos graves, la utilidad del instrumento en su versión actual puede ser mayor en servicios de hospitalización; sin embargo, ello no descarta que se pueda utilizar como un instrumento de autoevaluación que permita al paciente detectar la reactivación de episodios graves de la enfermedad.
El estudio tuvo las siguientes dos limitaciones. La primera es que la muestra representaba solo de manera parcial a los pacientes con cuadros graves de trastorno bipolar bajo tratamiento farmacológico en el hospital. Es posible que el tratamiento recibido distorsione la calidad de la medición de la autoevaluación. El hecho de que se tratara de pacientes hospitalizados implica que los síntomas iniciales (que no son tanto de inadaptación) no se registraron, lo que es una debilidad del instrumento. La segunda limitación es que no se registró el tiempo de hospitalización y no se puede descartar que, al ser tan prolongados los periodos de evolución de los síntomas, su percepción se atenúe.
La disponibilidad de este instrumento de autoevaluación supone continuar la investigación para agregarle nuevos ítems y, así, incorporar la medición de formas atenuadas de la enfermedad. Los estudios adicionales que midan la concordancia entre la evaluación médica y la autoevaluación del paciente, pueden dar información importante sobre puntos que no se hayan tenido en cuenta en la valoración clínica del paciente, lo cual sería útil en estudios de diagnóstico y seguimiento.
La escala EMUN-AR tiene una estructura factorial que incorpora diferentes componentes de la enfermedad maníaco-depresiva y no solo síntomas maníacos. El instrumento demostró tener valores adecuados de confiabilidad y, con excepción de un caso, un ajuste apropiado de los ítems. La escala de medición de los ítems evidenció problemas de redundancia y de falta de capacidad para detectar ordenadamente diferentes grados de intensidad del síntoma. Por esta razón, se modificó su estructura y se dejaron solo tres niveles (Anexo 1). La medición adecuada de todo el espectro de la enfermedad requerirá la incorporación de ítems adicionales que midan los síntomas de formas atenuadas.