- Educación
- Ciencia
- Biología
- Cómo manejar la multiplicidad en los datos de los ensayos clínicos
Libro Relacionado
Por John Pezzullo
Cada vez que se realiza una prueba de significación estadística, se corre el riesgo de ser engañado por fluctuaciones aleatorias para que piense que hay algún efecto real presente en los datos cuando, de hecho, no existe ninguno.
Este escenario se denomina error de tipo I. Cuando usted dice que necesita p
Cuantos más análisis realice en un conjunto de datos, más aumentará su nivel alfa global: Realice dos pruebas y su probabilidad de que al menos una de ellas salga falsamente significativa es de alrededor del 10 por ciento; realice 40 pruebas y el nivel alfa total saltará al 87 por ciento. Esto se conoce como el problema de la multiplicidad, o como la inflación por error de tipo I.
Algunos métodos estadísticos que incluyen comparaciones múltiples (como las pruebas post-hoc que siguen a un ANOVA para comparar varios grupos) incorporan un ajuste incorporado para mantener el alfa general en sólo el 5 por ciento en todas las comparaciones. Pero cuando se prueban diferentes hipótesis, como comparar diferentes variables en diferentes puntos de tiempo entre diferentes grupos, depende de usted decidir qué tipo de estrategia de control alfa (si la hay) desea implementar.
Usted tiene varias opciones, incluyendo las siguientes:
- No controle la multiplicidad y acepte la probabilidad de que algunos de sus hallazgos «significativos» sean falsamente significativos. Esta estrategia se utiliza a menudo con hipótesis relacionadas con objetivos secundarios y exploratorios; el protocolo generalmente establece que no se harán inferencias finales a partir de estas pruebas exploratorias. Cualquier resultado «significativo» se considerará sólo como «señales» de posibles efectos reales y deberá ser confirmado en estudios posteriores antes de sacar conclusiones definitivas.
- Controla el nivel alfa sólo a través de las hipótesis más importantes. Si usted tiene dos objetivos co-primarios, puede controlar el alfa a través de las pruebas de esos dos objetivos. puede controlar el alfa al 5 por ciento (o a cualquier nivel que desee) a través de un conjunto de n pruebas de hipótesis de varias maneras, a continuación se presentan algunos de los más populares: El ajuste de Bonferroni: Pruebe cada hipótesis en el nivel alfa de 0.05/n. Por lo tanto, para controlar el alfa total hasta 0,05 en dos puntos finales primarios, se necesita p < 0,025 para la significación al probar cada uno de ellos: Clasifique los puntos finales en orden descendente de importancia. Pruebe el más importante primero, y si da p < 0.05, concluya que el efecto es real. A continuación, pruebe el siguiente más importante, de nuevo utilizando p < 0,05 para determinar su importancia. continúe hasta que obtenga un resultado no significativo (p > 0,05); a continuación, deje de realizar las pruebas (o considere que todas las pruebas adicionales son sólo exploratorias y no saque ninguna conclusión formal al respecto): Este enfoque se ha vuelto popular en los últimos años para tratar la multiplicidad a gran escala, que surge en áreas como las pruebas genómicas y el análisis de imágenes digitales que pueden implicar muchos miles de pruebas (como una por gen o una por píxel) en lugar de sólo unos pocos.en lugar de tratar de evitar incluso una sola conclusión falsa de importancia (como lo hacen los métodos de control de Bonferroni y otros métodos clásicos de control alfa), simplemente se quiere controlar la proporción de pruebas que resultan falsamente positivas, limitando la tasa de falsos descubrimientos a una fracción razonable de todas las pruebas. Estos resultados positivos pueden ser probados en un estudio de seguimiento.