Experimentación con criterios estadísticos

Hoy quiero hablarte sobre la importancia de mejorar tu estrategia experimental para obtener DATOS de calidad. Esto permitirá que Minitab te proporcione un análisis fiable, facilitando una toma de decisiones más acertada. Al final del artículo, también comparto algunas malas prácticas comunes para que puedas evitarlas.

No confundamos análisis con plan de pruebas que es donde tú puedes aportar valor.

¿CÓMO DEMOSTRAR QUE ALGO FUNCIONA?

Las experiencias de “experimentar” siempre van acompañadas de la pregunta ¿Funciona? Por ello me viene a la mente el popular producto orientado a bajar el colesterol. Te has preguntado alguna vez, ¿qué evidencias esperas encontrar en los estudios científicos que avalan el éxito del producto para decidir incorporarlo a tu cesta de la compra convencida de que merece la pena el gasto? Y si quieres hacer previamente tú misma un estudio, ¿cómo lo harías teniendo en cuenta las evidencias que necesitas?

En todo estudio hay dos componentes:

  1. Diseño de experimentos
  2. Análisis de resultados

Siempre, hemos de entender cómo explotaremos los resultados analíticos que nos dará un software, para aportar valor en nuestro trabajo, diseñando las pruebas y recogida de datos con metodología propia de la Ingeniería Estadística.

CASO DE ESTUDIO: REDUCCIÓN DEL COLESTEROL

Vamos a abordar esta cuestión comenzando por el final, el análisis, con un caso simple y ficticio que persigue reducir el colesterol.

Imaginemos que tenemos datos sobre los niveles de colesterol de personas que SÍ han tomado y que NO han tomado el tratamiento. Este es un diseño de experimentos con un factor y dos tratamientos independientes. ¿Qué aporta el tener 10 o 50 personas participando en cada grupo?
Gráfica de valores individuales del tratamiento para n=10
Gráfica de valores individuales del tratamiento para n=50

 

Para estudiar la diferencia entre dos tratamientos haremos uso de Intervalos de Confianza (IC):

Comparación de tratamientos para n=10
  • n=10. La diferencia obtenida es de mejora en 14,6 puntos, pero no es evidente que esa diferencia sea por el tratamiento. La horquilla (-27, 56) indica que ese resultado también se podría haber obtenido si el tratamiento empeorara en 27 puntos o si lo mejorara en 56 puntos, situaciones muy diferentes, luego n=10 aporta muy poco conocimiento.
Comparación de tratamientos para n=50
  • n=50. En este caso podemos asegurar con 95% de confianza que el tratamiento mejora entre 2 y 37 puntos.

Con n=50 detectamos un efecto que con n=10 también está, pero que no lo podemos ver con evidencia. El hecho de tener individuos con tanta variabilidad dificulta la detección del efecto. En este caso, el tamaño de muestra afecta a la potencia de detectar evidencia del efecto del tratamiento. Estamos en manos de la “suerte” de obtener dos muestras que evidencien la diferencia.

Para reducir la variabilidad y obtener resultados más precisos, aumentar el tamaño de la muestra es una estrategia efectiva.

ALTERNATIVA: DISEÑO DE EXPERIMENTOS APAREADO

En este caso, es posible utilizar una contramedida mejor para atacar la variabilidad entre individuos, que es cambiar el tipo de diseño experimental y que sea la misma persona la que se utiliza para medir el colesterol antes y después del tratamiento. La consecuencia de poder obtener el incremento de colesterol para cada persona es que el diseño de partida necesita muchas menos personas en el estudio.

Tanto la manera de “mirar los datos” como la manera de analizarlos es diferente, ya que es un diseño de experimentos apareado.

Gráfica de series de tiempo del tratamiento para n=10
Gráfica de series de tiempo del tratamiento para n=50

 

Y, realizando una prueba de hipótesis t pareada:

Comparación de tratamientos con t pareada para n=10
  • n=10. La diferencia obtenida de mejora en 14,6 puntos muestra una evidencia de que el tratamiento afecta. Además, estimamos con un 95% de confianza de que el efecto, aunque nos haya salido 14,6 en la muestra, en realidad está en la horquilla (7 y 22).

LA IMPORTANCIA DEL DISEÑO EXPERIMENTAL

Si comprendemos los diferentes tipos de diseño y su interpretación, podemos delegar el análisis en Minitab, que proporciona herramientas intuitivas y amigables para este proceso.

Asistente de Minitab para pruebas de  hipótesis

 

Llegados a este punto, ¿cuál es nuestro rol? La respuesta es “lograr experimentar de manera eficiente, con el mínimo de pruebas y logrando datos de calidad, fiables”. Por ello, tenemos que aportar valor en:

  1. Seleccionar el tipo de diseño experimental adecuado a cada situación.
  2. Determinar el tamaño de muestra de las réplicas para cada tratamiento.
  3. Organizar las pruebas experimentales para minimizar factores externos que puedan afectar los resultados, de modo que “lo único que cambie sea el tratamiento de estudio”.

Minitab también ayuda a determinar el tamaño de muestra adecuado. Bien desde el propio Minitab o bien desde el asistente proporcionado por el módulo del tamaño de la muestra, podemos determinar cuántos individuos son necesarios para llevar a cabo la comparación de 2 tratamientos.

Asistente de Minitab para pruebas de  hipótesis
Potencia y tamaño de la muestra para prueba de hipótesis t pareada
  • Si utilizo un diseño apareado de comparación de 2 muestras con n=10 personas midiendo antes-después se logra una potencia de 80% de detectar cambios de 20 puntos o más, y si se deseara detectar cambios más pequeños de 10 puntos haría falta en torno a n=34 personas.
Potencia y tamaño dela muestra para pruebas de hipótesis de 2 muestras
  • Si el diseño no es apareado, en la misma situación de variabilidad, los recursos necesarios cambiarían notablemente (17 personas en cada grupo en el primer caso, luego 34, y 64 en el segundo).

ERRORES COMUNES EN EL DISEÑO EXPERIMENTAL

Un error frecuente es asumir que porque MINITAB puede analizar datos con una estructura determinada, el resultado será fiable.

Por ejemplo, si buscamos personas que ya toman Danacol y comparamos su colesterol actual con registros médicos previos, podría parecer un diseño apareado, pero no lo es. Factores como dieta y ejercicio también pueden influir, generando confusión en los resultados.

De hecho, si leemos la letra pequeña del anuncio del producto da qué pensar...

“Según estudios científicos, Danacol, como complemento a un estilo de vida saludable, reduce tu colesterol alto entre un 7 y un 10% en tan solo 2-3 semanas

CONCLUSIÓN

Si nos dotamos de la habilidad de manejar un software como Minitab para chequear evidencias de un experimento, y comprendemos el efecto de variabilidad y tamaño de muestra en el poder de detección de efectos, seremos precavidos y eficientes incorporando este conocimiento a la táctica experimental.

Recuerda: una buena estrategia experimental es clave para obtener datos confiables y tomar decisiones fundamentadas.

¿QUIERES APLICAR ESTAS HERRAMIENTAS A TUS DATOS?

Si adquirimos la habilidad de diseñar experimentos adecuados y utilizamos Minitab para analizar los datos correctamente, podremos tomar decisiones informadas basadas en evidencia sólida.

En nuestro curso de Diseño y análisis de experimentos con Minitab (I) desarrollamos habilidades para lograr experimentar de manera eficiente, con el mínimo de pruebas y logrando datos de calidad.

Si desea recibir una propuesta formal del coste del curso en su caso particular, póngase en contacto con nuestro departamento comercial por teléfono (934154904 o 915158276) o a través de este  FORMULARIO