¿Cómo se interpreta un histograma?
- Detalles
- Categoría: Minitab
- Visto: 25144
Los aspectos más importantes para interpretar de un histograma son su forma (que en general debe parecerse a una campana) y el rango de variación. De hecho, algunos histogramas incluyen una línea suavizada que resigue el perfil de las barras para facilitar su visualización.
Cuando nos referimos a la forma del histograma queremos describir si hay concentración de los datos en torno a un valor, el grado de dispersión y la presencia de patrones no aleatorios (varios grupos, anomalías, etc.)
¿Cómo se interpreta el rango de variación de un histograma?
En un histograma podemos interpretar como es la dispersión global de los datos (rango de variación) leyendo en el eje horizontal (eje x) de dónde a dónde va nuestra variable numérica. A partir de aquí nos podemos preguntar: ¿es la dispersión de los datos la que esperábamos? ¿Es la dispersión la que queremos? ¿Es posible cumplir las especificaciones con esta dispersión? Las respuestas a estas preguntas nos pueden dar pistas sobre cómo es el proceso y dónde actuar para mejorarlo.
¿Cómo se interpreta un histograma con forma simétrica?
Si el histograma muestra simetría y un solo pico, se asocia a que los datos se ajustan a una distribución Normal (de campana o de Gauss en honor al matemático que describió esta distribución). Pero lo importante no es el nombre que usemos para describir la forma, sino cómo la interpretamos y la información que extraemos.
En el histograma de abajo vemos la longitud de 100 piezas escogidas al azar que ha medido un ingeniero. El valor nominal de la longitud es 600, y se pretende comprobar si están dentro de tolerancias (599, 601). En el gráfico vemos que la mayoría de las piezas tienen una longitud entre 599 y 600. La forma de campana nos dice que la frecuencia con la que encontramos piezas con longitudes superiores e inferiores al intervalo 599-600 disminuye a medida que nos alejamos del intervalo. Además, cuando observamos el rango de variación, podemos ver que hay muchas piezas que están fuera de tolerancias; más por debajo que por encima porque la distribución (la campana) no está centrada en tolerancias.
¿Cómo se interpreta un histograma con forma asimétrica?
En otros casos, el histograma muestra asimetría, que puede ser a la derecha (si hay un pico con una cola a la derecha) o a la izquierda (si hay un pico con una cola a la izquierda). En este caso, se interpreta que hay un alto número de valores alrededor del pico y que, en el caso de la asimetría a la derecha, los valores se alejan más del pico por la derecha que por la izquierda, es decir, hay menos valores (y más cercanos) por debajo del pico, y más lejanos con frecuencia decreciente por encima del pico.
En otros casos, el histograma muestra asimetría, que puede ser a la derecha (si hay un pico con una cola a la derecha) o a la izquierda (si hay un pico con una cola a la izquierda). En este caso, se interpreta que hay un alto número de valores alrededor del pico y que, en el caso de la asimetría a la derecha, los valores se alejan más del pico por la derecha que por la izquierda, es decir, hay menos valores (y más cercanos) por debajo del pico, y más lejanos con frecuencia decreciente por encima del pico.
¿Cómo se interpretan otras formas en un histograma?
Otra forma habitual en el histograma es encontrar dos (o más) picos. Esto suele ser un indicador de que hay otra variable (que no estamos visualizando directamente) que separa en grupos nuestra variable numérica porque no está fija y afecta. Podría tratarse de tiempos de espera de entre semana vs. fin de semana o de piezas fabricadas en la máquina 1 y la máquina 2. Es importante en estos casos indagar más para identificar cuál es la variable que cambia y luego tratar cada grupo por separado.
En el ejemplo observamos tres picos en forma de campana que, en conjunto, tienen un rango de variación que hace que no entren en tolerancias. Debemos sospechar que hay alguna variable oculta (que de momento no tenemos en cuenta y no visualizamos) que separa la variable vibración en tres grupos. A pesar de que globalmente la variable no entra en tolerancias (ni por debajo ni por arriba), hay que indagar más sobre los tres grupos porque individualmente tienen poca variación (inferior al rango de tolerancias) y si se pudieran centrar lograríamos fabricar dentro de tolerancias.
¿Cómo se identifican los valores atípicos?
Siguiendo con el concepto del rango de variación, cuando se observan valores muy dispersos (alejados de la mayoría de los valores) y con poca frecuencia nos puede indicar que se trata de valores atípicos, es decir, inusuales. Es importante indagar en el porqué de esos valores, puesto que podemos descubrir información muy valiosa. Puede que se trate de un valor atípico porque hubo un defecto de fabricación, de materia prima o porque estamos comparando el tiempo de espera en un día festivo, o simplemente podemos descubrir que hubo un error al entrar el dato.
¿QUIERE MÁS INFORMACIÓN?
Si le apetece indagar más sobre esta herramienta u otras que pueda utilizar para entender e interpretar mejor sus datos, consulte nuestro curso de Diagnóstico con visualización de datos con Minitab.