La recopilación de datos aleatorios no es un trabajo de monos
- Detalles
- Categoría: Minitab
- Visto: 8070
El otro día alguien me preguntó: “¿Cómo escribes tus blogs?"
“Es realmente sencillo," le contesté. "Solo aplico el teorema del mono infinito".
Según el teorema del mono infinito, si un número suficiente de monos escriben al azar en un teclado durante un tiempo suficientemente largo (infinito), será casi seguro que produzcan cualquier texto dado: como una obra de Shakespeare, la Constitución de los EEUU o la ayuda de Minitab.
Una premisa clave es el concepto de aleatoriedad. Los monos deben ser igualmente propensos a clicar cualquier tecla del teclado. Eso hace que la eventual escritura del Hamlet, o cualquier otra obra, sea teóricamente posible con un número suficiente de pruebas.
De hecho, un desarrollador de software puso a pureba este teorema el verano pasado simulando el tecleo aleatorio de "infinitos monos". Sus tropas virtuales de cibersimios generó más de 7 billones de grupos de caracteres aleatorios, y al hacerlo reprodujeron las obras completas de Shakespeare.
La aleatorización en la práctica: hombre vs mono
Por supuesto, a diferencia de los monos teóricos, los monos de verdad no clican aleatoriamente. Para probarlo, los investigadores de la Universidad de Plymouth colocaron un ordenador de escritorio en un recinto con seis macacos negros crestados. Los monos golpearon al ordenador con una piedra, hicieron caca y se orinaron sobre él, y escribieron la letra "S" una y otra vez.
No es exactamente el mejor ejemplo de aleatoriedad estadística.
Dejándolo solo a nuestros instintos naturales, los humanos solo lo hacemos un poco mejor al aleatorizar. Hace unos años, estaba asesorando a un investigador graduado que estaba analizando la calidad de unos huevos en un centro agrícola. Le pregunté "Se han seleccionado aleatoriamente los huevos del estudio?".
El investigador respondió "Sí". El seleccionó "cualquier huevo" de un carrito que contenía pilas de bandejas llenas de huevos , sin realmente pensar en ello.
Uff. Aquí es donde nuestro concepto cotidiano e intuitivo de la palabra "aleatorio" nos lleva por mal camino. El significado cotidiano de "aleatorio" está realmente más cerca de "al azar" o "de cualquier manera". Le falta la definición rigurosamente estadística de "equiprobabilidad".
Si se toman huevos de las bandejas apiladas en un carrito, ¿cada huevo tiene la misma probabilidad de ser cogido? Probablemente no. La proximidad de los huevos, la posición de la bandeja en el carrito, su color, su forma o condición podrían influenciar (consciente o inconscientemente) su selección.
Entonces, ¿por qué los estadísticos son tan quisquillosos respecto a la aleatoriedad? Si una muestra es propensa a un sesgo selectivo, entonces los resultados de su análisis se aplicarán solo a una muestra, no a la población más grande de la que proviene la muestra. No será posible extrapolar mucho de esos resultados.
La aleatorización en la práctica: Minitab vs hombre
Los datos aleatorios, entonces, en el sentido estadístico estricto, no se recopilan al azar, en el sentido cotidiano. Eso requiere un poco de previsión y planificación.
Como aleatorizador, Minitab Statistical Software supera a los monos y a los humanos sin lugar a dudas.
Supongamos que deseamos tomar una simple muestra aleatoria de 10 artículos de un grupo de 100.000 artículos. Entramos los valores de 1 a 100.000 en la hoja de trabajo de Minitab, en la columna C1, para representar cada elemento. (Consejo: a menos que se desee sentirse cmo un mono escribiendo hasta el infinito, para hacer esto utilice Calc > Crear patrones de datos > Conjunto simple de números)
A continuación, elija Calc > Datos aleatorios > Muestreo por columnas e indique el número de filas (elementos) desea muestrear, en este caso 10.
Aquí está la muestra que se obtuvo: por supuesto, cada una será diferente.
Ahora, quizás piense que podría haber escogido 10 valores aleatoriamente por Vd. mismo. Créame, no puede. Si no me cree tómese un minuto para ver este video de unos inteligentes niños.
Nota del autor: Algunos matemáticos cuestionan el teorema del mono infinito, argumentando que, para todos los propósitos prácticos, la probabilidad de recrear con éxito cualquier trabajo dado al teclear al azar es realmente nula, basándose en la ley de los grandes números.
Pero no estody de acuerdo. Ayer puse un mono junto a un teclado. En su primer intento, el mono cró al azar una versión más clara e inteligente del código fiscal federal de los EEUU. En su segundo intento, consiguió Finnegan's Wake. Y en su tercer intento, consiguió este blllooooooggg ssssssssssssssssssssss$&%&^%