logo MTMMatemáticas en tu mundo

 Matemáticas

y Sociedad

   

 

        

¿Con una muestra pequeña podemos conocer una población grande?

   

Para responder a esa pregunta nos va a ser útil la siguiente imagen borrosa:

muestra

Pero antes, revisemos algunas cuestiones:

Dos clases de estadísticas
La estadística es un conjunto de métodos científicos para la recogida de datos, su organización y análisis, con el fin de conocer algunas características de una población (de personas, animales, objetos, etc.). Hay dos tipos de estadística, la descriptiva y la inferencial.
Supongamos que quiero estudiar los hábitos de consumo de los vecinos de mi edificio. Entrevistaré a todos ellos y con sus respuestas haré cálculos. Por ejemplo, conoceré con exactitud el porcentaje de fumadores o el consumo medio mensual de carne. Habré realizado una estadística descriptiva.
Supongamos ahora que quiero estudiar los hábitos de consumo de los habitantes de mi ciudad. Entrevistaré a algunos de ellos (una muestra) y con sus respuestas haré cálculos en base a los cuales haré estimaciones (aproximaciones) del porcentaje de fumadores o del consumo medio mensual de carne. Habré realizado una estadística inferencial.
La estadística descriptiva trabaja con datos de todos los elementos de una población. La estadística inferencial trabaja con datos de una muestra de los elementos de una población. Al proceso de selección de la muestra se le llama muestreo.

¿Por qué una muestra?
La estadística descriptiva es más fiable, pues recoge datos de toda la población; mientras que en la estadística inferencial puede haber un error en la estimación, pues solo toma datos de una muestra, la cual puede ser reflejo más o menos fiel de la población completa. Por ejemplo, al estudiar los hábitos de consumo en mi ciudad tal vez los porcentajes de fumadores o de vegetarianos de la muestra no coincidan con los que tiene la población y eso haga que mis estimaciones se alejen de la realidad. Entonces, ¿por qué se toman los datos de una muestra en vez de hacerlo de toda la población? Se hacen muestreos por razones económicas, pues encuestar a una gran población sería lento y costoso; hacerlo con una muestra es mucho más rápido y barato. Pero también se hacen muestreos porque hay observaciones que suponen la destrucción del objeto observado, como ocurre con algunos controles de calidad.

¿Cómo es posible que con los datos de pocos sepamos algo de todos?
Es posible, con un grado de aproximación aceptable. Así, si en un país viven 12.000.000 de personas, una muestra de 4.800 de ellas puede servir para conocer bastante bien a toda la población. Lo vamos  a ver con un ejemplo gráfico.
En una imagen de 4.000 x 3.000 pixeles hay un total de 12.000.000 pixeles o puntos de color. Se divide la imagen en pequeños cuadrados de 50 x 50 pixeles. Cada cuadrado tiene 2.500 pixeles. Se elige al azar uno de ellos y se pinta con su color el cuadrado entero. Es decir, donde antes teníamos 2.500 puntos de color, ahora solo tenemos uno (más grande).
La nueva imagen ha perdido definición y tiene 12.000.000 : 2.500 = 4.800 puntos. El resultado es la imagen borrosa del principio. Obsérvala de nuevo. ¿Sabes decir cuál es el tema o contenido de la imagen?

Ahora comprueba si tu estimación era acertada, viendo la imagen con toda su resolución: aquí
Seguro que supiste de qué se trataba, tal vez sin detalles, pero lo esencial lo captaste. Con las muestras estadísticas pasa igual que con la anterior imagen. No permiten conocer todos los matices pero dan un conocimiento aproximado de la realidad.

Representatividad.
Comprenderás la importancia de que la muestra esté bien elegida siguiendo con el ejemplo de la imagen anterior. Si la muestra de 2.500 pixeles no hubiese sido tomada cubriendo toda la imagen sino solo en una zona, eso nos podría llevar a falsas conclusiones. Supongamos que la muestra se toma en la parte izquierda de la imagen, como verás a continuación:

muestra

¿Cuál pensaríamos que es el tema de la imagen? Probablemente, hierba en primer plano y agua al fondo… ni rastro de la familia. Ese ejemplo gráfico nos revela que, para poder sacar conclusiones aceptables de una población, debemos tomar una muestra representativa.
Una muestra es representativa cuando describe acertadamente las características de la población original. En el ejemplo ya citado de la estadística sobre hábitos de consumo, no sería representativa de toda la población una muestra tomada exclusivamente en una residencia de ancianos, cuyas costumbres son diferentes a las de otros sectores de edad. Se dice que esa es una muestra sesgada. La muestra representativa debe incluir a todos los grupos sociales, reproduciendo su peso en la población.
¿Sabías que?...
En las elecciones presidenciales de EE.UU. de 1936, ganadas por Franklin D. Roosevelt del Partido Demócrata, una revista hizo una encuesta de intención de voto a más de cuatro millones de sus lectores y se equivocó en el pronóstico. Otra encuesta realizada sólo a 4.500 personas anunció el éxito de Roosevelt con mucha exactitud. La razón es que en el primer caso la muestra no era representativa de la sociedad norteamericana, pues todos eran suscriptores de esa misma revista, afín al Partido Republicano. Sin embargo, en las 4.500 personas de la segunda muestra estaban bien
representados todos los sectores e ideologías de dicha sociedad.

 

   
El

 

 

 

(C) José María Sorando Muzás                                                 

                e-mail                                        web bajo licencia Ceative Commons 3.0 España