Estadística
Población y muestra en estadística
La diferencia entre población y muestra determina cómo se calculan la varianza, la desviación estándar y otros estadísticos. Entenderla evita errores graves en el análisis de datos.
Respuesta rápida
¿Cuál es la diferencia entre población y muestra?
La población incluye todos los elementos del grupo que se estudia. La muestra es un subconjunto de esa población, seleccionado para representarla sin necesidad de medir a todos.
Población: N elementos (todos)
Muestra: n elementos (subconjunto)
Varianza poblacional: σ² = Σ(xᵢ − μ)² / N
Varianza muestral: s² = Σ(xᵢ − x̄)² / (n−1)
Qué es una población en estadística
En estadística, la población es el conjunto completo de elementos sobre los que se quiere obtener información. Puede ser grande o pequeña, pero siempre incluye a todos sin excepción.
Si quieres conocer las notas de todos los alumnos de un colegio, la población son esos alumnos. Si quieres estudiar el peso de todos los estudiantes de una universidad, la población es todos los matriculados.
Los parámetros poblacionales se escriben con letras griegas: μ para la media, σ para la desviación estándar, N para el tamaño total.
Qué es una muestra
La muestra es una parte de la población, elegida para representarla de forma adecuada. Estudiar la muestra es más rápido, barato y viable cuando la población es grande.
Los estadísticos muestrales se escriben con letras latinas: x̄ para la media muestral, s para la desviación estándar muestral, n para el tamaño de la muestra.
Para que la muestra sea válida, debe ser representativa: incluir distintos subgrupos en proporciones similares a la población real.
Diferencias principales
| Aspecto | Población | Muestra |
|---|---|---|
| Tamaño | N (todos los elementos) | n (subconjunto) |
| Media | μ (mu) | x̄ (x barra) |
| Desviación estándar | σ (sigma) | s |
| Varianza | σ² = Σ/N | s² = Σ/(n−1) |
| Cuándo se usa | Cuando puedes medir todos | Cuando no es posible medir todos |
Por qué la varianza muestral divide por n−1
Si dividieras la varianza muestral por n (en lugar de n−1), el resultado subestimaría la varianza real de la población. Dividir por n−1 corrige ese sesgo.
Este ajuste se llama corrección de Bessel y es la razón por la que las calculadoras científicas ofrecen dos tipos de desviación estándar: σ (población) y s (muestra).
Datos: 4, 6, 8, 10, 12
Media: 8
Suma de diferencias²: (−4)²+(−2)²+0²+2²+4² = 40
σ² (población) = 40/5 = 8
s² (muestra) = 40/4 = 10
Cuándo usar población y cuándo usar muestra
Usa población cuando
- ▸ Tienes acceso a todos los datos
- ▸ El grupo es pequeño y manejable
- ▸ Los datos son históricos completos (ventas de un mes cerrado)
- ▸ No hay error de muestreo posible
Usa muestra cuando
- ▸ La población es muy grande
- ▸ Medir a todos es costoso o imposible
- ▸ Haces una encuesta o experimento
- ▸ Trabajas con datos de un estudio o investigación
Ejemplos resueltos
Ejemplo 1: alumnos de un colegio
Un colegio tiene 300 alumnos. Quieres calcular la nota media de todos. Como tienes acceso a todas las notas, usas la media poblacional μ y la desviación estándar σ (divisor N = 300).
Ejemplo 2: encuesta a 50 alumnos
Solo encuestas a 50 alumnos de ese colegio. Ahora trabajas con una muestra (n = 50). La media es x̄ y la desviación estándar es s, con divisor n−1 = 49.
Ejemplo 3: ventas de un mes
Tienes los datos de todas las ventas de enero. Como son datos completos y cerrados, es una población. Usas σ² dividiendo por N.
Ejemplo 4: encuesta de satisfacción
Encuestas a 200 clientes de entre 10 000 registrados. Trabajas con muestra (n = 200). Usas s² con divisor n−1 = 199 para estimar la dispersión real de todos los clientes.
Errores frecuentes
Dividir por n en varianza muestral
Si usas n en vez de n−1 para una muestra, subestimarás la dispersión real de la población.
Usar σ cuando los datos son muestra
Si calculas σ con datos muestrales, el resultado no es correcto. Debes usar s con divisor n−1.
Creer que la muestra siempre es representativa
Una muestra mal seleccionada puede estar sesgada. El tamaño no garantiza representatividad sin un buen muestreo.
Confundir N y n
N es el tamaño de la población completa. n es el tamaño de la muestra. En las fórmulas, el denominador correcto es uno u otro según el caso.
Calcula varianza y desviación estándar con la calculadora de varianza o la calculadora de estadística.
Artículos relacionados
Cómo interpretar la desviación estándar
Entiende qué mide la dispersión de tus datos.
Leer →
Cómo calcular la varianza
La varianza es el cuadrado de la desviación estándar.
Leer →
Cómo calcular la media
El valor central que resume un conjunto de datos.
Leer →
Qué es el porcentaje
Expresa una parte respecto al total en forma de fracción de 100.
Leer →