Error típico (o error estándar)

Las investigaciones rara vez se hacen sobre el conjunto de la población; lo habitual es realizarlas en un subconjunto (muestra) de ella. Esta práctica está justificada porque la teoría estadística establece que, si la muestra se selecciona aleatoriamente, sus características (forma de la distribución, media, desviación estándar, etc.) son parecidas a las de la población y tanto más parecidas cuanto mayor sea la muestra.

En la figura 2 se representa el histograma de la edad de una muestra aleatoria de 100 individuos extraída de la población representada en la figura 1 A (que eran 100.000 individuos). Obsérvese que es parecido al de la población aunque, por ejemplo, su ajuste a la curva normal es peor.

Histograma de frecuencias de la edad en una muestra  aleatoria de 100 individuos de la población representada  en la figura 1. A. En la muestra la media es 46,2 y la desviación  estándar 14,7.

Si no ve correctamente la imagen, puede descargarse este PDF.

En esta muestra, la media y la desviación estándar son 46,2 y 14,7 respectivamente, también parecidas a las de la población. Si se tomara otra muestra aleatoria se obtendrían otros valores distintos, aunque probablemente también parecidos a los de la población (que son 44,5 de media y 14,9 desviación estándar).

El error estándar de la media (en inglés “standard error of the mean”; SEM o SE) es el valor que cuantifica cuánto se apartan los valores de la media de la población. Es decir, el error estándar de la media cuantifica las oscilaciones de la media muestral (media obtenida en base a los datos medidos en la muestra utilizada) alrededor de la media poblacional (verdadero valor de la media). Es una medida del error que se comete al tomar la media calculada en una muestra como estimación de la media de la población total.

A partir del error estándar se construye el intervalo de confianza de la medida correspondiente.

1) El error estándar de la media estimado en la muestra del ejemplo es 1,47. Se calcula dividiendo la desviación estándar por la raíz cuadrada del tamaño muestral 14,7/√100=14,7/10

2) Calculado a partir de él, el intervalo de confianza al 95% para la media va desde 43,3 a 49,1

  • Límite inferior = media - 1,96 veces el error estándar = 46,2 – 1,96 * 1,47 = 43,3 (límite inferior)
  • Límite superior = media + 1,96 veces el error estándar = 46,2 + 1,96 * 1,47 = 49,1 (límite superior)

Este es uno de los métodos estadísticos que exige normalidad de la población. Quiere decir que podemos afirmar, con una confianza del 95%, que la media poblacional está incluida en dicho intervalo. Compárese con el valor de la media poblacional (verdadero valor de la media) que, en este ejemplo y en contra de lo que ocurre en las investigaciones reales, es conocido. Vemos que el valor verdadero (44,5 años) está dentro del intervalo de confianza que habíamos calculado (43,3 – 49,1). Por tanto, hablar de una confianza del 95% significa que en el 95% de las posibles muestras que podríamos tomar de la población total, la edad media (44,5) estaría contenida en el intervalo construido.

Ejemplos extraídos de: http://www.elsevier.es/es/revistas/semergen-medicina-general--familia-40/desviacion-estandar-error-estandar-13041428-notas-estadisticas-2002

Para saber más