Page 26 - m5-unidad04
P. 26
Página del Colegio de Matemáticas del Plantel 8 de la ENP-UNAM Estadística para interpretar grandes cantidades de datos Autor: Dr. José Manuel Becerra Espinosa
La desviación estándar es una medida estadística de la dispersión de un grupo o población. Una gran
desviación estándar indica que la población está muy dispersa respecto de la media. Una desviación
estándar pequeña indica que la población está muy compacta alrededor de la media.
VARIANZA
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.
Cuanto mayor sea la varianza mayor dispersión existirá y por tanto, menor representatividad tendrá la
media aritmética. La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas
al cuadrado.
La varianza de un conjunto de datos se define como el cuadrado de la desviación estándar y está dada
por:
2
v
Ejemplo.
En una veterinaria se hicieron las mediciones de la altura, en centímetros, de cinco perros de diferentes
razas, obteniendo los siguientes datos: 60, 47, 17, 43, 30. Determinar su desviación estándar y su varianza.
Solución.
Calculando la media aritmética:
60 47 17 43 30 197
x 39 4 . cm .
5 5
5
xx 60 39 4 . 47 39 4 . 17 39 4 . 43 39 4 . 30 39 4 . 2
2
2
2
2
2
i 1
5
xx 20 6 . 2 6 . 7 2 22 4 . 2 6 . 3 2 9 4 . 2 424 . 36 57 . 76 501 . 76 12 . 96 88 . 36 1085 2 .
2
i 1
n
x x 2
i
i 1 1085 2 . 217 . 04 14 . 73 cm .
n 5
La varianza es: v 2 217 . 04 cm .
La interpretación de este resultado es que la estatura promedio de los perros es de 39.4 y que la altura
se aleja o dispersa en promedio 14.73 . alrededor de la media. En otras palabras, como la desviación
estándar es grande respecto al valor 39.4 significa que los valores en el conjunto de datos están lejos de la
media.
4.3. MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS
Las medidas de tendencia central pueden ser insuficientes sobre todo cuando se desea presentar el
análisis con respecto a la posición que ocupa la información que resulte relevante. Para esto se utilizan las
medidas de posición, llamadas también medidas de localización.
Las medidas de posición permiten conocer otros puntos característicos de la distribución que no son los
valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en
tramos iguales.
Para caracterizar el valor de una observación se puede establecer una estructura divisional (ascendente o
descendente) para situar la posición relativa de un caso en el marco de su población de referencia. Las
medidas de posición permiten dividir la distribución en un variable número de segmentos llamados cuantiles
que facilitan la ubicación de orden de un sujeto o caso sobre un conjunto de los datos. Estas medidas
25