Page 6 - m5-unidad04
P. 6
Página del Colegio de Matemáticas del Plantel 8 de la ENP-UNAM Estadística para interpretar grandes cantidades de datos Autor: Dr. José Manuel Becerra Espinosa
La frecuencia acumulada relativa correspondiente al segundo valor de la variable, , indica que el 83 por
2
ciento de los retardos en la fábrica tiene una duración igual o inferior a 8 minutos. Como puede observarse,
la primera frecuencia acumulada relativa es igual a la primera frecuencia relativa, y la última frecuencia
acumulada relativa es igual a la unidad.
En general:
+ + ⋯ + = ∑ = 1
1
2
=1
La tabla siguiente recoge los valores de la variable y sus frecuencias, absolutas y relativas, simples y
acumuladas. Dado su contenido, se le conoce con el nombre de tabla de distribución de frecuencias.
Considerando que todas las demás pueden obtenerse a partir de la frecuencia absoluta, se representa
como los diferentes valores que en cada caso toma el par ( , ).
6 13 0.43 13 0.43
8 12 0.40 25 0.83
12 5 0.17 30 1.00
Total 30 1.00
Hasta ahora, como se ha visto, la información se ha dispuesto asociando a cada valor de la variable su
frecuencia. Esta forma de presentar los datos se utiliza cuando la variable toma un pequeño número de
valores distintos. Ahora bien, si la variable toma un número grande o muy grande de valores distintos y se
disponen los datos de esta manera, se obtienen unas columnas muy largas, que no proporcionan la visión
de conjunto deseada.
2.2. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS CON DATOS AGRUPADOS
Si el número de valores que toma la variable es suficientemente grande resulta aconsejable, para una
mayor comodidad en el tratamiento de la información, agrupar estos valores en un número reducido de
clases o intervalos. La agrupación de los datos facilita su manejo, pero debe tenerse en cuenta que,
mientras que en las distribuciones no agrupadas disponemos de toda la información correspondiente a una
variable, en las distribuciones agrupadas se pierde parte de la información.
Un intervalo o clase es una serie de números incluidos entre dos extremos, así por ejemplo, el intervalo
50– 55 está formado por 50, 51, 52, 53, 54 55, siendo 50 el límite inferior, 55 el límite superior.
Existe una útil metodología para formar distribuciones de frecuencias para datos agrupados en intervalos
que es la siguiente:
Paso 1. Se calcula el rango ().- También se llama recorrido o amplitud total. Es la diferencia entre el valor
mayor y el menor de los datos.
= −
Paso 2. Se selecciona el número de intervalos de clase ().- No debe ser menor de 5 y mayor de 12, ya
que un número mayor o menor de clases podría alterar el comportamiento de los datos. Para calcular el
número de intervalos se aplica la regla de Sturges:
= 1 + 3.322 ∙ ()
10
5