Page 6 - m5-unidad04
P. 6

Página del Colegio de Matemáticas del Plantel 8 de la ENP-UNAM                                        Estadística para interpretar grandes cantidades de datos                                                                         Autor: Dr. José Manuel Becerra Espinosa



               La frecuencia acumulada relativa correspondiente al segundo valor de la variable,  , indica que el 83 por
                                                                                          2
               ciento de los retardos en la fábrica tiene una duración igual o inferior a 8 minutos. Como puede observarse,
               la primera frecuencia acumulada relativa es igual a la primera frecuencia relativa, y la última frecuencia
               acumulada relativa es igual a la unidad.

               En general:
                                                                     
                                                  +    + ⋯ +  = ∑  = 1
                                                                 
                                                1
                                                                          
                                                       2
                                                                     =1

               La tabla siguiente recoge los valores de la variable  y sus frecuencias, absolutas  y relativas, simples  y
               acumuladas.  Dado  su  contenido,  se  le  conoce  con  el  nombre  de  tabla  de  distribución  de  frecuencias.
               Considerando que todas las demás pueden obtenerse a partir de la frecuencia absoluta, se representa
               como los diferentes valores que en cada caso toma el par ( ,   ).
                                                                     
                                                                       


                                                                  
                                               
                                                                               
                                                                       
                                                      
                                                               
                                              6      13     0.43      13    0.43
                                              8      12     0.40      25    0.83
                                              12     5      0.17      30    1.00
                                            Total    30     1.00


               Hasta ahora, como se ha visto, la información se ha dispuesto asociando a cada valor de la variable su
               frecuencia. Esta forma de presentar los datos se utiliza cuando la variable toma un pequeño número de
               valores distintos. Ahora bien, si la variable toma un número grande o muy grande de valores distintos y se
               disponen los datos de esta manera, se obtienen unas columnas muy largas, que no proporcionan la visión
               de conjunto deseada.


               2.2. TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS CON DATOS AGRUPADOS

               Si el número de valores que toma la variable es suficientemente grande resulta aconsejable, para una
               mayor comodidad en el tratamiento de la información, agrupar estos valores en un número reducido de
               clases  o  intervalos.  La  agrupación  de  los  datos  facilita  su  manejo,  pero  debe  tenerse  en  cuenta  que,
               mientras que en las distribuciones no agrupadas disponemos de toda la información correspondiente a una
               variable, en las distribuciones agrupadas se pierde parte de la información.

               Un intervalo o clase es una serie de números incluidos entre dos extremos, así por ejemplo, el intervalo
               50– 55 está formado por 50, 51, 52, 53, 54  55, siendo 50 el límite inferior, 55 el límite superior.

               Existe una útil metodología para formar distribuciones de frecuencias para datos agrupados en intervalos
               que es la siguiente:

               Paso 1. Se calcula el rango ().- También se llama recorrido o amplitud total. Es la diferencia entre el valor
               mayor y el menor de los datos.

                                                        =    −  

               Paso 2. Se selecciona el número de intervalos de clase ().- No debe ser menor de 5 y mayor de 12, ya
               que un número mayor o menor de clases podría alterar el comportamiento de los datos. Para calcular el
               número de intervalos se aplica la regla de Sturges:

                                                     = 1 + 3.322 ∙  ()
                                                                    10


                                                              5
   1   2   3   4   5   6   7   8   9   10   11