Page 2 - m5-unidad15-regresion
P. 2

Página del Colegio de Matemáticas del Plantel 8 de la ENP-UNAM                                                    Regresión lineal simple                                                                                                       Autor: Dr. José Manuel Becerra Espinosa


                                                                     REGRESIÓN LINEAL SIMPLE

                                                                                 UNIDAD OPTATIVA



               1.  IMPORTANCIA DEL ANÁLISIS DESCRIPTIVO DE DATOS BIVARIADOS

               En el campo de la Estadística existen situaciones que requieren el análisis de más de una  variable. Por
               ejemplo, si se desea saber si existe una relación entre usar el teléfono celular mientras se conduce y tener
               un accidente, o si están relacionadas la edad y el uso de videojuegos, o si tienden a tener mayor escolaridad
               las personas con altos ingresos en comparación con las de bajos ingresos.

               Hay muchas situaciones cotidianas que necesitan analizarse estadísticamente utilizando por lo menos dos
               variables. El estudio estadístico de la asociación entre variables representa una parte básica del análisis
               de datos en cuanto a que muchas de las preguntas e hipótesis que se plantean en los estudios que se
               llevan a cabo en la práctica implican analizar la existencia de relación entre variables.

               La existencia de algún tipo de asociación entre dos o más variables representa la presencia de algún tipo
               de  tendencia  o  patrón  de  emparejamiento  entre  los  distintos  valores  de  esas  variables.  Esto  es,  la
               asociación entre dos variables indica que la distribución de los valores de una de las dos variables difiere
               en función de los valores de la otra.

               La asociación entre variables debe entenderse como un continuo que iría desde la ausencia de relación
               (independencia) al nivel máximo de relación entre las variables. Este grado máximo se plasmaría en una
               relación determinista, esto es, el caso en que a partir del valor de una variable, se puede afirmar cuál será
               su valor en la otra variable.

               Las  medidas  de  asociación  lineal,  indican  si  existe  alguna  relación  proporcional  entre  dos  variables  o
               atributos de una misma muestra, es decir si una afecta a otra o viceversa. Dichas medidas únicamente son
               calculables para variables cuantitativas y son la covarianza y el coeficiente de correlación.

               El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables.
               A menudo resulta de interés conocer el efecto que una o varias variables pueden causar sobre otra, e
               incluso predecir en mayor o menor grado valores de una variable a partir de otra. Por ejemplo, si se quisiera
               estudiar si la altura de los padres influye significativamente en la de los hijos.

               La regresión es el conjunto de técnicas usadas para explorar y cuantificar la relación de dependencia entre
               una variable cuantitativa llamada variable dependiente o respuesta y una o más variables independientes
               llamadas variables predictoras.

               El primer paso para determinar si puede existir o no dependencia/relación entre variables es representando
               gráficamente los  pares  de valores observados mediante una  nube  de  puntos, lo que se conoce como
               diagrama de dispersión.


               2. DIAGRAMAS DE DISPERSIÓN

               Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio.

               Un diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos que
               aparecen en pares, por ejemplo del tipo (, ), uno de cada conjunto. El diagrama muestra estos pares
               como una nube de puntos.

               Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma de las nubes.



                                                              1
   1   2   3   4   5   6   7