Page 2 - m5-unidad15-regresion
P. 2
Página del Colegio de Matemáticas del Plantel 8 de la ENP-UNAM Regresión lineal simple Autor: Dr. José Manuel Becerra Espinosa
REGRESIÓN LINEAL SIMPLE
UNIDAD OPTATIVA
1. IMPORTANCIA DEL ANÁLISIS DESCRIPTIVO DE DATOS BIVARIADOS
En el campo de la Estadística existen situaciones que requieren el análisis de más de una variable. Por
ejemplo, si se desea saber si existe una relación entre usar el teléfono celular mientras se conduce y tener
un accidente, o si están relacionadas la edad y el uso de videojuegos, o si tienden a tener mayor escolaridad
las personas con altos ingresos en comparación con las de bajos ingresos.
Hay muchas situaciones cotidianas que necesitan analizarse estadísticamente utilizando por lo menos dos
variables. El estudio estadístico de la asociación entre variables representa una parte básica del análisis
de datos en cuanto a que muchas de las preguntas e hipótesis que se plantean en los estudios que se
llevan a cabo en la práctica implican analizar la existencia de relación entre variables.
La existencia de algún tipo de asociación entre dos o más variables representa la presencia de algún tipo
de tendencia o patrón de emparejamiento entre los distintos valores de esas variables. Esto es, la
asociación entre dos variables indica que la distribución de los valores de una de las dos variables difiere
en función de los valores de la otra.
La asociación entre variables debe entenderse como un continuo que iría desde la ausencia de relación
(independencia) al nivel máximo de relación entre las variables. Este grado máximo se plasmaría en una
relación determinista, esto es, el caso en que a partir del valor de una variable, se puede afirmar cuál será
su valor en la otra variable.
Las medidas de asociación lineal, indican si existe alguna relación proporcional entre dos variables o
atributos de una misma muestra, es decir si una afecta a otra o viceversa. Dichas medidas únicamente son
calculables para variables cuantitativas y son la covarianza y el coeficiente de correlación.
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables.
A menudo resulta de interés conocer el efecto que una o varias variables pueden causar sobre otra, e
incluso predecir en mayor o menor grado valores de una variable a partir de otra. Por ejemplo, si se quisiera
estudiar si la altura de los padres influye significativamente en la de los hijos.
La regresión es el conjunto de técnicas usadas para explorar y cuantificar la relación de dependencia entre
una variable cuantitativa llamada variable dependiente o respuesta y una o más variables independientes
llamadas variables predictoras.
El primer paso para determinar si puede existir o no dependencia/relación entre variables es representando
gráficamente los pares de valores observados mediante una nube de puntos, lo que se conoce como
diagrama de dispersión.
2. DIAGRAMAS DE DISPERSIÓN
Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio.
Un diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos que
aparecen en pares, por ejemplo del tipo (, ), uno de cada conjunto. El diagrama muestra estos pares
como una nube de puntos.
Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma de las nubes.
1