Regresión lineal múltiple – Visión general, fórmula, cómo funciona

Qué es la regresión lineal múltiple?

La regresión lineal múltiple se refiere a una técnica estadística que se utiliza para predecir el resultado de una variable en función del valor de dos o más variables. A veces se conoce simplemente como regresión múltiple, y es una extensión de la regresión lineal. La variable que queremos predecir se conoce como variable dependiente, mientras que las variables que utilizamos para predecir el valor de la variable dependienteVariable dependienteUna variable dependiente es una variable cuyo valor cambiará en función del valor de otra variable, llamada variable independiente. se conocen como variables independientes o explicativas.

Figura 1: Predicciones del modelo de regresión lineal múltiple para observaciones individuales (Fuente)

Resumen

    Fórmula de regresión lineal múltiple

    Donde:

      Comprender la regresión lineal múltiple

      La regresión lineal simple permite a los estadísticos predecir el valor de una variable utilizando la información disponible sobre otra variable. La regresión lineal intenta establecer la relación entre las dos variables a lo largo de una línea recta.

      La regresión múltiple es un tipo de regresión en el que la variable dependiente muestra una lineal relación con dos o más variables independientes. También puede ser no lineal, donde las variables dependientes e independientesVariable independienteUna variable independiente es un insumo, un supuesto o un impulsor que se modifica para evaluar su impacto en una variable dependiente (el resultado). no siga una línea recta.

      Tanto la regresión lineal como la no lineal hacen un seguimiento de una respuesta concreta utilizando dos o más variables de forma gráfica. Sin embargo, la regresión no lineal suele ser difícil de ejecutar, ya que se crea a partir de suposiciones derivadas del ensayo y error.

      Supuestos de la regresión lineal múltiple

      La regresión lineal múltiple se basa en los siguientes supuestos:

      1. Una relación lineal entre las variables dependientes e independientes

      El primer supuesto de la regresión lineal múltiple es que existe una relación lineal entre la variable dependiente y cada una de las variables independientes. La mejor manera de comprobar las relaciones lineales es crear gráficos de dispersión y luego inspeccionar visualmente los gráficos de dispersión para comprobar la linealidad. Si la relación mostrada en el diagrama de dispersión no es lineal, entonces el analista tendrá que ejecutar una regresión no lineal o transformar los datos utilizando un software estadístico, como el SPSS.

      2. Las variables independientes no están altamente correlacionadas entre sí

      Los datos no deben mostrar multicolinealidad, que se produce cuando las variables independientes (variables explicativas) están muy correlacionadas. Cuando las variables independientes muestran multicolinealidad, habrá problemas para averiguar la variable específica que contribuye a la varianza de la variable dependiente. El mejor método para comprobar la hipótesis es el método del factor de inflación de la varianza.

      3. La varianza de los residuos es constante

      La regresión lineal múltiple supone que la cantidad de error en los residuos es similar en cada punto del modelo lineal. Esta situación se conoce como homocedasticidad. Al analizar los datos, el analista debe trazar los residuos estandarizados frente a los valores predichos para determinar si los puntos se distribuyen equitativamente entre todos los valores de las variables independientes. Para comprobar la hipótesis, los datos pueden representarse en un gráfico de dispersión o utilizar un programa estadístico para producir un gráfico de dispersión que incluya todo el modelo.

      4. Independencia de la observación

      El modelo supone que las observaciones deben ser independientes entre sí. En pocas palabras, el modelo supone que los valores de los residuos son independientes. Para comprobar este supuesto, utilizamos el estadístico Durbin Watson.

      La prueba mostrará valores de 0 a 4, donde un valor de 0 a 2 muestra autocorrelación positiva, y los valores de 2 a 4 muestran autocorrelación negativa. El punto medio, i.e., un valor de 2, muestra que no hay autocorrelación.

      5. Normalidad multivariante

      La normalidad multivariante se produce cuando los residuos se distribuyen normalmente. Para comprobar este supuesto, observe cómo se distribuyen los valores de los residuos. También se puede comprobar mediante dos métodos principales, i.e., un histograma con una curva normal superpuesta o el método del diagrama de probabilidad normal.

      Más recursos

      Gracias por leer nuestro sitio web’Guía de la regresión lineal múltiple. Para seguir aprendiendo y desarrollando su base de conocimientos, explore los recursos adicionales relevantes de nuestro sitio web que aparecen a continuación:

        Deja un comentario