Qué es la suma de cuadrados?
La suma de cuadrados (SS) es una herramienta estadística que se utiliza para identificar la dispersión de los datos, así como el grado de ajuste de los datos al modelo en el análisis de regresiónAnálisis de regresiónEl análisis de regresión es un conjunto de métodos estadísticos utilizados para estimar las relaciones entre una variable dependiente y una o más variables independientes.. La suma de cuadrados recibe su nombre porque se calcula hallando la suma de las diferencias al cuadrado.
Esta imagen es sólo para fines ilustrativos.
La suma de cuadrados es uno de los resultados más importantes del análisis de regresión. La regla general es que una suma de cuadrados más pequeña indica un mejor modelo, ya que hay menos variación en los datos.
En finanzas, entender la suma de cuadrados es importante porque los modelos de regresión linealMétodos de previsiónLos mejores métodos de previsión. En este artículo, explicaremos cuatro tipos de métodos de previsión de ingresos que los analistas financieros utilizan para predecir los ingresos futuros. se utilizan ampliamente en las finanzas, tanto en la teoría como en la práctica.
Tipos de suma de cuadrados
En el análisis de regresión, los tres tipos principales de suma de cuadrados son la suma total de cuadrados, la suma de cuadrados de regresión y la suma de cuadrados residual.
1. Suma total de cuadrados
La suma total de cuadrados es una variación de los valores de una variable dependienteVariable dependienteUna variable dependiente es una variable cuyo valor cambiará dependiendo del valor de otra variable, llamada variable independiente. a partir de la media muestral de la variable dependiente. Esencialmente, la suma de cuadrados cuantifica la variación total de una muestra. Se puede determinar mediante la siguiente fórmula:
Donde:
2. Suma de cuadrados de regresión (también conocida como suma de cuadrados debida a la regresión o suma de cuadrados explicada)
La suma de cuadrados de la regresión describe lo bien que un modelo de regresión representa los datos modelados. Una suma de cuadrados de regresión más alta indica que el modelo no se ajusta bien a los datos.
La fórmula para calcular la suma de cuadrados de la regresión es
Donde:
3. Suma residual de cuadrados (también conocida como suma de errores cuadrados de predicción)
La suma residual de los cuadrados mide esencialmente la variación de los errores de modelización. En otras palabras, representa cómo la variación de la variable dependiente en un modelo de regresión no puede ser explicada por el modelo. Generalmente, una suma de cuadrados residual más baja indica que el modelo de regresión puede explicar mejor los datos, mientras que una suma de cuadrados residual más alta indica que el modelo explica mal los datos.
La suma de cuadrados residual se puede encontrar utilizando la fórmula siguiente:
Dónde:
La relación entre los tres tipos de suma de cuadrados puede resumirse con la siguiente ecuación:
Recursos adicionales
Gracias por leer nuestro sitio web’Guía de la suma de cuadrados. Para seguir aprendiendo y avanzar en su carrera, los siguientes recursos de nuestro sitio web le resultarán útiles: