Factor de inflación de la variación (VIF) – Visión general, fórmula, usos

Qué es el factor de inflación de la varianza (VIF)?

El factor de inflación de la varianza (VIF) mide la gravedad de la multicolinealidad en el análisis de regresiónAnálisis de regresiónEl análisis de regresión es un conjunto de métodos estadísticos utilizados para estimar las relaciones entre una variable dependiente y una o más variables independientes.. Es un concepto estadístico que indica el aumento de la varianza de un coeficiente de regresión como resultado de la colinealidad.

Resumen

    Factor de inflación de la varianza y multicolinealidad

    En el análisis de regresión por mínimos cuadrados ordinarios (MCO), existe multicolinealidad cuando dos o más de las variables independientesVariable independienteUna variable independiente es un dato de entrada, un supuesto o un factor que se modifica para evaluar su impacto en una variable dependiente (el resultado). demostrar una relación lineal entre ellas. Por ejemplo, para analizar la relación entre el tamaño y los ingresos de las empresas y los precios de las acciones en un modelo de regresión, las capitalizaciones de mercado y los ingresos son las variables independientes.

    Una compañía’s market capitalizationCapitalización bursátil (Market Cap) es el valor de mercado más reciente de una empresa’s acciones en circulación. La capitalización bursátil es igual al precio actual de la acción multiplicado por el número de acciones en circulación. La comunidad inversora suele utilizar el valor de la capitalización bursátil para clasificar a las empresas y sus ingresos totales están muy correlacionados. A medida que una empresa obtiene mayores ingresos, también aumenta su tamaño. Se produce un problema de multicolinealidad en el análisis de regresión OLS. Si las variables independientes de un modelo de regresión muestran una relación lineal perfectamente predecible, se conoce como multicolinealidad perfecta.

    Con la multicolinealidad, los coeficientes de regresión siguen siendo consistentes pero ya no son fiables porque los errores estándar están inflados. significa que el modelo’El poder predictivo de la variable dependiente no se reduce, pero los coeficientes pueden no ser estadísticamente significativos con un error de tipo II Error de tipo IIEn las pruebas de hipótesis estadísticas, un error de tipo II es una situación en la que una prueba de hipótesis no rechaza la hipótesis nula que es falsa. Por otra parte.

    Por tanto, si los coeficientes de las variables no son significativos individualmente – no se puede rechazar en la prueba t, respectivamente – pero pueden explicar conjuntamente la varianza de la variable dependiente con rechazo en la prueba F y un elevado coeficiente de determinación (R2), podría existir multicolinealidad. Es uno de los métodos para detectar la multicolinealidad.

    El VIF es otra herramienta comúnmente utilizada para detectar si existe multicolinealidad en un modelo de regresión. Mide cuánto se infla la varianza (o el error estándar) del coeficiente de regresión estimado debido a la colinealidad.

    Uso del factor de inflación de la varianza

    El VIF puede calcularse mediante la siguiente fórmula:

    Donde Ri2 representa el coeficiente de determinación no ajustado para la regresión de la i-ésima variable independiente sobre las restantes. El recíproco del VIF se conoce como tolerancia. Para detectar la multicolinealidad se puede utilizar tanto el VIF como la tolerancia, según las preferencias personales.

    Si Ri2 es igual a 0, la varianza de las restantes variables independientes no puede predecirse a partir de la i-ésima variable independiente. Por lo tanto, cuando el VIF o la tolerancia es igual a 1, la i-ésima variable independiente no está correlacionada con las restantes, lo que significa que la multicolinealidad no existe en este modelo de regresión. En este caso, la varianza del i-ésimo coeficiente de regresión no está inflada.

    Por lo general, un VIF superior a 4 o una tolerancia inferior a 0.25 indica que podría existir multicolinealidad y que es necesario investigar más a fondo. Cuando el VIF es superior a 10 o la tolerancia es inferior a 0.1, hay una multicolinealidad significativa que debe corregirse.

    Sin embargo, también hay situaciones en las que se pueden ignorar con seguridad los VFI elevados sin sufrir multicolinealidad. A continuación se presentan tres situaciones de este tipo:

    1. Los VIF elevados sólo existen en las variables de control, pero no en las variables de interés. En este caso, las variables de interés no son colineales entre sí ni con las variables de control. Los coeficientes de regresión no se ven afectados.

    2. Cuando los VIF elevados se producen como resultado de la inclusión de los productos o potencias de otras variables, la multicolinealidad no causa impactos negativos. Por ejemplo, un modelo de regresión incluye tanto x como x2 como variables independientes.

    3. Cuando una variable ficticia que representa más de dos categorías tiene un VIF alto, la multicolinealidad no existe necesariamente. Las variables siempre tendrán VIF altos si hay una pequeña porción de casos en la categoría, independientemente de que las variables categóricas estén correlacionadas con otras variables.

    Corrección de la multicolinealidad

    Dado que la multicolinealidad infla la varianza de los coeficientes y provoca errores de tipo II, es esencial detectarla y corregirla. Hay dos formas sencillas y de uso común para corregir la multicolinealidad, que se enumeran a continuación:

    1. La primera es eliminar una (o más) de las variables altamente correlacionadas. Dado que la información proporcionada por las variables es redundante, el coeficiente de determinación no se verá muy afectado por la eliminación.

    2. El segundo método consiste en utilizar el análisis de componentes principales (ACP) o la regresión de mínimos cuadrados parciales (PLS) en lugar de la regresión OLS. La regresión PLS puede reducir las variables a un conjunto más pequeño sin correlación entre ellas. En el ACP se crean nuevas variables no correlacionadas. Minimiza la pérdida de información y mejora la predictibilidad de un modelo.

    Más recursos

    nuestro sitio web es el proveedor oficial de la Inteligencia Empresarial mundial & Analista de datos (BIDA)®Conviértase en un certificado de Business Intelligence & Analista de datos (BIDA)™De Power BI a SQL & El Aprendizaje Automático, la Certificación en Inteligencia de Negocios (BIDA) de nuestro sitio web le ayudará a dominar sus superpoderes analíticos. programa de certificación, diseñado para ayudar a cualquier persona a convertirse en un analista de talla mundial. Para seguir avanzando en su carrera, los recursos adicionales que aparecen a continuación le serán útiles:

      Deja un comentario