Què és un factor d'inflació variant?
La variació de la inflació El factor d’inflació de la variància (VIF) és una mesura de la quantitat de multicollinearitat d’un conjunt de variables de regressió múltiples. Matemàticament, el VIF d’una variable de model de regressió és igual a la relació de la variància del model global a la variància d’un model que només inclou aquesta única variable independent. Aquesta relació es calcula per a cada variable independent. Un VIF alt indica que la variable independent associada és altament col·laborativa amb les altres variables del model.
Punts clau
- Un factor d'inflació de variació (VIF) proporciona una mesura de multicolinealitat entre les variables independents en un model de regressió múltiple. La detecció de la multicolinealitat és important perquè, si bé no redueix la potència explicativa del model, redueix la importància estadística de les variables independents. Un VIF gran sobre una variable independent indica una relació altament collineal amb les altres variables que s'han de considerar o ajustar en l'estructura del model i la selecció de variables independents.
Comprensió d'un factor d'inflació de variància
S'utilitza una regressió múltiple quan una persona vol provar l'efecte de diverses variables sobre un resultat concret. La variable depenent és el resultat que estan exercint les variables independents, que són les entrades al model. Existeix multicolinealitat quan hi ha una relació lineal, o correlació, entre una o més de les variables o entrades independents. La multicollinearitat crea un problema en la regressió múltiple, ja que com que les entrades estan influenciant-se entre elles, en realitat no són independents, i és difícil provar quant afecta la combinació de variables independents o el resultat, dins del model de regressió.. En termes estadístics, un model de regressió múltiple on hi hagi una multicolinealitat elevada farà més difícil estimar la relació entre cadascuna de les variables independents i la variable dependent. Petits canvis en les dades utilitzades o en l’estructura de l’equació del model poden produir canvis grans i errràtics en els coeficients estimats sobre les variables independents.
Per garantir que el model s’especifica correctament i funciona correctament, hi ha proves que es poden executar per multicollinearitat. El factor d'inflació de variacions és una eina de mesura. L'ús de factors d'inflació de la variació ajuda a identificar la gravetat de qualsevol problema de multicolinealitat de manera que es pugui ajustar el model. El factor d’inflació de variància mesura quant la influència o la inflació de la seva interacció / correlació amb la resta de variables independents és influenciada o inflada pel comportament d’una variable independent. Els factors d’inflació de les variacions permeten una mesura ràpida de la quantitat que una variable contribueix a l’error estàndard de la regressió. Quan hi hagi problemes multicollinearisitats importants, el factor d’inflació de la variació serà molt gran per a les variables implicades. Després d'identificar aquestes variables, es poden utilitzar diversos enfocaments per eliminar o combinar variables collineals, resolent el problema de la multicollinearitat.
Si bé la multicolinealitat no redueix la potència predictiva global d’un model, pot produir estimacions dels coeficients de regressió que no són estadísticament significatius. En certa manera, es pot pensar com una espècie de doble recompte en el model. Quan dues o més variables independents estan estretament relacionades o mesuren gairebé la mateixa cosa, l'efecte subjacent que mesuren es comptabilitza dues vegades (o més) a les variables, i és difícil o impossible dir quina variable realment influeix en la variable independent. Aquest és un problema perquè l’objectiu de molts models economètrics és provar exactament aquest tipus de relació estadística entre les variables independents i la variable dependent.
Per exemple, si un economista vol provar si hi ha una relació estadísticament significativa entre la taxa d’atur (com a variable independent) i la taxa d’inflació (com a variable dependent). Incloure variables independents addicionals relacionades amb la taxa d’atur, com ara una nova demanda inicial d’ocupació, seria probable que introduís la multicollinearitat al model. El model global pot mostrar un poder explicatiu fort, estadísticament suficient, però incapaç d’identificar si l’efecte es deu majoritàriament a la taxa d’atur o a les noves reclamacions inicials d’ocupació. Això és el que detectaria el VIF i suggeriria que possiblement es deixés fora del model una de les variables o es trobi alguna manera de consolidar-les per capturar el seu efecte conjunt, segons quina hipòtesi concreta estigui interessada a provar.
