Què és la regressió lineal múltiple - MLR?
La regressió lineal múltiple (MLR), també coneguda simplement com a regressió múltiple, és una tècnica estadística que utilitza diverses variables explicatives per predir el resultat d’una variable de resposta. L’objectiu de la regressió lineal múltiple (MLR) és modelar la relació lineal entre la variable explicativa (independent) i la variable de resposta (dependent).
En essència, la regressió múltiple és l'extensió de la regressió ordinària de menys quadrats (OLS) que implica més d'una variable explicativa.
La fórmula per a la regressió lineal múltiple és
Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵ, per a i = n observacions: yi = dependent variablexi = variables expanatòriesβ0 = y-intercepta (constant) terme) βp = coeficients de pendent per a cada variable explicativaϵ = terme d'error del model (també conegut com a residuals)
Explicació de la regressió lineal múltiple
Una regressió lineal simple és una funció que permet a un analista o estadista fer prediccions sobre una variable en funció de la informació que es coneix sobre una altra variable. La regressió lineal només es pot utilitzar quan es tenen dues variables contínues: una variable independent i una variable dependent. La variable independent és el paràmetre que s’utilitza per calcular la variable o el resultat depenent. Un model de regressió múltiple s’estén a diverses variables explicatives.
El model de regressió múltiple es basa en els següents supòsits:
- Existeix una relació lineal entre les variables dependents i les variables independents. Les variables independents no estan massa correlacionades entre si. Les observacions se seleccionen de forma independent i aleatòria entre la població. Els residuals haurien de distribuir-se normalment amb una mitjana de 0 i variació. σ.
El coeficient de determinació (quadrat R) és una mètrica estadística que s'utilitza per mesurar quant de la variació en el resultat es pot explicar per la variació de les variables independents. R 2 sempre augmenta a mesura que s’afegeixen més predictors al model de MLR tot i que pot ser que els predictors no estiguin relacionats amb la variable de resultat.
Per tant, R 2 no es pot utilitzar per identificar quins predictors han de ser inclosos en un model i quins haurien d'excloure. R 2 només pot estar entre 0 i 1, on 0 indica que no es pot predir el resultat per cap de les variables independents i 1 indica que el resultat es pot predir sense error de les variables independents.
Quan s'interpreta els resultats d'una regressió múltiple, els coeficients beta són vàlids mantenint constants totes les altres variables ("totes iguals"). La sortida d'una regressió múltiple es pot mostrar horitzontalment com una equació o verticalment en forma de taula.
Exemple amb regressió lineal múltiple
Per exemple, un analista pot voler saber com afecta el moviment del mercat al preu d’Exxon Mobil (XOM). En aquest cas, la seva equació lineal tindrà el valor de l’índex S&P 500 com a variable independent o predictora i el preu d’XOM com a variable dependent.
En realitat, hi ha múltiples factors que prediuen el resultat d’un esdeveniment. El moviment de preus d’Exxon Mobil, per exemple, depèn més que del rendiment del mercat global. Altres predictors, com ara el preu del petroli, els tipus d’interès i el moviment de preus dels futurs del petroli, poden afectar el preu de la XOM i els preus d’accions d’altres companyies petrolieres. Per entendre una relació en què hi ha més de dues variables, s’utilitza una regressió lineal múltiple.
La regressió lineal múltiple (MLR) s'utilitza per determinar una relació matemàtica entre un nombre de variables aleatòries. En altres termes, la MLR examina com es relacionen diverses variables independents amb una variable depenent. Una vegada que cadascun dels factors independents s'ha determinat per predir la variable depenent, es pot utilitzar la informació de les múltiples variables per crear una predicció precisa del nivell d'efecte que tenen sobre la variable de resultat. El model crea una relació en forma de línia recta (lineal) que s’aproxima millor a tots els punts de dades individuals.
En referència a l’equació de la MLR anterior, en el nostre exemple:
- y i = variable dependent: preu de XOMx i1 = tipus d’interèsx i2 = preu del petroli i3 = valor de S&P 500 indexx i4 = preu dels futurs del petroli 0 0 = intercepció y al moment zeroB 1 = coeficient de regressió que mesura un canvi unitari en el dependent. variable quan x i1 canvia - el canvi en el preu XOM quan canvien els tipus d’interèsB 2 = valor de coeficient que mesura un canvi unitari de la variable dependent quan x i2 canvia - el canvi de preu XOM quan els preus del petroli canvien
Les estimacions de menys quadrats, B 0, B 1, B 2… B p, es calculen generalment mitjançant programari estadístic. Al model de regressió es poden incloure moltes variables en què es diferencia cada variable independent amb un nombre: 1, 2, 3, 4… pàg. El model de regressió múltiple permet a un analista predir un resultat basat en la informació proporcionada sobre diverses variables explicatives.
Tot i així, el model no sempre és perfectament exacte, ja que cada punt de dades pot diferir lleugerament del resultat previst pel model. El valor residual, E, que és la diferència entre el resultat real i el resultat previst, s’inclou al model per tenir en compte aquestes petites variacions.
Si suposem que executem el nostre model de regressió de preus XOM mitjançant un programari de càlcul d’estadístiques, que retorna aquesta sortida:
Un analista interpretarà aquesta sortida per significar que si es mantenen altres variables constants, el preu de la XOM augmentarà un 7, 8% si el preu del petroli als mercats augmenta un 1%. El model també mostra que el preu de la XOM disminuirà un 1, 5% després d’una pujada de l’1% dels tipus d’interès. R 2 indica que el 86, 5% de les variacions en el preu de les accions d’Exxon Mobil es pot explicar per canvis en el tipus d’interès, el preu del petroli, els futurs del petroli i l’índex S&P 500.
Punts clau
- La regressió lineal múltiple (MLR), també coneguda simplement com a regressió múltiple, és una tècnica estadística que utilitza diverses variables explicatives per predir el resultat d'una variable de resposta. La regressió multipla és una extensió de la regressió lineal (OLS) que utilitza només una variable explicativa. La MLR s'utilitza àmpliament en economia i economia.
La diferència entre la regressió lineal i la múltiple
La regressió lineal (OLS) compara la resposta d'una variable dependent donat un canvi en alguna variable explicativa. Tanmateix, és rar que una variable dependent només s’expliqui per una sola variable. En aquest cas, un analista utilitza una regressió múltiple, que intenta explicar una variable dependent utilitzant més d'una variable independent. Les regressions múltiples poden ser lineals i no lineals.
Les regressions múltiples es basen en el supòsit que hi ha una relació lineal entre les variables dependents i independents. Tampoc assumeix cap correlació important entre les variables independents.
