Què és la regressió pas a pas?
L’anàlisi de regressió és un enfocament estadístic molt utilitzat que busca identificar relacions entre variables. La idea és agrupar dades rellevants per prendre decisions més ben informades i és una pràctica habitual en el món de la inversió. La regressió pas a pas és la construcció iterativa pas a pas d'un model de regressió que implica la selecció automàtica de variables independents. La disponibilitat de paquets de programari estadístic permet la regressió pas a pas, fins i tot en models amb centenars de variables.
Tipus de regressió pas a pas
L’objectiu subjacent de la regressió pas a pas és, mitjançant una sèrie de proves (proves F, proves t) trobar un conjunt de variables independents que influeixen significativament en la variable depenent. Això es fa amb els ordinadors mitjançant iteració, que és el procés d’arribar a resultats o decisions passant per rondes repetides o cicles d’anàlisi. La realització de proves automàticament amb l'ajut de paquets de programari estadístic té l'avantatge d'estalviar temps per a la persona.
Punts clau
- L'anàlisi de regressió és un enfocament estadístic que pretén entendre i mesurar les relacions entre variables independents i dependents. La regressió senzilla és un mètode que examina la significació estadística de cada variable independent dins del model. El mètode d’eliminació enrere comença amb un model carregat amb moltes variables i, a continuació, elimina una variable per comprovar la seva importància respecte als resultats generals. En cas contrari, la regressió té moltes crítiques, ja que s’enfoca les dades en un model per aconseguir el resultat desitjat.
Es pot aconseguir una regressió pas a pas o bé si es prova una variable independent alhora i s’inclou en el model de regressió si és significativa estadísticament o si s’inclouen totes les variables independents potencials al model i s’eliminen les que no són estadísticament significatives. Alguns utilitzen una combinació dels dos mètodes i, per tant, hi ha tres enfocaments per a la regressió pas a pas:
- La selecció davantera comença sense variables en el model, prova cada variable a mesura que s’afegeix al model i, a continuació, manté les que es consideren més significatives estadísticament; repetint el procés fins que els resultats siguin òptims. L’eliminació posterior comença amb un conjunt de variables independents, suprimir-ne un, alhora, fer proves per veure si la variable eliminada és estadísticament significativa. L’eliminació bidireccional és una combinació dels primers dos mètodes que posa a prova quines variables s’han d’incloure o excloure.
Un exemple de regressió pas a pas mitjançant el mètode d’eliminació endarrerida seria un intent d’entendre l’ús d’energia a una fàbrica mitjançant variables com ara el temps de funcionament d’equips, l’edat dels equips, la mida del personal, les temperatures exteriors i l’època de l’any. El model inclou totes les variables, a continuació, se n'eliminen cadascuna, per determinar quines són menys significatives estadísticament. Al final, el model pot demostrar que l’època i les temperatures són més importants, possiblement suggerint que el màxim consum d’energia a la fàbrica és quan l’ús de l’aire condicionat es troba al màxim.
Limitacions de la regressió pas a pas
L'anàlisi de regressió, tant lineal com multivariable, és àmpliament utilitzada avui en el món de les inversions. La idea és sovint trobar patrons que van existir en el passat i que també podrien repetir-se en el futur. Una simple regressió lineal, per exemple, podria considerar les ràtios preu-beneficis i els rendiments de les accions al llarg de molts anys per determinar si les accions amb ràtios P / E (variable independent) ofereixen rendiments més alts (variable dependent). El problema d’aquest plantejament és que sovint es canvien les condicions del mercat i les relacions que es van mantenir en el passat no es fan necessàries en el present o el futur.
Mentrestant, el procés de regressió pas a pas té moltes crítiques i fins i tot hi ha trucades per deixar d'utilitzar el mètode. Els estadístics constaten diversos inconvenients de l'enfocament, incloent-hi resultats incorrectes, un biaix inherent al procés mateix i la necessitat d'un poder informàtic important per desenvolupar models de regressió complexos mitjançant iteració.
