Què és el biaix de selecció d’exemple?
El biaix de selecció de mostra és un tipus de biaix causat per l'elecció de dades no aleatòries per a anàlisis estadístiques. El biaix existeix a causa d’un defecte en el procés de selecció d’exemple, on un subconjunt de les dades s’exclou sistemàticament a causa d’un atribut particular. L’exclusió del subconjunt pot influir en la significació estadística del test o produir resultats distorsionats.
Comprensió del biaix de selecció d’exemple
El biaix de supervivència és un tipus comú de biaix de selecció de mostres. Per exemple, quan es faci una prova posterior d’una estratègia d’inversió en un gran grup d’accions, pot ser convenient buscar títols que tinguin dades durant tot el període de la mostra. Si anéssim a provar l'estratègia amb dades de borsa per valor de 15 anys, ens podríem inclinar a cercar existències que tinguin informació completa durant tot el període de 15 anys. Tanmateix, eliminar una borsa que va deixar de cotitzar, o poc després sortir del mercat, suposaria un biaix a la nostra mostra de dades. Com que només incloem accions que han durat els 15 anys, els resultats finals seran defectuosos, ja que funcionen prou bé per sobreviure al mercat.
Els índexs de rendiment de fons de cobertura són un exemple de biaix de selecció de mostres subjecte a biaix de supervivència. Com que els fons de cobertura que no sobreviuen deixen de reportar el seu rendiment als agregadors d’índexs, els índexs resultants s’inclinen naturalment cap als fons i les estratègies que queden, per tant, “sobreviuran”. També pot ser un problema amb els serveis populars d’informació de fons mutus.
Els analistes poden ajustar-se per tenir en compte aquests biaixos, però poden introduir biaixos de notícies en el procés.
