Què és l’interval de confiança?
Un interval de confiança, en estadístiques, fa referència a la probabilitat que un paràmetre de població caigui entre dos valors establerts per a una determinada proporció de vegades. Els intervals de confiança mesuren el grau d’incertesa o de certesa en un mètode de mostreig. Un interval de confiança pot assumir qualsevol quantitat de probabilitats, essent la més habitual un nivell de confiança del 95% o del 99%.
L’ interval de confiança i el nivell de confiança estan interrelacionats però no són exactament els mateixos.
Comprensió de l’interval de confiança
Els estadístics utilitzen intervals de confiança per mesurar la incertesa. Per exemple, un investigador selecciona diferents mostres aleatòriament de la mateixa població i calcula un interval de confiança per a cada mostra. Els conjunts de dades resultants són diferents; alguns intervals inclouen el veritable paràmetre de població i d’altres no.
Un interval de confiança és un rang de valors que probablement contindria un paràmetre de població desconegut. El nivell de confiança fa referència al percentatge de probabilitat o de certesa que l'interval de confiança contindria el paràmetre de població real quan es dibuixa una mostra aleatòria moltes vegades. O, a la llengua vernacular, "Estem segurs al 99% ( nivell de confiança) que la majoria d'aquests conjunts de dades (intervals de confiança) contenen el veritable paràmetre de població".
Punts clau
- Un interval de confiança calcula la probabilitat que un paràmetre de població caigui entre dos valors fixats. Els intervals de confiança mesuren el grau d’incertesa o seguretat en un mètode de mostreig. Molt sovint, els intervals de confiança reflecteixen nivells de confiança del 95% o 99%.
Càlcul d’un interval de confiança
Suposem que un grup d’investigadors estudia les altures dels jugadors de bàsquet de secundària. Els investigadors prenen una mostra aleatòria de la població i estableixen una alçada mitjana de 74 polzades. La mitjana de 74 polzades és una estimació puntual de la mitjana de la població. Una estimació puntual per si mateixa és d’utilitat limitada perquè no revela la incertesa associada a l’estimació; no teniu cap sentit sobre la distància que podria tenir aquesta mostra de 74 polzades de la mitjana de la població. El que falta és el grau d’incertesa d’aquesta mostra única.
Els intervals de confiança proporcionen més informació que les estimacions puntuals. En establir un interval de confiança del 95% utilitzant la mitjana i la desviació estàndard de la mostra i assumint una distribució normal tal com representa la corba de campana, els investigadors arriben a un límit superior i inferior que conté la mitjana veritable del 95% del temps. Suposem que l’interval és d’entre 72 polzades i 76 polzades. Si els investigadors prenen 100 mostres aleatòries de la població de jugadors de bàsquet de secundària en conjunt, la mitjana hauria d’incloure entre 72 i 76 polzades en 95 d’aquestes mostres.
Si els investigadors volen una confiança encara més gran, poden ampliar l’interval fins al 99% de confiança. Fer-ho invariablement crea una gamma més àmplia, ja que deixa lloc a un nombre més gran de mitjans de mostra. Si estableixen l’interval de confiança del 99% entre 70 i 78 polzades, poden esperar que 99 de 100 mostres avaluades tinguin un valor mitjà entre aquests nombres. Un nivell de confiança del 90% significa que esperaríem que el 90% de les previsions d’interval incloure el paràmetre de població. Així mateix, un nivell de confiança del 99% significa que el paràmetre inclòs el 95% dels intervals.
Concepcions errònies comunes sobre l'interval de confiança
La concepció errònia més gran quant als intervals de confiança és que representen el percentatge de dades d’una mostra determinada que es troba entre els límits superior i inferior. Per exemple, es podria interpretar erròniament l'esmentat interval de confiança del 99% de 70 a 78 polzades com a indicació que el 99% de les dades d'una mostra aleatòria es troba entre aquests números. Això és incorrecte, tot i que existeix un mètode independent d'anàlisi estadística per tal de determinar-lo. Fer-ho implica identificar la mitjana i la desviació estàndard de la mostra i representar aquestes xifres en una corba de campana.
