Què és una estadística de Chi-Square?
Un quadrat chi ( χ 2) estadística és una prova que mesura com es comparen les expectatives amb les dades reals observades (o els resultats del model). Les dades utilitzades per calcular una estadística de chi-quadrat han de ser aleatòries, brutes, mútuament exclusives, extretes de variables independents i extretes d’una mostra prou gran. Per exemple, els resultats de llançar una moneda 100 vegades compleixen aquests criteris.
Les proves de Chi-square s’utilitzen sovint en proves d’hipòtesis.
La fórmula de Chi-Square Is
χc2 = ∑ (Oi − Ei) 2Ei on: c = graus de llibertatO = valor (s) observat E = valor (s) esperat (e) begin {alineat} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {on:} \ & c = \ text {graus de llibertat} \ & O = \ text {valor (s) observat}} \ & E = \ text {valor (s) esperat } \ \ end {alineat} χc2 = ∑Ei (Oi −Ei) 2 on: c = graus de llibertatO = valor (s) observat E = valor (s) esperat
Què et diu una estadística de Chi-Square?
Hi ha dos tipus principals de proves de chi-quadrat: la prova de la independència, que planteja una qüestió de relació, com ara: "Hi ha una relació entre el gènere i les puntuacions SAT?"; i el test de bondat d’adaptació, que pregunta alguna cosa com ara "Si una moneda es llança 100 vegades, apareixerà els caps 50 vegades i les cues 50 vegades?"
Per a aquestes proves s’utilitzen graus de llibertat per determinar si es pot rebutjar una determinada hipòtesi nul·la en funció del nombre total de variables i mostres de l’experiment.
Per exemple, quan es consideri l’elecció dels estudiants i el curs, és probable que la mida d’una mostra de 30 o 40 estudiants no sigui prou gran com per generar dades significatives. L’obtenció dels mateixos o similars resultats d’un estudi utilitzant una mida de 400 o 500 estudiants és més vàlida.
En un altre exemple, plantegeu llençar una moneda 100 vegades. El resultat esperat de llançar una moneda justa 100 vegades és que els caps arribaran 50 vegades i les cues arribaran 50 vegades. El resultat real podria ser que els caps pugen 45 vegades i les cues pugen 55 vegades. L'estadística de chi-quadrat mostra discrepàncies entre els resultats esperats i els resultats reals.
Exemple d’una prova de Chi-Squared
Imagineu que es va fer una enquesta aleatòria a 2.000 votants diferents, tant masculins com femenins. Les persones que van respondre estaven classificades segons el sexe i si eren republicanes, demòcrates o independents. Imagineu-vos una graella amb les columnes etiquetades republicana, demòcrata i independent i dues files etiquetades masculí i femení. Suposem que les dades dels 2.000 enquestats són les següents:
El primer pas per calcular l’estadística de chi quadrat és trobar les freqüències esperades. Es calculen per a cada "cel·la" de la graella. Com que hi ha dues categories de gènere i tres categories de visió política, hi ha sis freqüències totals previstes. La fórmula de la freqüència esperada és:
E (r, c) = n (r) × c (r) en qualsevol lloc: r = fila en questionc = columna en questionn = total corresponent \ begin {alineat} & E (r, c) = \ frac {n (r) times c (r)} {n} \ & \ textbf {where:} \ & r = \ text {fila en qüestió} \ & c = \ text {columna en qüestió} \ & n = \ text {total corresponent} \ \ end {align} E (r, c) = nn (r) × c (r) on: r = fila en questionc = columna en questionn = total corresponent
En aquest exemple, les freqüències esperades són:
- E (1, 1) = (900 x 800) / 2.000 = 360E (1, 2) = (900 x 800) / 2.000 = 360E (1, 3) = (200 x 800) / 2.000 = 80E (2, 1) = (900 x 1.200) / 2.000 = 540E (2, 2) = (900 x 1.200) / 2.000 = 540E (2, 3) = (200 x 1.200) / 2.000 = 120
A continuació, s'utilitzen valors per calcular l'estadística de chi quadrat mitjançant la fórmula següent:
Chi-squared = ∑2E (r, c) on: O (r, c) = dades observades per a la fila i columna indicades \ begin {align} & \ text {Chi-squared} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {on:} \ & O (r, c) = \ text {dades observades per a la fila i columna indicades} \ \ end {alineat} Chi-squared = ∑E (r, c) 2 on: O (r, c) = dades observades per a la fila i columna donades
En aquest exemple, l'expressió de cada valor observat és:
- O (1, 1) = (400 - 360) 2/360 = 4, 44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2, 96O (2, 2) = (600 - 540) 2/540 = 6, 67O (2, 3) = (100 - 120) 2/120 = 3, 33
L'estadística de chi quadrats aleshores equival a la suma d'aquests valors, o 32, 41. A continuació, podem mirar una taula estadística de quadrats quadrats per veure, atès els graus de llibertat en la nostra configuració, si el resultat és estadísticament significatiu o no.
