Hvordan bruke Chi Square Test av Independence

Hvordan bruke Chi Square Test av Independence


Chi-kvadrat-test av uavhengighet (TØI) er en statistisk test som hjelper deg å avgjøre om to variablene er korrelert. Du bruker chi-kvadrat TOI når du vil sammenligne en måling på tvers av ulike kategorier. La oss si, for eksempel at du ønsker å sammenligne antall studenter som får Som mellom fem forskjellige skoler i rike og fattige distrikter (fem kategorier). Eller kanskje du ønsker å sammenligne antall blomster som er røde og andelen som er rosa i fire geografiske regioner. Chi-kvadrat test vil hjelpe deg å avgjøre om det er en sammenheng mellom disse variablene.

Bruksanvisning

1 Definer nullhypotese. Nullhypotesen forutsetter at de to variablene er uavhengige av hverandre, og at det ikke er noen korrelasjon. La oss si, for eksempel at du ser på antall studenter som fikk score i en av 3 områder (gode, gjennomsnittlig og dårlige) på en standardisert test, og du sammenligner resultatene fra fem ulike skolekretser. Nullhypotesen er at de relative proporsjoner i de gode, gode og dårlige kategorier vil være den samme i alle fem distrikter. Med andre ord, bør prosentandelen av elever i hver kategori være den samme i alle fem distrikter dersom nullhypotesen er sann.

2 Sett opp en tabell over dine data. Du kan bruke et regnearkprogram hvis du har en å gjøre dette trinnet enda enklere. Kolonnene vil være ett sett av kategorier, og radene vil være en annen. For eksempel, hvis du arbeider med elevene fra de fem skolekretser, vil kolonnene være Utmerket, Gjennomsnittlig, og dårlig (for antall studenter med score i hver serie), mens radene ville være navnene på de fem skole distrikter. Hver celle i tabellen, da, ville inneholde antall studenter som scoret i et bestemt område i et bestemt distrikt.

3 Legg opp antallet i hver kolonne og dele det med det totale antall individer i tabellen for å finne den forventede prosentandel. I skolen eksempel, for eksempel, la oss si 700 studenter i alle fem skolekretser tok standardisert test, og 300 scoret i Utmerket utvalg, 200 i gjennomsnittlig rekkevidde, og 200 i Dårlig rekkevidde. Hvis du deler 300/700, har du 0,429 eller 42,9 prosent, noe som betyr at 42,9 prosent av alle elevene var i utmerket kategori. Dersom nullhypotesen er sann, er det ingen forskjell mellom distriktene; så hvis vi godtar nullhypotesen, ville vi forvente 42,9 prosent av elevene i hvert distrikt som har scoret i utmerket kategori. Derfor er 42,9 din forventede prosentandel.

4 Multipliser det totale antallet i hver rad med forventet prosentandel for hver kolonne for å finne den forventede verdien for hver celle. I skolen eksempel, for eksempel, la oss si 200 studenter i Lamont skolekrets tok testen. Siden den forventede prosentandelen er 42,9, forventer du at 42,9 prosent eller 86 av disse elevene oppnådde en score på Utmerket utvalg. Dette er den forventede verdien for hvor mange gode poengsummer på Lamont.

5 Ta Observert nummeret (det faktiske antallet i tabellen) for hver celle og trekke fra den forventede verdien (antall du regnet fra siste trinnet). Fortsetter med skolen eksempel, la oss si at for Lamont skolekrets, de observerte verdiene i de gode, gjennomsnittlig og dårlig kolonner var 100, 50 og 50, mens de forventede verdiene var 86, 20 og 94. Hvis du trekker fra forventet fra observert for hver kolonne, du har 14, 30 og -44.

6 Square hvert resultat fra det siste trinnet, og deretter dele det med forventet verdi for denne cellen. Fortsetter med skolen eksempel, hvis du kvadrat 14 du har 196; når du deler dette med 86 (forventet verdi for denne cellen) du har nå 2,28. Hvis du gjør det samme for de andre to kolonner for Lamont distriktet, har du 45 og 20,5.

7 Oppsummere eller legge sammen alle resultatene fra trinn 6 for tabellen. Fortsetter skoler eksempel, la oss si den totale chi-squared sum for hele tabellen viser seg å være 100.

8 Trekk en fra antall rader i tabellen, og deretter trekke en fra antall kolonner i tabellen. Til slutt, multiplisere disse to resultatene etter hverandre. Fortsetter skoler eksempel bordet hadde 3 kolonner og 5 rader. 5 -1 = 4 og 3 - 1 = 2, så 2 x 4 = 8. Dette tall er de frihetsgrader.

9 Klikk på linken under Resources for å hente en tabell over chi-kvadrat verdier. Finn nummeret som svarer til dine frihetsgrader fra siste trinn i kolonnen "df", deretter sammenligne resultatet fra trinn 7 med nummeret i p = 0,05 kolonne. Hvis resultatet fra trinn 7 er større enn antallet i p = 0,05 kolonne, kan du trygt forkaste nullhypotesen; resultatene tyder på det er faktisk en sammenheng mellom disse variablene. Dersom, på den annen side, er resultatet mindre enn antallet som vises, kan du ikke avvise nullhypotesen; du ikke har tilstrekkelig bevis til å vise en sammenheng.

Fortsetter med skoler eksempel, hadde du 8 grader av frihet og en chi-kvadrat verdi på 100. Verdien på p = 0,05 kolonnen for 8 frihetsgrader er 15.51. Derfor kan du trygt forkaste nullhypotesen.

Hint

  • Merk at du bare kan bruke chi-kvadrat test for antall individer, ikke prosent eller proporsjoner.
  • Et regneark program kan gjøre alle disse beregningene for deg og gjøre oppgaven mye enklere. Faktisk kan du sannsynligvis sette opp en formel som vil automatisere hele prosessen. Se i brukerhåndboken for regnearkprogrammet til å finne ut hvordan du gjør dette.
  • Husk at korrelasjonen ikke lik årsakssammenheng. Med skoledistriktene, for eksempel, har du bevis som tyder på en sammenheng mellom distrikt og elevprestasjoner. Det betyr ikke nødvendigvis at imidlertid at undervisningskvalitet i hvert distrikt avgjør elevenes resultater - det kan godt være andre faktorer involvert som forklarer sammenhengen.