Hvordan bruke Chi Square Analysis

Hvordan bruke Chi Square Analysis


Den mest vanlige bruken av chi kvadrat statistisk test er Pearsons test. I denne analysen blir frekvensen av forekomsten av ulike kategoriske variabler ble funnet i en prøve, sammenlignet mot forventede frekvenser for populasjonen som undersøkes. Forutsatt at utvalgs proporsjoner avviker fra den forventede befolknings proporsjoner, den chi kvadrat analyse svarer på spørsmålet: Hva er sannsynligheten for den observerte forskjellen skyldes utelukkende til tilfeldig variasjon forventet når du tar en prøve fra en større populasjon?

Bruksanvisning

1 Ta et representativt utvalg fra en større populasjon som du ønsker å studere. Som et eksempel anta at du ønsker å finne ut om en Jelly Bean emballasje maskin fungerer som den skal. Maskinen er ment å porsjonere ut røde, gule og grønne bønner i like mengder i hver pose. Man derfor ta en prøve av 30 bønner fra maskinutgang. I dette tilfellet, er farger den kategorisk variabel.

2 Bestem den faktiske mengden av hver kategorisk variabel som forekommer i prøven. Dette vil bli oppnådd ved å telle antallet av røde, gule og grønne bønner i prøven. Kanskje du finner åtte røde, sju gule og 15 grønne.

3 Bestem forventet mengden av hver variabel i prøven. Hvis maskinen er proporsjone fargene jevnt, ville du forvente 10 røde, 10 gule og 10 grønne i en prøve av 30.

4 Beregn khikvadrattest statistikk ved hjelp av følgende formel for hver variabel: (O - E) ^ 2 / E, der O er observert beløp og E er den forventede mengden. Gjør denne beregningen for hver variabel, og deretter legge til verdiene for hver variabel sammen. Den chi square statistikken for eksempel kan være (8-10) ^ 2/10 + (7-10) ^ 2/10 + (15 - 10) ^ 2/10 = 3,8.

5 Bestemme "frihetsgrader" for testen. De frihetsgrader er antall kategorier minus 1. I eksempelet er det tre kategorier (tre farger) så er det 3 - 1 = 2 frihetsgrader.

6 Bruke grader av frihet og den beregnede khikvadrattest statistikk, se opp testobservatoren på en standard chi firkantet bord. Vanligvis vil du se i kolonnen lengst til venstre for frihetsgrader verdi og følge den tilhørende raden til du finner din chi kvadrat verdi. Deretter vil du følge denne kolonnen oppover til den øverste raden og lese av en sannsynlighetsverdi. Dette er sannsynligheten for at variasjonen mellom forventede og faktiske proporsjoner skjedde ved tilfeldig tilfeldighet og ikke skyldes feil eller uvanlige forhold. I tilfelle av eksempelet, er sannsynligheten omtrent 15 prosent.

7 Fra sannsynlighetsverdien utledet, konkludere hvorvidt eller ikke den variasjon mellom prøven og populasjonen var rett og slett på grunn av tilfeldigheter. Normalt er en sannsynlighet over 10 prosent regnes som en ubetydelig variasjon. I tilfelle av gelé bønner, da, ville du konkludere med at maskinen fungerer som den skal.

Hint

  • I noen tilfeller kan du ikke har en åpenbar "forventet" verdi, men det er statistiske formler tilgjengelig for å omgå dette ved behov.