Slik leser du en Chi-Square Test

Slik leser du en Chi-Square Test


Statistikere bruke chi-kvadrat test for å analysere hvor ofte visse egenskaper vises i en prøve tatt fra en større populasjon. De gjelder testen for å avgjøre om variasjoner mellom de observerte prøveresultatene og de resultatene de forventet å se er statistisk signifikante. Det første trinnet er å beregne chi-kvadrat verdi, ved hjelp av ligning (o - e) ^ 2 / e der o er den observerte frekvensen av en karakteristisk og e er forventet frekvens. Du må beregne dette for hver egenskap og deretter summere alle verdiene i et enkelt tall. Du kan deretter tolke det nummeret ved hjelp en sannsynlighet bord.

Bruksanvisning

1 Bestemme "frihetsgrader" for chi-kvadrat analyse. Frihetsgradene verdi er lik antallet av forskjellige egenskaper man analyserer, minus en. Så hvis du var interessert i å vite om en maskin var å fylle gelé bønne pakker med riktige prosenter av røde, gule og blå bønner, ville du ha 3 kategorier og 2 frihetsgrader. Kanskje ut av 100 bønner du forventet å finne 50 røde, 30 gule og 20 blå, men prøven faktisk inneholdt 45 røde, 32 gule og 23 blå. Du ønsker å vite om dette avviket betyr at maskinen ikke fungerer, eller er rett og slett på grunn av tilfeldigheter variasjon i prøvetaking.

2 Finn dine frihetsgrader verdien på venstre kolonnen lengst en chi-kvadrat sannsynlighet bord. Se langs tilsvarende raden til du finner din chi-kvadrat test verdi.

3 Følg kolonnen hvor din chi-kvadrat verdien vises oppover til den øverste raden. Hvor kolonnen møter den øverste raden, vil du finne en sannsynlighetsverdi, i desimal form; for eksempel, betyr en verdi på 0,30 en 30 prosent sannsynlighet. Dette er sannsynligheten for at eventuelle avvik du så mellom observerte resultater i prøven og forventede resultatene skyldes tilfeldigheter bare. I tilfelle av gelé bønne tall, er den tilsvarende chi-kvadrat-verdi 1,072, som har en sannsynlighet på omkring 60 prosent.

4 Vurdere sannsynligheten leser du bare oppnås basert på dine egne kriterier for hva du anser et akseptabelt nivå av tilfeldighet. En felles kriterier er 10 prosent. Dette betyr at hvis sannsynligheten er 10 prosent eller høyere, vil du anta at variasjonen du så ut eksempeldata var bare på grunn av tilfeldigheter. I tilfelle av gelé bønne data, er sannsynligheten for 60 prosent er mye høyere enn 10 prosent, slik at du ville trolig konkludere med at du så bare tilfeldig variasjon og maskinen fungerer som den skal.

Hint

  • Du bør ikke bruke chi-kvadrat test dersom den forventede verdien for observasjoner av alle kjennetegn er under fem.