Hva forutsetninger er nødvendig å bruke en Chi-Square?

Hva forutsetninger er nødvendig å bruke en Chi-Square?


Den chi-square statistikken brukes til å evaluere forskjeller mellom kategorier av data. Tre forutsetninger må være oppfylt for å bruke chi-kvadrat statistikk. Brudd på noen av disse kompromitterer integriteten av testen.

Chi-Square

Chi-kvadrat data er gruppert i kolonner og rader i en tabell mote. Observerte proporsjoner er sammenlignet med andeler som er forventet ved en tilfeldighet alene. Chi-kvadrat test er allsidig som alle datatyper (nominell, ordens, intervall og ratio) kan brukes.

Tilfeldig, unike data

Data må bli tilfeldig trukket fra populasjonen; ellers kan du ikke gjøre noen slutninger om populasjonen selv. Alle observasjoner bør forekomme i en celle; det kan være noe overlapping. Chi-kvadrat kan derfor ikke benyttes sammen med sammenfallende par eller før og etter testene.

Tilstrekkelig Sample Size

Utvalgsstørrelsen må være stor nok til ganske representere populasjonen som det er trukket. Minst 20 observasjoner bør brukes, med minst fem medlemmer i hver enkelt kategori. Beregn chi-kvadrat bruke ekte teller, ikke prosenter, slik at tilstrekkelig representere den sanne antall observasjoner telles.

Kjent, jevn fordeling

Chi-kvadrat eksempeldata bør trekkes fra en populasjon med et kjent og jevn fordeling. Hvis denne forutsetningen er brutt, forventede resultatene for hver celle kan ikke beregnes pålitelig. Selv om chi-kvadrat ikke krever at befolkningen fordelingen er normal, er antagelsen om at avvikene mellom de observerte og forventede verdier er uniform.