Hvordan kan oppnå den Chi-Square

Hvordan kan oppnå den Chi-Square


Den khikvadrattest er en statistisk metode som brukes til å teste en observert fordeling mot en fordeling bestemmes av en nullhypotese. Forskere ønsker å finne ut om en observert fordelingen er tilfeldig eller ikke bruke chi kvadrat stor utstrekning. For eksempel, en geograf prøver å finne ut om fordelingen av epletrær over en skråning er relatert til type jord vil bruke khikvadrattest.

Bruksanvisning

1 Lag en nullhypotese. En null-hypotesen uttrykker nøyaktig hva du ønsker å undersøke.

For eksempel viser forskning at det kan være en sammenheng mellom jordtype og hvor bønder dyrke jordbær. De nullhypotese ville være "Hyppigheten av gårdsbruk vokser jordbær er ikke relatert til jordtype."

2 Etablere akkurat det du trenger for å spille inn og deretter opprette en datablad på å ta det opp. For eksempel, for å undersøke jordtype og jordbær voksende, registrerer jordtype og antall gårdsbruk dine identifiserte voksende jordbær på at jordtype. Gi hver jordtype en "kategori nummer." For eksempel kan en fullført datablad se slik ut:

1: Jord Type = Sand: Antall jordbærgårder = 15

2: Jord Type = Clay: Antall jordbærgårder = 5

3: Jord Type = Torv: Antall jordbærgårder = 12

4: Jord Type = Loam: Antall jordbærgårder = 7

5: Jord Type = Kalkstein: Antall jordbærgårder = 1

3 Bestem "forventet" frekvens. Den forventede frekvens er det totale antall observasjoner dividert med antall områder. For eksempel, totalt 40 observasjoner og fem forskjellige områder gir en forventet frekvens av åtte - 40/5 = 8.

4 Trekk fra den observerte frekvensen fra den forventede frekvens for hvert område.

For eksempel en observert frekvens på 15 og en forventet frekvens av åtte gir en observert - forventet frekvens av 7 - 15-8 = 7.

5 Square (observert - forventet) frekvens for hvert område. For eksempel, hvis området en har en observert frekvens på 15 og en forventet frekvens av åtte, den observerte - forventet frekvens er syv, og syv squared = 49. Bruke eksempeldataene fra trinn 2, vil dataene nå se slik ut:

Jordtype Observert Forventet Obs - Exp ^ 2

Sand 15 8 49

Clay 5 8 9

Torv 12 8 16

Leirjord 7 8 1

Kalkstein 1 8 49

6 Tilsett (observert - forventet) ^ 2 verdier sammen, og deretter dele den totale av den forventede frekvens. Ved hjelp av data fra trinn 5, er regnestykket (49 + 9 + 16 + 1 + 49) / 8 som vedtar å 124/8, eller 15,5.

7 Beregn "frihet" verdi ved å trekke en fra antall kategorier i etterforskningen. I eksemplet er det fem kategorier av jord, slik at graden av frihet verdien er fire - 5-1 = 4. Bruk en tabell over kritiske verdier for Chi kvadrat for å identifisere verdien for dine frihetsgrader med en 0,05 sannsynlighet. Hvis den beregnede chi kvadratverdien er større enn verdien i tabellen, da det er mindre enn en 0,05 sannsynlighet av forholdet være tilfeldig. Med andre ord er forholdet på grunn av faktor man undersøkt. Bruke eksempeldata, 0,05 sannsynlighetsverdi med fire frihetsgrader er 9,4877. Beregnet verdi på 15,5 er større enn 9,4877, slik at det er mindre enn 0,05 prosent sjanse for at forholdet er tilfeldig. Det er en sammenheng mellom jordtype og jordbær jordbruk.

Hint

  • Ikke bry deg om den observerte - forventet frekvens er et negativt tall. Squaring det viser den tilbake i et positivt tall.
  • Nullhypotesen sier at forholdet du har studert ikke eksisterer. Avviser hypotesen beviser at forholdet eksisterer.
  • Sørg for at ingen andre åpenbare faktorer kan påvirke resultatet. For eksempel er bønder mottar tilskudd for dyrking myk frukt? Er bøndene behandling feltene for å endre pH, drenering og ernæringsmessige egenskaper?
  • Det må være minimum 20 datasett.
  • Alle observasjoner skal være uavhengig. En observasjon må ikke påvirke en annen.