Hvordan Avvis rammer i Data

Data som samles inn i løpet av eksperimenter, undersøkelser og andre opplysninger innhenting er vanligvis underlagt en viss mengde tilfeldighet. I noen tilfeller kan individuelle målinger eller responser synes langt utenfor det forventede resultatet; disse er uteliggere. Når du kommer over en avvikende, bør du sjekke den for å avgjøre om du bør avvise det helt.

Bruksanvisning

1 Inspiser uteliggeren å være sikker på at den passer kvalitativt med resten av dataene. For eksempel, hvis du spør 20 personer til å måle bredden på en krone, men en av dem faktisk måler bredden på et kvartal, kan du ha en avvikende i dataene. Du bør avvise denne avvikende fordi det ikke passer kvalitativt med forsøket.

2 Bruk Dixon Q-test hvis du ikke avvise avvikende basert på kriteriet i trinn 1. Q-test er et kvantitativt mål i statistikken over betydningen av en bestemt verdi i forhold til et sett med data.

3 Bestem sikkerhetsnivå for Q-test. Hvis du ønsker å være 90 prosent sikker på at uteliggeren bør eller ikke bør avvises, velge et konfidensnivå på 90 prosent.

4 Finne den kritiske Q-verdi (Qcrit) ved hjelp av en tabell. Du trenger å vite hvor mange verdier i datasettet (for eksempel N) og sikkerhetsnivå som du velger i trinn tre.

5 Ordne datasettet i stigende rekkefølge. Således, for hver verdi i settet, X (i), ordne dataene slik at X (1) <X (2) <... <X (N - 1) <X (N).

6 Beregn den eksperimentelle Q-verdien (Qexp) av avvikende. For enkelt utliggere, er den avvikende enten X (1) eller X (N) i data ordning fra Trinn 5. De respektive Q-verdier for disse to tilfellene er [X (2) - X (1)] / [X (N ) - X (1)] og [X (N) - X (N - 1)] / [X (N) - X (1)].

7 Sammenlign eksperimentelle Q-verdien fra trinn 6 til den kritiske Q-verdien fra trinn 4. Hvis Qexp er større enn Qcrit, så bør du avvise avvikende. Hvis Qexp er mindre enn Qcrit, bør du holde uteliggeren i dataene. Din aksept eller avvisning av uteliggeren har et sikkerhetsnivå i henhold til hva du valgte i trinn 3 (for eksempel, er du 90 prosent sikker på at du bør avvise avvikende).

Hint

  • Høyere tillit nivåer føre til høyere kritiske Q-verdier. Som et resultat, hvis du ønsker å være mer sikker på at du bør avvise en bestemt avvikende, må det avvik være mer åpenbart malplassert i forhold til resten av dataene.
  • Dixon Q-test fungerer best for små utvalgsstørrelser. Større utvalgsstørrelsene kan kreve annen statistikk tester.
  • Hvis du har flere uteliggere, bør du bruke en annen statistikk test enn Q-test.