Hvordan identifisere rammer i Data

Uteliggere i data er avvik som kan indikere tilstedeværelse av dårlige data. Dette er sett når du trenger å finne gjennomsnittet av et sett med tall. En rekke regnes som en avvikende fordi det kan forskyve den gjennomsnittlige eller resultat. Identifisere en avvikende i et datasett gjøres ved å utføre beregninger med den nedre kvartil og øvre kvartil av en rekke gruppe.

Bruksanvisning

1 Skriv ut sett med tall for dine data. Dette kan være en alder av respondentene som har tatt en avstemning eller en kombinasjon av tall, for eksempel 22, 25, 26, 29, 31, 33, 35 og 50.

2 Beregn medianen ved gjennomsnitt de to midterste tallene. I vårt eksempel ser denne ligningen som (29 + 31) / 2, noe som tilsvarer 30.

3 Bestem nedre kvartil ved å beregne ligningen 0,25 (8 + 1). Den nedre kvartil er definert som den 25. persentilen og er 2.25. Dette er representert ved tallet 25, da dette er den andre tall i datasettet.

4 Utfør ligningen for 25 + 0,25 (26-25) som tilsvarer 25,25. Tallet 25 blir subtrahert fra den nest høyeste tall i datasettet som er 26.

5 Bestem øvre kvartil ved å beregne ligningen 0,75 (8 1). Den øvre kvartil er definert som 75-persentilen og er 6.75. Dette er representert ved nummer 33, da dette er den sjette tallet i datasettet.

6 Utfør ligningen for 33 + 0,75 (35-33) som tilsvarer 34,5. Tallet 33 blir subtrahert fra den nest høyeste tall i datasettet som er 35.

7 Trekk den nedre kvartil av 34,5 fra nedre kvartil av 25,25 for en interkvartilt område på 9,25.

8 Multipliser 1,5 av indre kvartilområdet på 9,25 for et resultat av 13,875.

9 Beregn nedre indre gjerdet ved å trekke 25.25 fra 13,875 for et resultat av 11375. Beregn øvre indre gjerdet ved å legge 22,25 til 13,875 for et resultat av 36,125.

10 Multipliser 3 av interkvartilt område på 9,25 for et resultat av 27.75

11 Beregn nedre ytre gjerdet ved å trekke 33,5 ved 27,75 for et resultat på 5,75. Beregn øvre ytre gjerdet ved å legge 33,5 til 27.75.for et resultat av 61.25

12 Finner den avvikende som overskrider den øvre indre gjerdet i datasettet. Du vil finne at tallet 50 er uteliggeren som dette er utenfor den statistiske utvalg av dataene.