Slik fjerner rammer Med en Z Score

Når du analyserer et datasett, kan du ofte ha uteliggere, de punktene som ikke synes å matche mønsteret av data fastsatt av resten av datapunktene. De kan ofte bli sett av grafer resultatene, siden å finne den "beste-fit" ligningen for et sett av punkter kan gjøre etternølere veldig tydelig. De kan være forårsaket av målefeil, ukjente fenomener eller bare unøyaktigheter i den eksperimentelle metode. Bruk z-poeng metode for å eliminere uteliggere.

Bruksanvisning

1 Beregn både gjennomsnittet og medianen av absoluttavviket om median, eller MAD, av datasettet. Beregne gjennomsnittet, legge alle resultatene og dele denne summen med antall datapunkter. Beregne medianverdien av absolutt avvik på medianen, trekke gjennomsnittet fra hvert datapunkt, ta absoluttverdien og finne median - midten - verdien av disse resultatene.

2 Beregn z-score for hvert datapunkt ved å trekke befolkningen mener fra datapunktet, og dele på at svaret av MAD. Dette er det datapunktet modifiserte z-poeng.

3 Bestem deg for hvordan du ønsker å finne en avvikende. Den heuristiske test slår fast at et datapunkt med en modifisert z-score på 3,5 eller mer bør bestemme en avvikende. Avhengig av din forskning, kan du ønsker å eliminere uteliggeren helt, eller inkludere det i dine resultater og forklare det i din forskning.