Hvordan uteliggeren Påvirke gjennomsnitt, median og modus?

Hvordan uteliggeren Påvirke gjennomsnitt, median og modus?


The Dictionary of Statistics definerer en avvikende som "en observasjon som ser ut til å avvike vesentlig fra de andre observasjoner av prøven der den vises." Statistiske mål som ikke er sterkt påvirket av utliggere kalles robust.

Outlers 'Effekt på Mean

Selv en enkelt avvikende kan ha stor effekt på gjennomsnittet. Vurder følgende datasett, den første uten avvikende, den andre med en relativt moderat avvikende, den tredje med en ekstrem avvikende og det siste med flere ekstreme uteliggere:

Datasett 1: 150, 160, 130, 150, 120

Datasett 2: 150, 160, 130, 150, 120, 180

Datasett 3: 150, 160, 130, 150, 120, 350

Datasett 4: 150, 160, 130, 150, 120, 300, 320, 340, 350.

Datasett (DS) 1 har et gjennomsnitt på 142; DS 2 har et gjennomsnitt på 148,3, har DS 3 et gjennomsnitt på 176 og DS 4 har et gjennomsnitt på 224.

Uteliggere 'Effekt på Median

Medianen, eller tall som er høyere enn halvparten av tallene og lavere enn halvparten, er mye mindre påvirket av utliggere enn gjennomsnittet. Medianen for datasett 1, 2 og 3 er 150. Selv om datapost 4, går den opp til bare 160.

Uteliggere 'Effekt på modus

Med mindre to eller flere av uteliggere har nøyaktig samme verdi, vil uteliggere ha noen effekt i det hele tatt på modus, som er den vanligste verdien. Modusen for alle datasettene er 150, fordi det finnes to tilfeller av 150 i hvert datasett, og ingen annen verdi gjentas.