Hva gjør datamodus mener?

Hva gjør datamodus mener?


"Mode" av et sett av data er et mål på sentraltendens, også kjent som en "gjennomsnittlig". Disse begrepene viser til måten datapunktene i en gruppe sentrum rundt en bestemt verdi, og brukes til å gi en viss idé av hvilke verdiene i den samlede gruppe er. Andre vanlige mål på sentraltendens er det aritmetiske gjennomsnitt og median, og hver av disse har fordeler og ulemper.

Hva er Mode?

Modusen er den mest hyppig forekommende verdi i et gitt sett av data. Modusen av et datasett vil ofte være forskjellig fra gjennomsnittet og medianen, og det kan være mer enn en mode. Dette er spesielt sannsynlig når hver verdi i datasettet har en lik sjanse for å inntreffe. For eksempel, hvis en dyse er rullet hundre ganger, har hvert nummer en lik sjanse for å bli modusen, slik at det kan være flere enn en.

Fordeler

En fordel er at ekstreme score, også kjent som uteliggere, ikke har så stor innvirkning på modus. Når en datasettet har utliggere, kan den midlere ikke utgjør hoveddelen av data i gruppen, slik at modusen er et nyttig alternativ (som er medianen). En fordel med den modus har både over gjennomsnittet og medianen er at den kan brukes på ikke-numeriske datasett. For eksempel er det en modus for navnene i telefonboken, men ikke en gjennomsnittlig eller median.

ulemper

Den største ulempen med den modus er at i noen tilfeller, har den mest hyppig forekommende verdi ikke representerer prøvebrønnen. I slike tilfeller bør den midlere eller median. Når det er mer enn en modus i en gruppe av data, kan det gjøre tolkninger og sammenligninger vanskeligere. Også i enkelte datasett, er det ingen verdi som forekommer mer enn en gang - dette betyr at hver verdi i konsernet er modusen, og modusen kan ikke fortelle deg noe nytt om dataene.

eksempler

Ta dette datasettet: "1, 1, 1, 1, 1, 1, 1, 2, 2, 189." Her er gjennomsnittet 20, men som ikke representerer konsernet godt. Den modus, men er en, og selv om det ikke fanger den avvikende (189), det utgjør hoveddelen av gruppen brønnen. I dette datasettet - "1, 2, 3, 4, 5, 6, 7, 8, 9» - både middelverdien og medianen er 5. Disse er gode gjennomsnitt som reflekterer gruppen brønnen. Men fordi hver figur vises én gang, er modusen ikke forskjellig fra dataene satt seg, noe som gjør det ubrukelig.