Hvordan velge Beholdere for Histograms

Hvordan velge Beholdere for Histograms


En stolpediagram gruppere data i intervaller eller binger kalles et histogram. Hyllene er fastsatt basert på omfanget av dataverdier og hva bilde du vil vise. Hyllene er plottet på den horisontale eller "x" aksen og frekvens er plottet på den vertikale eller "y" aksen. Hvis hyllene er for store, så går tapt om riktig form av dataene. Den beste måten å finne riktig bin størrelse er å sammenligne flere alternativer og se hvilke best beskriver formen på datasettet.

Bruksanvisning

1 Bestill data fra lavest til høyest. Det bør være minst 30 datapunkter i et histogram. Dataene vil se slik ut:

verdier

0

0

10

11

21

22

22

23

23

24

34

34

34

34

35

55

56

56

56

56

56

56

56

56

56

56

56

56

57

60

66

66

66

66

66

66

66

67

67

67

70

70

70

71

71

72

77

78

78

78

78

80

81

88

88

89

99

100

100

2 Trekk fra det høyeste punktet fra det laveste punktet for å få bredden på datasettet. I dette eksempel 100-0 = 100.

3 Del bredden av tall som vil produsere mellom fem og 20 binger, som er ansett som ideelt. I dette eksempelet 100/10 = 10 spannene og 100/20 = 5 binger gir to alternativer for sammenligning.

4 Fordel datapunktene like inn i hyllene. I det første eksempelet er det en bredde på 100 og 10 binger: 100/10 = 10 verdier i hver binge. Dataene vil se slik ut:

Bin 1 = 0-10

Bin 2 = 11-20

Bin 3 = 21-30

Bin 4 = 31-40

Bin 5 = 41-50

Bin 6 = 51-60

Bin 7 = 61-70

Bin 8 = 71-80

Bin 9 = 81-90

Bin 10 = 91-100.

Dette kan sammenlignes med 100/20 = skuffer av fem hver, ser slik ut:

Bin 1 = 0-20

Bin 2 = 21-40

Bin 3 = 41-60

Bin 4 = 61-80

Bin 5 = 81-100

Hint

  • I dette eksempelet vil det første alternativet, med 10 hyller ikke klart viser formen på data - det ville se altfor spredt ut til å være meningsfylt. Det andre alternativet, med fem binger viser data er normalfordelt, så dette er det alternativet som ville være ideelt.