Slik leser sannsynlighetsmodeller

Slik leser sannsynlighetsmodeller


Statistisk analyse i samfunnsvitenskapene og andre kvantitative felt krever tolkning av sannsynlighetsmodeller i mange tilfeller. Den vanligste metoden som brukes av samfunnsvitere er Ordinære Least Squares (OLS). Imidlertid er OLS metodisk unfeasible når den avhengige variabelen er en dummy. Når dette er tilfelle, blir logaritmisk modell foretrukket. Mens forskjellig fra tolke OLS, er det ikke vanskelig å forstå logaritmisk modell som uttrykker data i S-formede kurver som forutsagte sannsynligheter.

Bruksanvisning

Hvordan sette opp en Logit modell

1 Skriv ned formlene du vil bruke til å sette opp din modell som følger:

Y * = b0 + b1X1 + b2X2 + ...

Pr (Y = 1) = (1) / (1 + exp (-? Y *))

2 Pr (Y = 1) angir sannsynligheten for at Y = 1, og Y angir en hendelse. Tenk deg at Y er sannsynligheten for at en borger vil stemme. Hvis Pr (Y = 1) = 0,5, så vet du at det er en 0,5 sannsynlighet for at den enkelte borger vil stemme. Derfor, Pr (Y = 1) er alltid en verdi mellom 0 og 1.

3 Koeffisientene (b0, b1, b2, etc) vil bli uttrykt som tegn enten positive eller negative, og samsvarer med uavhengige variabler (variablene som virker på din avhengig variabel). Hvis en av disse koeffisientene har et negativt fortegn, et større tilsvarende X betyr at det vil være en lavere Y *, og følgelig en redusert Pr (Y = 1).

Slik leser en Logit modell

4 I logit-modeller, er den avhengige variabelen en dummy. Det er, uttrykker det en enten / eller type arrangement uttrykt som en sannsynlighet. En logit modell med sannsynligheten for stemmegivning som avhengig variabel vil tilskrive enten en "0" eller "1" til hvert alternativ som følger:

"0" = ikke stemme

"1" = fram

Den avhengige variabelen ligger på y-aksen, som går på en skala med 0 på sitt laveste punkt og en på sitt høyeste punkt.

Simulere dette eksempelet ved å tegne en xy graf med y-aksen er beskrevet ovenfor.

5 Lag en x-aksen som beskriver utdanningsnivå. Plasser fem hash merker på skalaen og merke dem som begynner med en på hash nærmest skjærer og slutter med fem på det punktet lengst fra kryss, hvor 1 = noen high school, 2 = videregående skole, 3 = litt lavere, 4 = lavere, og 5 = utover lavere.

6 Tegn og S-formet kurve, slik at det høyeste punkt på kurven (toppen av S) ligger over 5 på x-aksen og tvers over fra et punkt like under en på y-aksen og den laveste punkt er over 1 på x-aksen og tvers over fra et punkt like over 0 på y-aksen.

7 Å tolke denne kurve, gå opp en imaginær vertikal linje fra et gitt punkt på x-aksen til det sted hvor den imaginære linje møter den S-kurve. Så tenk en annen linje som går horisontalt fra det skjærer til y-aksen. Dette skjærer avslører sannsynligheten for at en borger med "x" utdanningsnivå har en "y" sannsynligheten for å stemme (dvs. en borger med litt lavere erfaring har en 0,43 sannsynligheten for stemmegivning)

Hint

  • I dette eksemplet ble det antatt at et høyere utdanningsnivå vil øke sannsynligheten for stemmegivningen. Derfor, hvis utdanningsnivå korresponderte med b1X1 i modellen likning, ville b1 ha et positivt tegn og X1 ville ha en betydelig innvirkning (en større verdi). I modellen vil en høyere verdi for b1X1 øke sannsynligheten for stemmegivning, eller Y * [Pr (Y = 1)].