Slik leser hierarkisk regresjon

Hierarkisk regresjon er en statistisk metode for å utforske forholdet mellom, og teste hypoteser om, en avhengig variabel og flere uavhengige variabler. Lineær regresjon krever en numerisk avhengig variabel. De uavhengige variablene kan være numerisk eller kategoriske. Hierarkisk regresjon betyr at de uavhengige variablene ikke er lagt inn i regresjon samtidig, men i trinn. For eksempel kan en hierarkisk regresjon undersøke sammenhengen mellom depresjon (målt ved noen numerisk skala) og variabler inkludert demografi (for eksempel alder, kjønn og etnisk gruppe) i den første fasen, og andre variabler (for eksempel score på andre tester) i et andre trinn.

Bruksanvisning

Tolke den første fasen av regresjon.

1 Se på den ustandardiserte regresjonskoeffisienten (som kan kalles B på utskriften) for hver uavhengig variabel. For kontinuerlige uavhengige variabler, og representerer endringen i den avhengige variabelen for hver enhet forandring i den uavhengige variabelen. I eksempel, hvis alder hadde en regresjonskoeffisient på 2,1, ville det bety at den anslåtte verdien av depresjon øker med 2,1 enheter for hvert år av alder.

For kategoriske variabler, skal resultatet viser en regresjon koeffisient for hvert nivå av den variable, bortsett fra en; en som mangler kalles referansenivå. Hver koeffisient representerer forskjellen mellom dette nivå og referansenivået på den avhengige variabel. I det eksempel, dersom referanse etniske gruppen er "hvit" og den ustandardiserte koeffisienten for "Black" er -1,2, ville det bety at den forutsagte verdi av depresjon for svarte er 1,2 enheter lavere enn for hvite.

2 Se på de standardiserte koeffisientene (som kan være merket med den greske bokstaven beta). Disse kan tolkes på samme måte som på ikke-standard koeffisienter, bare de er nå i form av standardavvik enheter av den uavhengige variabelen, snarere enn rå enheter. Dette kan hjelpe i å sammenligne de uavhengige variablene med hverandre.

3 Se på betydningen nivåer, eller p-verdier for hver koeffisient (disse kan være merket "Pr>" eller noe lignende). Disse forteller deg om den tilhørende variabelen er statistisk signifikant. Dette har en veldig spesiell betydning som ofte blir forsøkt misbrukt. Det betyr at en koeffisient denne høye eller høyere i en prøve av denne størrelsen ville være usannsynlig å skje hvis den reelle koeffisienten, i hele populasjonen som denne er trukket, var 0.

4 Se på R kvadrat. Dette viser hvor stor andel av variasjonen i den avhengige variabelen regnskapsføres ved modellen.

Tolke senere stadier av regresjon, Endre, og det samlede resultatet

5 Gjenta over for hvert senere stadium av regresjon.

6 Sammenligne de standardiserte koeffisientene, på ikke-standard koeffisienter, betydning nivåer og R-squareds i hver fase til den forrige scenen. Disse kan være i separate deler av produksjonen, eller i egne kolonner i en tabell. Denne sammenligningen lar deg vite hvordan variablene i den andre (eller senere) stadium påvirke relasjonene i den første fasen.

7 Se på hele modellen, inkludert alle stadier. Se på på ikke-standard og standardiserte koeffisienter og betydningen nivåer for hver variabel og R squared for hele modellen.

Hint

  • Dette er et veldig komplekst tema.