Hvordan du fremstiller residualplott

I statistikk, restene er det som er til overs etter montering av modell. Mange statistiske metoder (som multippel regresjon) gjøre antagelser om restene. Disse forutsetningene kan kontrolleres med tomter. I tillegg, i en hvilken som helst modell, kan restene indikere dataregistrering feil eller på annen måte problematiske punkter. Plotting er en viktig del av statistisk analyse.

Bruksanvisning

1 Plotte residualene mot de monterte verdier fra modellen. I en lineær regresjon tomt, bør dette plottet vises som en klump, uten mønster. Dette er en måte å sjekke forutsetningen om homoscedasticity, eller likestilling av variansen.

2 Plott kvadratroten til residualene mot montert verdier fra modellen. Dette er en annen sjekk av lignende problemer som den første handlingen, men det viser mer tydelig størrelsen av rest fordi kvadratroten er alle positive.

3 Lag en quantile normal plott av restene etter en visualisering av normalitet av data. Lineær regresjon forutsetter at residualene er normalfordelt.

4 Plot Cook avstand mot restene. Cook avstand er et mål for påvirkning av et bestemt datapunkt på en regresjonsligningen. Hvis et punkt har høy innflytelse, ville slette det gjøre en stor forskjell i regresjonsligningen. Det er et generelt prinsipp at små endringer i inngangsdataene skal foreta små endringer i utgangseffekten. Høye innflytelse punkter bryter denne antakelsen.

Hint

  • Noen av disse tomter kan opprettes i enhver god statistikkpakke, som for eksempel SAS, R eller SPSS.