Hvordan leser jeg residualplott i Excel?

Hvordan leser jeg residualplott i Excel?


Regresjonsanalyse blir brukt til å forutsi score på en uavhengig variabel, kjent som "x" ved bruk av kjente score på en eller flere avhengige variable som er kjent som "y-tallet." Lineær regresjonsanalyse matematisk beregner ligningen for en rett linje, som tjener som en prediktiv modell. Ifølge nettstedet, Stat Trek, rest representerer den vertikale avstanden mellom hvert fått datapunkt for den uavhengige variabelen fra denne rett linje. Microsoft Excel 2007 gir en plott av restene som må tolkes for å vurdere hensiktsmessigheten av å bruke en lineær regresjonsmodell.

Bruksanvisning

1 Identifiser x og y-variabler i regresjon. X variabel eller uavhengig variabel representerer resultatet du ønsker å måle. Y-variablene eller avhengige variabler er de innganger eller prediktorer. For eksempel, hvis du ønsker å lage en modell forutsi antall ER innleggelser en person ville ha ved å bruke antall pounds overvektig og antall arbeidstimer per uke, de avhengige variablene er antall pounds overvektig og antall arbeidstimer per uke, mens den uavhengige variabelen er antall eR innleggelser.

2 Forstå at x-aksen til et restplott inneholder alle verdier av x variabel i prøven. I dette eksempel, hvis den høyeste antall ER opptak noen i prøven hadde var 15 og den laveste var null, skalaen starter på null og strekker seg oppover i trinn på en til den maksimale verdi på 15.

3 Lærer å lese y-aksen av restplottet. Y-aksen representerer restene. Hvis den største avstand mellom et erholdt datapunkt, og den logiske rette linje er 15 og den minste avstanden var null, ville denne skala starter på null og strekker seg oppover i trinn på en til den maksimale verdi av 15. Microsoft Excel 2007 frembringer en graf hver y-variabel.

4 Forstå at den rette linjen på grafen er logisk linje som beskriver den optimale forholdet mellom x og y-variabel vesen grafisk. Linjen kan være horisontal, skrå oppover, eller skrå nedover, avhengig av innholdet i forholdet mellom x og y blir fremstilt grafisk.

5 Se på spredning av prikker over og under rett prediktiv linje. Hvis det er et likt antall punkter over linjen som under den, er lineær regresjon hensiktsmessig å beskrive forholdet mellom x og y som vises i diagram.

6 Se etter mønstre av dispersement. Hvis dataene er i klynger, en annen enn en rett linje form, slik som en "U", eller om datapunktene er ikke jevnt fordelt over og under rett prediktiv linje, er lineær regresjon ikke hensiktsmessig, og må benyttes ikke-lineære modeller .