Hvordan beregne SSE

Hvordan beregne SSE


Ved montering en rett linje til et sett med data, kan du være interessert i å bestemme hvor godt den resulterende linjen passer dataene. En måte å gjøre dette på er å beregne summen av kvadrater feil (SSE). Denne verdien er et mål på hvor godt linjen passer best tilnærmet datasettet. SSE er en viktig for analyse av eksperimentelle data, og bestemmes ved bare noen få trinn.

Bruksanvisning

1 Finn en linje av beste tilpasning til å modellere data ved hjelp av regresjon. Linjen av beste passform har formen y = ax + b, der a og b er parametere som du trenger for å avgjøre. Du kan finne disse parameterne ved hjelp av en enkel lineær regresjonsanalyse. For eksempel anta linje med best mulig passform har formen y = 0,8x + 7.

2 Bruk ligning for å bestemme verdien av hver y-verdi predikert av den linje av beste passform. Du kan gjøre dette ved å erstatte hver x-verdi i ligningen for linjen. For eksempel, hvis x er lik 1, idet det inn i ligningen y = 0,8 x + 7 gir 7,8 for y-verdi.

3 Bestem gjennomsnittet av verdiene forutsagte fra linjen av beste tilpasning ligning. Du kan gjøre dette ved å summere opp alle y-verdier predikert fra ligningene, og dele den resulterende tall med antall verdier. For eksempel, hvis verdier er 7,8, 8,6 og 9,4, summere disse verdiene gir 25,8, og dele dette tall med antall verdier, 3 i dette tilfelle, gir 8,6.

4 Trekk fra hver av de enkelte verdier fra gjennomsnittet, og torget den resulterende nummeret. I vårt eksempel, hvis vi trekker verdien 7,8 fra gjennomsnittet 8,6, er den resulterende nummer 0,8. Squaring denne verdien gir 0,64.

5 Sum alle de kvadrerte verdier fra trinn 4. Hvis du bruker instruksjonene i trinn 4 til alle tre verdier i vårt eksempel, vil du finne verdier av 0,64, 0 og 0,64. Summere disse verdiene gir 1,28. Dette er summen av kvadratene feil.