Kurvetilpasning Teknikker

Kurvetilpasning er bygging av en matematisk funksjon som passer best til en rekke datapunkter, ifølge en viss grad av fitness. Teknikker kan deles mellom utjevning og interpolering. Et eksempel er regresjonsanalyse, som orienterer en linje for å minimere kvadratet av den vertikale avstanden mellom datapunktene og linjen. Ekstrapolering refererer til bruken av en montert kurve utenfor rekkevidden av de monterte data.

lineær regresjon

Kurvetilpasning Teknikker


Lineær regresjon passer til en linje til et sett av datapunkter. Det er derfor en glatting prosedyre, siden en linje ikke kan forsøke å passere gjennom mer enn to datapunkter. Linjen er beregnet, noe som minimerer kvadratet av den vertikale avstanden mellom datapunktene og linjen. Summen av [y- (ax + b)] ^ 2 over alle datapunkter er verdien som skal minimeres; x og y refererer til datapunktene selvstendige og avhengige verdi hhv. Parametrene for linjen, a og b, er bestemt ved å sette summen derivater med hensyn på a og b til null for å danne et system av to lineære ligninger i to ukjente; a og b blir deretter løst for. Løsningen linje med beste passformen er da y = ax + b.

Derivater trenger ikke bli tatt. Løsningen formler er

Slope (b) = (nΣxy - (ax) (Σy)) / (nΣx ^ 2 - (ax) ^ 2)
x-aksen (a) = (Σy - b (ax)) / n

lineær regresjon

En vekting av summen av kvadratene kan være nødvendig for en ikke-lineær regressiv passform, noe som åpner for større variasjon på forskjellige punkter i kurven. For eksempel vil en kurve som begynner på null og flater ut ved et høyere nivå har en tett passform i nærheten av null, særlig hvis ingen negative svar gjør fysisk forstand, mens mer variasjon ville være tillatt ved de høyere nivåene. Utflatings kan brukes til å gi likevekter gjennom en forlenget intervall av datapunkter.

Utvelgelsen av kurven som skal modelleres vil avhenge av arten av dataene. For eksempel vil en Poisson eller negative binomiske fordelingen brukes til frekvensdata, for å ta høyde for lave frekvenser (spesielt ingen) som er den mest hyppige. En gamma fordeling kan brukes til å modellere alvorlighetsgrad av tap. En forbindelse Pareto eller eksponensiell fordeling kan benyttes, avhengig av om man ønsker en tykk eller tynn hale fordeling.

polynom Tilnærming

Kurvetilpasning Teknikker


Polynomer kan benyttes for interpolering, med det montert polynomisk kurve som passerer gjennom hvert datapunkt. Ordet "interpolering" er brukt her for å antyde utstyrt kurven bruk: Verdier er spådd mellom datapunktene, som i seg selv faller på montert kurve. Et eksempel illustrerer en av de enklere fremgangsmåter:

Definer P (x) = (x - x1) y0 / (x0 - x1) + (x - x0) Y1 / (x1 - x0) hvor de to datapunktene være fit er (x0, y0) og (x1, y1) .

Denne P (x) har den egenskapen at P (x0) = y0 og P (x1) = y1. Dette er en linje. Flere datapunkter fremstille et høyere ordens polynom av, for eksempel,

P (x) = (x - x1) (x - x2) y0 / [(x0 - x1) (x0 - x2)] + (x - x0) (x - x2) y1 / [(x1 - x0) (x1 - x2)] + (x - x0) (x - x1) y2 / [(x2 - x0) (x2 - x1)]

Andre eksempler på polynom tilpasning omfatter oppdelte forskjeller og itererte interpolasjon.