„Adatelemzés: lineáris és nem lineáris regresszió egy modellen bemutatva” változatai közötti eltérés

A lap jelenlegi, 2011. június 16., 22:07-kori változata

Tartalomjegyzék

1 Általános statisztikai jellemzők
2 Modellek illesztése

Általános statisztikai jellemzők

Alapfogalmak:

Átlag: ha van N darab adatpontunk (egy X vektorba rendezve), mindegyiket $x_i, i = 1\ldots N$ -vel jelöljük, akkor az átlag: $E[X] = \mu = \bar{x} = \frac{1}{N} \sum_{i=1}^N x_i$
Szórás: ha van N db, $\mu$ átlagú adatpontunk, akkor ezek szórása: $\sigma = \sqrt{E\left[ X - \mu \right]^2}$
Kovariancia: a kovariancia megadja két egymástól különböző változó (X,Y) együttmozgását: $\mathrm{Cov}(X,Y) = E \left[ \left( X - E[X] \right) \left( Y - E[Y] \right) \right] = E[XY] - E[X]\cdot E[Y]$
Kovariancia mátrix: egy n adatpontból álló X és egy m adatpontból álló Y véletlen (random) vektor n*m-es kovariancia mátrixa: $\mathrm{Cov}(X,Y) = E\left[ \left( X - E[X] \right) \left( Y - E[Y] \right)' \right] = E[XY'] - E[X]E[Y]'$ , ahol $E[XY']$ , $E[Y]'$ és $E[X]$ vektorok és általános esetben mindegyik elemük az X és Y vektor eredeti elemének várható értéke (amennyiben a vektor komponensei különböző eloszlású valószínűségi változók).
Keresztkorreláció: a keresztkorreláció segítségével megvizsgálhatjuk két adatsor hasonlóságát különböző időeltolásokra. Folytonos függvény esetén a definíció: $(f \star g)(t)\ \stackrel{\mathrm{def}}{=} \int_{-\infty}^{\infty} f^*(\tau)\ g(t+\tau)\,d\tau$ , diszkrét adatpontok esetén pedig: $(f \star g)[n]\ \stackrel{\mathrm{def}}{=} \sum_{m=-\infty}^{\infty} f^*[m]\ g[n+m]$ . Két fehér zaj függvény vagy vektor keresztkorrelációs függvénye egy Dirac-delta.
Normált kereszt-korreláció:
Autokorreláció:

(Átlag szórás, kovariancia...)

Modellek illesztése

Lineáris regresszió

A most leírt modell tulajdonságai a következők:

prediktor változó: x
az y-ok függetlenek
adott x-re kapott y-ok normál eloszlásúak olyan átlaggal, ami az x lineáris függvényeként kapható meg

Feladat: adott x-re y-t megmondani. A straight line regression model (egyenes vonal illesztő modell) alakja a köv:

$y = \alpha + \beta \cdot x + \epsilon$ , vagy indexesen $(x_1, y_1), (x_2, y_2) \ldots: y_i = \alpha + \beta \cdot x_i + \epsilon_i$

A normál analízis során azt feltételezzük, hogy epsilon_i-k független és azonosan 0 átlagú és szigma^2 szórású normál eloszlást követő változók. Az alfa+beta*x a determinisztikus rész, az epsilon_i a random zaj. Az előbbi érdekel minket.

Az illesztés során a legkisebb négyzetek módszerét használhatjuk.

Legkisebb négyzetek módszere

A legkisebb négyzetek módszere bevezet egy metrikát arra nézve, hogy egy adott becslés az ismertelen $\alpha, \beta\,$ paraméterekre mennyire optimális. Ezt a mértéket következő költségfüggvény adja meg:

\mathrm{min}_{\alpha, \beta}\left( \sum_{i=1}^N [y_i - \alpha - \beta x_i]^2 \right)

azaz a legkisebb négyzetes eltérést eredményező paraméter értékeket keressük. Legegyszerűbben úgy találhatjuk meg ezt a minimumot, hogy a paraméterek szerint lederiváljuk a költségfüggvényt, és a kapott kifejezést 0-val tesszük egyenlővé, és a kapott egyenletrendszert megoldjuk. Az eredmény:

\hat{\beta} = \frac{\sum_i^n ( x_i - \bar{x} )( y_i-\bar{y})}{\sum_i^n ( x_i - \bar{x} )^2} = \frac{\bar{xy} - \bar{x} \bar{y}}{\bar{x^2} - \bar{x}^2}

\hat{\alpha} = \bar{y} - \hat{\beta}\bar{x}

ahol a felülvonás átlagolást jelent az n mérésen, a kalap pedig a módszer által adott becslést az adott paraméterre. Természetesen a levezetés általánosítható arra az esetre is, ha x több komponensű. Általánosabb költségfüggvényű módszerek is egyszerűen származtathatóak. Az x és y értékek korrelációját r adja:

r = \frac{\bar{xy} - n\bar{x} \bar{y}}{(n-1)\sigma_x \sigma_y}

ahol $\sigma$ a minta standard hibája. r értéke 1 ha tökéletes lineáris korreláció van, -1 ha tökéletes antikorreláció. A fit jóságát R^2 adja:

R^2 = 1 - \frac{\sum (y_i - \bar{y})^2}{\sum (y_i - \hat{\alpha} - \hat{\beta}x_i)^2}

$R^2$ -et 1 ha tökéletesen lineárisak az adatok, általában a 0,95 körüli érték elfogadható fit szokott lenni.

A Khí-négyzet módszer

Ha a mérési pontok hibájának szórása nem egyforma (de továbbra is normál eloszlást követnek), akkor a legkisebb négyzetek módszerét könnyen általánosíthatjuk. Ez a Khí-négyzet illesztés, amelynek költségfüggvénye a következő:

$\chi^2 = \sum_{i=1}^N \left( \frac{y_i - \alpha - \beta x_i}{\sigma_i} \right)^2$

Tekinthetjük úgy, hogy a $\sigma_i$ szórásokkal súlyozzuk az eltéréseket, vagy másképpen egységnyi szórásúra normálunk minden pontnál.

Mivel a mérési pontokról feltételeztük, hogy normál eloszlást követnek, $\chi^2$ ilyen véletlen változók négyzetének összege. Az ilyen típusú valószínűségi változók nem Gauss eloszlást, hanem az úgynevezett (N - M) szabadsági fokú Khí-négyzet eloszlást követik. Ha az $a_j$ paraméterek lineárisan szerepelnek akkor ez az eloszlás analitikusan megadható, így megmondható annak valószínűsége (Q), hogy az adott paraméterekkel jellemzett modellen végzett mérés $\chi^2$ -nél nagyobb eltérést ad. ( $Q \approx 0,1$ tipikus, $Q \approx 0,01$ elfogadható, $Q < 0,001$ rossz modellre vagy hibabecslésre utal). Fontos, hogy a mérési hibák becslése jó legyen, különben megtévesztő eredményre juthatunk.

A levezetés lépései teljesen azonosak az előző esettel.

Példa: egyenes illesztés

Legegyszerűbb példa a lineáris regresszióra a kétparaméteres egyenesillesztés.

$y(x) = a + bx\,$

A költségfüggvényünk most:

$\chi^2(a,b) = \sum_{i=1}^N \left( \frac{y_i - a - bx_i}{\sigma_i} \right)^2$

A minimumban a deriváltak eltűnnek:

$0 = \frac{\partial \chi^2}{\partial a} = -2\sum_{i=1}^N \frac{y_i - a - bx_i}{\sigma_i^2}$

$0 = \frac{\partial \chi^2}{\partial b} = -2\sum_{i=1}^N \frac{x_i(y_i - a - bx_i)}{\sigma_i^2}$

A fenti kifejezésekben a szummákat szétbonthatjuk az alábbi jelölések segítségével:

$S \equiv \sum_{i=1}^N \frac{1}{\sigma_i^2} \quad S_x \equiv \sum_{i=1}^N \frac{x_i}{\sigma_i^2} \quad S_y \equiv \sum_{i=1}^N \frac{y_i}{\sigma_i^2} \quad S_{xx} \equiv \sum_{i=1}^N \frac{x_i^2}{\sigma_i^2} \quad S_{xy} \equiv \sum_{i=1}^N \frac{x_iy_i}{\sigma_i^2}$

Így a minimum feltétele a következő:

$aS + bS_x = S_y\,$

$aS_x + bS_{xx} = S_{xy}\,$

Az egyenletrendszer megoldása pedig:

$\Delta \equiv SS_{xx} - S_x^2$

$a = \frac{S_{xx}S_y - S_xS_{xy}}{\Delta}$

$b = \frac{SS_{xy}-S_xS_y}{\Delta}$

A hibaterjedés törvényét figyelembe véve a teljes szórás:

$\sigma_f^2 = \sum_{i=1}^N \sigma_i^2 \left( \frac{\partial f}{\partial y_i} \right)^2$

Amibe a-t és b-t behelyettesítve:

$\sigma_a^2 = \frac{S_{xx}}{\Delta}$

$\sigma_b^2 = \frac{S}{\Delta}$

Ezek a hibák természetesen csak a mérési hibák hatását fejezik ki, ettől a pontok szórhatnak messze az egyenestől. Az illesztés jóságát az (N-2) szabadsági fokú khí-négyzet eloszlás adja meg a $\chi^2$ helyen.

Ha a mérés hibája nem ismert, akkor a fenti képletek a $\sigma_i = 1$ behelyettesítéssel használhatók (úgy tekintjük, hogy mindegyik pont hibája megegyezik).

Maximum Likelihood

A maximum likelihood a legvalószínűbb becslést adja egy tetszőleges eloszlás paramétereire. Ha $x_1, ...x_n$ megfigyelésünk van, és egy $f(x|a)$ modellt szeretnénk fittelni, akkor független és azonos eloszlású minták esetén a feltételes valószínűség faktorizálható, azaz annak a valószínűsége, hogy az x mérési pontokat kaptuk feltéve, hogy a modell paraméterrendszere a:

f(x|a) = f(x_1|a) \cdot ... \cdot f(x_n|a)

Ha megfordítjuk a logikát és azt kérdezzük, hogy feltéve, hogy x értékeket mértünk, mi a valószínűsége annak, hogy a modellt az a paraméterek jellemzik, akkor a likelihood függvényt kapjuk:

\mathcal{L}(a|x_1...x_n)=\prod_{i=1}^n f(x_i|a)

vagy ha vesszük a logaritmusát:

\ln \mathcal{L}(a|x_1...x_n)=\sum_{i=1}^n \ln f(x_i|a)

A legjobb becslést L (vagy ekvivalensen ln L) maximuma adja. Ha f a normális eloszlás, akkor könnyen kiszámolható a maximum a paraméterek szerinti deriváltak zérussá válásából. Ebből a szokásos értékeket kapjuk az átlagra (mérések összege / elemszám) és a szórásra (átlagtól való négyzetes eltérések átlaga).

Nem-lineáris regresszió

Amennyiben a modell paraméterek a modellben nem-lineáris alakban szerepelnek, akkor a fenti módszerek nem működnek, ez vezet a nem-lineáris regresszió problémájára. Ez többek között azt is jelenti, hogy nincs garantálva, hogy egyetlen globális optimum van, ezért a megoldások analitikusan általában nem kezelhetők: csak numerikus közelítő eljárásokkal tudjuk előállítani a legjobb becsléseket.

Léteznek megfelelő általánosításai a legkisebb négyzetek módszerének nemlineáris esetekre, csak úgy, mint a legtöbb más modellnek is.

Szemléletesen ha a modell összefüggését a paraméterekkel az f függvény adja, akkor a paraméterek szerinti deriválásoknál megjelenik f deriváltja is.

Nem-lineáris legkisebb négyzetek módszere

A költségfüggévny:

S = \sum_i^n \left[ y_i - f(a, x_i)\right]^2

a derivált:

\frac{\partial S}{\partial a} = -2 \sum_i^n \left[ y_i - f(a, x_i)\right] \frac{\partial f(a, x_i}{\partial a} = 0

Az így kapható egyenletrendszer nem-lineáris, ezért általában valamilyen iterációs módszerrel lehet csak kezelni, például a Newton-iteráció általánosítható nem-lineáris egyenletrendszerek megoldására.

MSc záróvizsga tételek

Tételek

@@ 1. sor: / 1. sor: @@
 == Általános statisztikai jellemzők ==
+Alapfogalmak:
+*Átlag: ha van N darab adatpontunk (egy X vektorba rendezve), mindegyiket <math>x_i, i = 1\ldots N</math>-vel jelöljük, akkor az átlag: <math>E[X] = \mu = \bar{x} = \frac{1}{N} \sum_{i=1}^N x_i</math>
+*Szórás: ha van N db, <math>\mu</math> átlagú adatpontunk, akkor ezek szórása: <math>\sigma = \sqrt{E\left[ X - \mu \right]^2}</math>
+*Kovariancia: a kovariancia megadja két egymástól különböző változó (X,Y) együttmozgását: <math>\mathrm{Cov}(X,Y) = E \left[ \left( X - E[X] \right) \left( Y - E[Y] \right) \right] = E[XY] - E[X]\cdot E[Y]</math>
+*Kovariancia mátrix: egy n adatpontból álló X és egy m adatpontból álló Y véletlen (random) vektor n*m-es kovariancia mátrixa: <math>\mathrm{Cov}(X,Y) = E\left[ \left( X - E[X] \right) \left( Y - E[Y] \right)' \right] = E[XY'] - E[X]E[Y]'</math>, ahol <math>E[XY']</math>, <math>E[Y]'</math> és <math>E[X]</math> vektorok és általános esetben mindegyik elemük az X és Y vektor eredeti elemének várható értéke (amennyiben a vektor komponensei különböző eloszlású valószínűségi változók).
+*Keresztkorreláció: a keresztkorreláció segítségével megvizsgálhatjuk két adatsor hasonlóságát különböző időeltolásokra. Folytonos függvény esetén a definíció: <math>(f \star g)(t)\ \stackrel{\mathrm{def}}{=} \int_{-\infty}^{\infty} f^*(\tau)\ g(t+\tau)\,d\tau</math>, diszkrét adatpontok esetén pedig: <math>(f \star g)[n]\ \stackrel{\mathrm{def}}{=} \sum_{m=-\infty}^{\infty} f^*[m]\ g[n+m]</math>. Két fehér zaj függvény vagy vektor keresztkorrelációs függvénye egy Dirac-delta.
+*Normált kereszt-korreláció:
+*Autokorreláció:
 (Átlag szórás, kovariancia...)
 == Modellek illesztése ==
 === Lineáris regresszió ===
@@ 19. sor: / 28. sor: @@
 === Legkisebb négyzetek módszere ===
+A legkisebb négyzetek módszere bevezet egy metrikát arra nézve, hogy egy adott becslés az ismertelen <math>\alpha, \beta\,</math> paraméterekre mennyire optimális. Ezt a mértéket következő költségfüggvény adja meg:
-Tegyük fel, hogy <math>(x_i, y_i), i = 1 \ldots N</math> mérési adatokra akarunk függvényt illeszteni, melynek paraméterei <math>a_j, j = 1 \ldots M</math>, azaz
+:<math>\mathrm{min}_{\alpha, \beta}\left( \sum_{i=1}^N [y_i - \alpha - \beta x_i]^2 \right)</math>
-<math>y(x) = x(x;a_1,a_2,\ldots,a_m)</math>
+azaz a legkisebb négyzetes eltérést eredményező paraméter értékeket keressük. Legegyszerűbben úgy találhatjuk meg ezt a minimumot, hogy a paraméterek szerint lederiváljuk a költségfüggvényt, és a kapott kifejezést 0-val tesszük egyenlővé, és a kapott egyenletrendszert megoldjuk. Az eredmény:
-A legkisebb négyzetek módszere a következő módon keresi a paramétereket:
+:<math>\hat{\beta} = \frac{\sum_i^n ( x_i - \bar{x} )( y_i-\bar{y})}{\sum_i^n ( x_i - \bar{x} )^2} = \frac{\bar{xy} - \bar{x} \bar{y}}{\bar{x^2} - \bar{x}^2}</math>
-<math>{min}_{a_1 \ldots a_m}\left( \sum_{i=1}^N [y_i - y(x_i;a_1,\ldots,a_m)]^2 \right)</math>
+:<math>\hat{\alpha} = \bar{y} - \hat{\beta}\bar{x}</math>
-Ez azért jó, mert megadja a paraméterek legvalószínűbb halmazát. Természetesen lehetne más költségfüggvényt is használni, de ez a modell arra a kérdésre ad választ, hogy mely paramétervektor esetén a maximális a valószínűsége annak, hogy az adott mérési eredményeket kapjuk. Ez a maximális valószínűségű paraméterbecslés.
+ahol a felülvonás átlagolást jelent az n mérésen, a kalap pedig a módszer által adott becslést az adott paraméterre. Természetesen a levezetés általánosítható arra az esetre is, ha x több komponensű. Általánosabb költségfüggvényű módszerek is egyszerűen származtathatóak. Az x és y értékek korrelációját r adja:
-Ha csak az <math>y_i</math> adatok mérési hibáját vesszük figyelembe és az a hiba Gauss eloszlású, valamint a hiba eloszlásának szórása azonos mindegyik mérési pontban (ha ezek nem teljesülnek, akkor a módszer nem a legnagyobb valószínűséghez tartozó paramétereket adja), akkor a fenti valószínűség átírható így:
+:<math>r = \frac{\bar{xy} - n\bar{x} \bar{y}}{(n-1)\sigma_x \sigma_y}</math>
-<math>P \propto \prod_{i=1}^N \left\{ exp \left[ -\frac{1}{2} \left( \frac{y_i - y(x_i)}{\sigma} \right)^2 \right] \Delta y \right\}</math>
+ahol <math>\sigma</math> a minta standard hibája. r értéke 1 ha tökéletes lineáris korreláció van, -1 ha tökéletes antikorreláció. A fit jóságát R^2 adja:
-Ennek keressük a maximumát (vagy ha vesszük a negatív logaritmuást, akkor a minimumát):
+:<math>R^2 = 1 - \frac{\sum (y_i - \bar{y})^2}{\sum (y_i - \hat{\alpha} - \hat{\beta}x_i)^2}</math>
-<math>-log(P) = \left[ \sum_{i=1}^N \frac{[y_i - y(x_i)]^2}{\sigma} \right] - N log(\Delta y)</math>
+<math>R^2</math>-et 1 ha tökéletesen lineárisak az adatok, általában a 0,95 körüli érték elfogadható fit szokott lenni.
-Mivel N, <math>\sigma</math> és <math>\Delta y</math> állandók, ez pont a legkisebb négyzetek módszerét adja és P értéke megmondja, hogy mennyire jó az illesztés.
 === A Khí-négyzet módszer ===
@@ 44. sor: / 52. sor: @@
 Ha a mérési pontok hibájának szórása nem egyforma (de továbbra is normál eloszlást követnek), akkor a legkisebb négyzetek módszerét könnyen általánosíthatjuk. Ez a Khí-négyzet illesztés, amelynek költségfüggvénye a következő:
-<math>\chi^2 = \sum_{i=1}^N \left( \frac{y_i - y(x_i;a_1, \ldots a_M}{\sigma_i} \right)^2</math>
+<math>\chi^2 = \sum_{i=1}^N \left( \frac{y_i - \alpha - \beta x_i}{\sigma_i} \right)^2</math>
 Tekinthetjük úgy, hogy a <math>\sigma_i</math> szórásokkal súlyozzuk az eltéréseket, vagy másképpen egységnyi szórásúra normálunk minden pontnál.
-Mivel a mérési pontokról feltételeztük, hogy normál eloszlást követnek, <math>\chi^2</math> ilyen véletlen változók négyzetének összege. Az ilyen típusú valószínűségi változók nem Gauss eloszlást, hanem az úgynevezett (N - M) szabadsági fokú Khí-négyzet eloszlást követik. Ha az <math>a_j</math> paraméterek lineárisan szerepelnek akkor ez az eloszlás analitikusan megadható, így megmondható annak valószínűsége (Q), hgoy az adott paraméterekkel jellemzett modellen végzett mérés <math>\chi^2</math>-nél nagyobb eltérést ad. (<math>Q \approx 0,1</math> tipikus, <math> Q \approx 0,01</math> elfogadható, <math> Q < 0,001</math> rossz modellre vagy hibabecslésre utal). Fontos, hogy a mérési hibák becslése jó legyen, különben megtévesztő eredményre juthatunk.
+Mivel a mérési pontokról feltételeztük, hogy normál eloszlást követnek, <math>\chi^2</math> ilyen véletlen változók négyzetének összege. Az ilyen típusú valószínűségi változók nem Gauss eloszlást, hanem az úgynevezett (N - M) szabadsági fokú Khí-négyzet eloszlást követik. Ha az <math>a_j</math> paraméterek lineárisan szerepelnek akkor ez az eloszlás analitikusan megadható, így megmondható annak valószínűsége (Q), hogy az adott paraméterekkel jellemzett modellen végzett mérés <math>\chi^2</math>-nél nagyobb eltérést ad. (<math>Q \approx 0,1</math> tipikus, <math> Q \approx 0,01</math> elfogadható, <math> Q < 0,001</math> rossz modellre vagy hibabecslésre utal). Fontos, hogy a mérési hibák becslése jó legyen, különben megtévesztő eredményre juthatunk.
+A levezetés lépései teljesen azonosak az előző esettel.
+==== Példa: egyenes illesztés ====
+Legegyszerűbb példa a lineáris regresszióra a kétparaméteres egyenesillesztés.
+<math>y(x) = a + bx\,</math>
+A költségfüggvényünk most:
+<math>\chi^2(a,b) = \sum_{i=1}^N \left( \frac{y_i - a - bx_i}{\sigma_i} \right)^2</math>
+A minimumban a deriváltak eltűnnek:
+<math>0 = \frac{\partial \chi^2}{\partial a} = -2\sum_{i=1}^N \frac{y_i - a - bx_i}{\sigma_i^2}</math>
+<math>0 = \frac{\partial \chi^2}{\partial b} = -2\sum_{i=1}^N \frac{x_i(y_i - a - bx_i)}{\sigma_i^2}</math>
-Annak feltétele, hogy a <math>\chi^2</math>-nek minimuma van az, hogy az <math>a_j</math> paraméterek szerinti deriváltja 0 legyen.
+A fenti kifejezésekben a szummákat szétbonthatjuk az alábbi jelölések segítségével:
-<math>\frac{\partial \chi^2}{\partial a_j} = \sum_{i=1}^N \left( \frac{y_i - y(x_i)}{\sigma_i^2} \right) \left( \frac{\partialy(x_i;a_1 \ldots a_M}{\partial a_k} \right) j = 1 \ldots M</math>
+<math>S \equiv \sum_{i=1}^N \frac{1}{\sigma_i^2} \quad S_x \equiv \sum_{i=1}^N \frac{x_i}{\sigma_i^2} \quad S_y \equiv \sum_{i=1}^N \frac{y_i}{\sigma_i^2} \quad S_{xx} \equiv \sum_{i=1}^N \frac{x_i^2}{\sigma_i^2} \quad S_{xy} \equiv \sum_{i=1}^N \frac{x_iy_i}{\sigma_i^2}</math>
-Ez általában M nemlináris egyenletből álló rendszerre vezet, de ha az <math>a_j</math> paraméterek lineárisan szerepelnek az y(x; a_1 \ldots a_M) kifejezésben, akkor az egyenletek is lineárisak lesznek.
+Így a minimum feltétele a következő:
-=== Példa: egyenes illesztés ===
+<math>aS + bS_x = S_y\,</math>
+<math>aS_x + bS_{xx} = S_{xy}\,</math>
+Az egyenletrendszer megoldása pedig:
+<math>\Delta \equiv SS_{xx} - S_x^2</math>
+<math>a = \frac{S_{xx}S_y - S_xS_{xy}}{\Delta}</math>
+<math>b = \frac{SS_{xy}-S_xS_y}{\Delta}</math>
+A hibaterjedés törvényét figyelembe véve a teljes szórás:
+<math>\sigma_f^2 = \sum_{i=1}^N \sigma_i^2 \left( \frac{\partial f}{\partial y_i} \right)^2</math>
+Amibe a-t és b-t behelyettesítve:
+<math>\sigma_a^2 = \frac{S_{xx}}{\Delta}</math>
+<math>\sigma_b^2 = \frac{S}{\Delta}</math>
+Ezek a hibák természetesen csak a mérési hibák hatását fejezik ki, ettől a pontok szórhatnak messze az egyenestől. Az illesztés jóságát az (N-2) szabadsági fokú khí-négyzet eloszlás adja meg a <math>\chi^2</math> helyen.
+Ha a mérés hibája nem ismert, akkor a fenti képletek a <math>\sigma_i = 1</math> behelyettesítéssel használhatók (úgy tekintjük, hogy mindegyik pont hibája megegyezik).
+=== Maximum Likelihood ===
+A maximum likelihood a legvalószínűbb becslést adja egy tetszőleges eloszlás paramétereire. Ha <math>x_1, ...x_n</math> megfigyelésünk van, és egy <math>f(x|a)</math> modellt szeretnénk fittelni, akkor független és azonos eloszlású minták esetén a feltételes valószínűség faktorizálható, azaz annak a valószínűsége, hogy az x mérési pontokat kaptuk feltéve, hogy a modell paraméterrendszere a:
+:<math>f(x|a) = f(x_1|a) \cdot ... \cdot f(x_n|a)</math>
+Ha megfordítjuk a logikát és azt kérdezzük, hogy feltéve, hogy x értékeket mértünk, mi a valószínűsége annak, hogy a modellt az a paraméterek jellemzik, akkor a likelihood függvényt kapjuk:
+:<math>\mathcal{L}(a|x_1...x_n)=\prod_{i=1}^n f(x_i|a)</math>
+vagy ha vesszük a logaritmusát:
+:<math>\ln \mathcal{L}(a|x_1...x_n)=\sum_{i=1}^n \ln f(x_i|a)</math>
+A legjobb becslést L (vagy ekvivalensen ln L) maximuma adja. Ha f a normális eloszlás, akkor könnyen kiszámolható a maximum a paraméterek szerinti deriváltak zérussá válásából. Ebből a szokásos értékeket kapjuk az átlagra (mérések összege / elemszám) és a szórásra (átlagtól való négyzetes eltérések átlaga).
 === Nem-lineáris regresszió ===
+Amennyiben a modell paraméterek a modellben nem-lineáris alakban szerepelnek, akkor a fenti módszerek nem működnek, ez vezet a nem-lineáris regresszió problémájára. Ez többek között azt is jelenti, hogy nincs garantálva, hogy egyetlen globális optimum van, ezért a megoldások analitikusan általában nem kezelhetők: csak numerikus közelítő eljárásokkal tudjuk előállítani a legjobb becsléseket.
+Léteznek megfelelő általánosításai a legkisebb négyzetek módszerének nemlineáris esetekre, csak úgy, mint a legtöbb más modellnek is.
+Szemléletesen ha a modell összefüggését a paraméterekkel az f függvény adja, akkor a paraméterek szerinti deriválásoknál megjelenik f deriváltja is.
+==== Nem-lineáris legkisebb négyzetek módszere====
+A költségfüggévny:
+:<math>S = \sum_i^n \left[ y_i - f(a, x_i)\right]^2</math>
+a derivált:
+:<math>\frac{\partial S}{\partial a} = -2 \sum_i^n \left[ y_i - f(a, x_i)\right] \frac{\partial f(a, x_i}{\partial a} = 0</math>
+Az így kapható egyenletrendszer nem-lineáris, ezért általában valamilyen iterációs módszerrel lehet csak kezelni, például a Newton-iteráció általánosítható nem-lineáris egyenletrendszerek megoldására.
 {{MSc záróvizsga}}

„Adatelemzés: lineáris és nem lineáris regresszió egy modellen bemutatva” változatai közötti eltérés

A lap jelenlegi, 2011. június 16., 22:07-kori változata

Tartalomjegyzék

Általános statisztikai jellemzők

Modellek illesztése

Lineáris regresszió

Legkisebb négyzetek módszere

A Khí-négyzet módszer

Példa: egyenes illesztés

Maximum Likelihood

Nem-lineáris regresszió

Nem-lineáris legkisebb négyzetek módszere

Navigációs menü

Személyes eszközök

Névterek

Változatok

Nézetek

Több

Keresés

Navigáció

Eszközök

Nyomtatás/ exportálás