„Adatelemzés: lineáris és nem lineáris regresszió egy modellen bemutatva” változatai közötti eltérés
a |
(→Lineáris regresszió) |
||
3. sor: | 3. sor: | ||
== Modellek illesztése == | == Modellek illesztése == | ||
=== Lineáris regresszió === | === Lineáris regresszió === | ||
+ | |||
+ | A most leírt modell tulajdonságai a következők: | ||
+ | |||
+ | *prediktor változó: x | ||
+ | *az y-ok függetlenek | ||
+ | *adott x-re kapott y-ok normál eloszlásúak olyan átlaggal, ami az x lineáris függvényeként kapható meg | ||
+ | |||
+ | *Feladat: adott x-re y-t megmondani. A straight line regression model (egyenes vonal illesztő modell) alakja a köv: | ||
+ | |||
+ | <math>y = \alpha + \beta \cdot x + \epsilon</math>, vagy indexesen <math>(x_1, y_1), (x_2, y_2) \ldots: y_i = \alpha + \beta \cdot x_i + \epsilon_i</math> | ||
+ | |||
+ | A normál analízis során azt feltételezzük, hogy epsilon_i-k független és azonosan 0 átlagú és szigma^2 szórású normál eloszlást követő változók. Az alfa+beta*x a determinisztikus rész, az epsilon_i a random zaj. Az előbbi érdekel minket. | ||
+ | |||
+ | Az illesztés során a legkisebb négyzetek módszerét használhatjuk. | ||
+ | |||
+ | === Legkisebb négyzetek módszere === | ||
+ | |||
+ | Tegyük fel, hogy <math>(x_i, y_i), i = 1 \ldots N</math> mérési adatokra akarunk függvényt illeszteni, melynek paraméterei <math>a_j, j = 1 \ldots M</math>, azaz | ||
+ | |||
+ | <math>y(x) = x(x;a_1,a_2,\ldots,a_m)</math> | ||
+ | |||
+ | A legkisebb négyzetek módszere a következő módon keresi a paramétereket: | ||
+ | |||
+ | <math>{min}_{a_1 \ldots a_m}\left( \sum_{i=1}^N [y_i - y(x_i;a_1,\ldots,\a_m)]^2 \right)</math> | ||
+ | |||
+ | Ez azért jó, mert megadja a paraméterek legvalószínűbb halmazát. Természetesen lehetne más költségfüggvényt is használni. | ||
+ | |||
=== Nem-lineáris regresszió === | === Nem-lineáris regresszió === | ||
{{MSc záróvizsga}} | {{MSc záróvizsga}} |
A lap 2011. június 13., 18:11-kori változata
Tartalomjegyzék
Általános statisztikai jellemzők
(Átlag szórás, kovariancia...)
Modellek illesztése
Lineáris regresszió
A most leírt modell tulajdonságai a következők:
- prediktor változó: x
- az y-ok függetlenek
- adott x-re kapott y-ok normál eloszlásúak olyan átlaggal, ami az x lineáris függvényeként kapható meg
- Feladat: adott x-re y-t megmondani. A straight line regression model (egyenes vonal illesztő modell) alakja a köv:
, vagy indexesen
A normál analízis során azt feltételezzük, hogy epsilon_i-k független és azonosan 0 átlagú és szigma^2 szórású normál eloszlást követő változók. Az alfa+beta*x a determinisztikus rész, az epsilon_i a random zaj. Az előbbi érdekel minket.
Az illesztés során a legkisebb négyzetek módszerét használhatjuk.
Legkisebb négyzetek módszere
Tegyük fel, hogy mérési adatokra akarunk függvényt illeszteni, melynek paraméterei , azaz
A legkisebb négyzetek módszere a következő módon keresi a paramétereket:
Értelmezés sikertelen (Hiányzó <code>texvc</code> végrehajtható fájl; a beállítást lásd a math/README fájlban.): {min}_{a_1 \ldots a_m}\left( \sum_{i=1}^N [y_i - y(x_i;a_1,\ldots,\a_m)]^2 \right)
Ez azért jó, mert megadja a paraméterek legvalószínűbb halmazát. Természetesen lehetne más költségfüggvényt is használni.