Lineárna regresia

  • linRegGrafpredstavuje aproximáciu daných hodnôt pomocou polynómu prvého rádu metódou najmenších štvorcov, inak povedané: hľadá sa priamka v grafe, aby súčet druhých mocnín (štvorcov) odchýlok (yi - y^i)  jednotlivých bodov od priamky bol minimálny
  • môže všeobecne znamenať aj aproximáciu daných hodnôt [xi,yi] takou funkciou yt = f(x, b1 , …, bk), ktorá sa dá vyjadriť lineárnou kombináciou    y = b1f1(x)+ … + bkfk(x). Koeficienty b1, …, bk sú vypočítané metódou najmenších štvorcov. Platí kritérium (S):       

Majme jednorovnicový model:
yt = b0 + b1xt1 + … + bkxtk + ut ,pre t = 1, 2. …, n

Jednorovnicový model môžeme jednoduchšie zapísať v maticovom tvare ako:

y = Xb + u.

Potom odhad vektora parametrov označme ako b^ a vypočítané (teoretické) hodnoty vysvetľovanej premennej ako y^, pričom: y^ = Xb^ a skutočné hodnoty vysvetľovanej premennej ako y = Xb^ + e, kde e je vektor konkrétnych reziduálnych odchýlok, vypočítaných zo vzťahu:

e = yXb^ = yy^

Odvodenie vzorca pre výpočet lineárnej regresie:

Pretože e je vektor, upravme túto požiadavku tak, aby súčet štvorcov jednotlivých odchýlok (zložiek vektora e) bol minimálny. Jedná sa teda o minimalizáciu skalárneho súčinu, ktorý môžeme napísať pomocou transpozície:

eT e → min

Súčin bude minimálny, ak jeho deriváciu podľa b položíme rovnú nule:

(eT e)' = [ (y - Xb^)T (yXb^)]' = 0

Po použití pravidiel transpozície súčinu:

[yT y - yT Xb^ - b^T XT b^ - b^T XT y + b^T XT Xb^]' = 0

Po použití pravidiel pre deriváciu súčinu matíc:

2XT y - 2XT Xb^ = 0

Jednoduchou úpravou dostaneme:

b^ = (XT X)-1 XT y

Výpočet

Vzorový príklad s metódami na odhad parametrov lineárnej regresie sa nachádza v tomto scripte.

Na odhad parametrov lineárnej regresnej funkcie (jednoduchá metóda najmenších štvorcov) môžme použiť viacero metód:

1. Výpočet vektora parametrov b cez matice Ukázať
2. Výpočet vektora parametrov b pomocou funkcie lm() Ukázať
3. Výpočet vektora parametrov b pomocou vlastnej funkcie Ukázať

Zdroje:
Lineárni regrese tak nebo jinak[4.6.2015]
Metoda nejmensich ctvercu [4.6.2015]
Marček, D., Marček, M., Pančíková, L.: Ekonometria a soft computing. Žilina: EDIS, 2008 ISBN 978-80-8070-746-0

Comments are closed.