prednaska7 stat

Information about prednaska7 stat

Published on November 30, 2007

Author: dexterka

Source: authorstream.com

Content

Regresná a korelačná analýza (RaKA) resp. Korelačný počet :  Regresná a korelačná analýza (RaKA) resp. Korelačný počet Skúmanie vzťahov medzi štatistickými znakmi::  Skúmanie vzťahov medzi štatistickými znakmi: Skúmanie vzťahov medzi kvalitatívnymi znakmi, napr. AB , nazýme meranie asociácie skúmanie vzťahov medzi kvantitatívnymi štatistickými znakmi - regresná a korelačná analýza Pri regresenej a korelečnej analýze pôjde:  Pri regresenej a korelečnej analýze pôjde skúmanie príčinnej - kauzálnej závislosti, skúmanie vzťahov medzi príčinou a účinkom kedy jeden resp viac javov (znakov, nezávisle prememnných veličín ) vyvoláva účinok - výsledný jav - závisle prememnnú veličinu Y = f (X1 X2…... Xk ,Bo , B1 ,….Bp ) +e Závislé premenná - účinok Nezávislé premenné veličiny - príčiny Neznáme parametre funkčného vzťahu Náhodné, nešpecifikované vplyvy Príklad zdanlivej korelácie:  Príklad zdanlivej korelácie Jedna z preslávených zdanlivých korelácií : ak sa dĺžka sukní skracuje kurzy akcií stúpajú . Odhliadnúc od toho, že to nie vždy platí, išlo by Skutočne o zdanlivú, alebo nezmyselnú koreláciu Príklady štatistickej - voľnej -závislosti :  Príklady štatistickej - voľnej -závislosti Skúmanie závislosti spotreby bravčového mäsa od príjmu, ceny mäsa bravčového ceny mäsa hovädzieho a hydiny a od tradície, resp. ďalších nešpecifikovaných, či náhodných vplyvov. Skúmanie pridanej hodnoty resp. HNP od vstupov: práce a kapitálu…. Skúmanie závislosti výživy obyvateľstva od stupňa ekonomického rozvoja krajiny…. Opakom štatistickej závislosti je funkčná závislosť:  Opakom štatistickej závislosti je funkčná závislosť Y = f(X1 X2…... Xk ,Bo , B1 ,…., Bp) kedy je závisle prememnná veličina jednoznačne určená funkčným vzťahom, príklady z fyziky, chémie - takýto druh vzťahov nie je predmetom štatistického skúmania Regresná a korelačná analýza (RaKA):  Regresná a korelačná analýza (RaKA) Dve základné úlohy RaKA: regresná úloha (RÚ) jej podstatou je a) nájsť funkčný vzťah podľa ktorého sa mení závislé premenná so zmenou nezávisle premenných - nájsť vhodnú regresnú funkciu. b) Súčasne je potrebné odhadnúť parametre regresnej funkcie. korelačná úloha (KÚ)- merať tesnosť - silu skúmanej závislosti. Znázornenie korelačného poľa v dvoch prípadoch :  Znázornenie korelačného poľa v dvoch prípadoch x y Podľa počtu nezávisle premenných rozlišujeme::  Podľa počtu nezávisle premenných rozlišujeme: Jednoduchú závislosť , kedy uvažujeme len jednú nezávislé premennú X, teda skúmame vzťah medzi Y a X viacnásobnú závislosť, pri ktorej uvažujeme minimálne dve nezávislé prememnné veličiny (znaky) X1, X2, … Xk , pričom k  2 Jednoduchá regresná a korelačná analýza :  Jednoduchá regresná a korelačná analýza Uvažujme štatistický znak X a Y medzi ktorými je v základnom súbore lineárna závislosť Y = Bo + B1 X +e bodovým odhadom tejto regresnej funkcie je priamka yj = b0 + b 1 xj + ej , ktorej koeficienty vypočítame z výberových údajov Akú metódu použiť ??? Metóda najmenších štvorcov (MNŠ) :  Metóda najmenších štvorcov (MNŠ)  Získame sústavu p+1 rovníc s p+1 neznámymi parametrami yj = b0 + b 1 xj + ej  môžeme zapísať yj = yj , + ej a ej = y j - yj , Princíp MNŠ Metódy najmenších štvorcov:  yj = b0 + b 1 xj + ej  môžeme zapísať yj = yj , + ej a ej = y j - yj , Princíp MNŠ Metódy najmenších štvorcov (ej ) = y j - y j’ (ej )2 = (y j - y j’)2 Možno dokázať, že koeficienty bo , b1 , …, bp určené MNŠ sú “najlepšie odhady” parametrov B 0 , B1 , …, Bp ak súčasne o náhodných chybách platí: :  Možno dokázať, že koeficienty bo , b1 , …, bp určené MNŠ sú “najlepšie odhady” parametrov B 0 , B1 , …, Bp ak súčasne o náhodných chybách platí: E (ej ) = 0, D (ej ) = E (ej2 ) = 2 , E(ej1 , ej2 ) = 0 , pre každé j1  j2 Slovne možno podmienku formulovať nasledovne: od náhodných chýb požadujeme nulovú strednú hodnotu, konštantný rozptyl a vzájomnú nezávislosť náhodných chýb. Koeficienty jednoduchej regresnej funkcie odvodíme::  Koeficienty jednoduchej regresnej funkcie odvodíme: Úpravou získame nasledovné dve normálové rovnice s dvomi neznámymi parametrami: :  Úpravou získame nasledovné dve normálové rovnice s dvomi neznámymi parametrami: Sústavu rovníc môžme riešiť eliminačnou metódou , alebo pomocou determinantov. Získame tak koeficienty b o a b 1 Postup pri výpočte koeficientov LRF:  Postup pri výpočte koeficientov LRF xj yj xjyj xj 2 x1 y1 x1y1 x12 x2 y2 xn yn Interpretácia koeficientov ljednoduchej lineárnej regresnej funkcie:  Interpretácia koeficientov ljednoduchej lineárnej regresnej funkcie bo …lokujúca konštanta vyjadruje očakávanú úroveň závislé premennej pri nulovej hodnote nezávisle premennej b 1 …. regresný koeficient vyjadruje o koľko merných jednotiek sa zmení závislé premenná pri zmene nezávisle premennej o jednu mernú jednotku ak b1 > 0 …ide o pozitívnu závislosť po b1< 0 ….jedná sa o negatívnu závislosť Vlastnosti metódy najmenších štvorcov: :  Vlastnosti metódy najmenších štvorcov: Regresná funkcia prechádza bodom o súradniciach a Kedy možno MNŠ aplikovať?:  Kedy možno MNŠ aplikovať? Ak je regresná funkcia lineárna lineárna v parametroch (LvP) alebo vieme regresnú funkciu transformovať na lineárnu v prametroch Posúďte u ktorých z nasledujúccich regresných funkcií možno použiť MNŠ Niektoré typy jednoduchých regresných funkcií :  Niektoré typy jednoduchých regresných funkcií Príklady z mikro- a makroekonómie:  Príklady z mikro- a makroekonómie Philipsova krivka ???? Cobbova -Douglasova produkčná funkcia Engelove krivky Krivky ekonomického rastu Uveďte ďalšie…... Skúmanie vzťahu spotreby vybraných komodít od úrovne HNP:  Skúmanie vzťahu spotreby vybraných komodít od úrovne HNP Porovnanie dvoch prípadov závislosti Ktorá závislosť bude tesnejšia?:  Porovnanie dvoch prípadov závislosti Ktorá závislosť bude tesnejšia? y x Slide25:  Intervaly spoľahlivosti pri lineárnej regresii.   Okrem bodových odhadov parametrov lineárnej regresnej funkcie sa často prepočítavajú aj intervalové odhady parametrov, ktoré nazývame intervaly spoľahlivosti. Výpočty intervalov spoľahlivosti je možné urobiť s pomocou štandardných odchýlok parametrov a reziduálneho rozptylu. Reziduálny rozptyl je za predpokladu platnosti podmienok lineárneho klasického modelu , neskresleným odhadom stochastického parametra a vypočíta sa podľa vzťahu Slide26:  Intervalový odhad ľubovoľného parametra pre regresnú priamku vychádza z toho, že za predpokladov formulovaných klasickým lineárnym modelom má veličina t rozdelenie s n – p stupňami voľnosti. Pri zvolenej spoľahlivosti 1 – je obojstranný interval spoľahlivosti pre parameter daný vzťahom Slide27:  a pre parameter analogicky sa konštruuje aj obojstranný interval spoľahlivosti pre regresnú priamku   kde je kvantil t rozdelenia s (pre regresnú priamku n – 2) stupňami voľnosti. Korelačná úloha korelačného počtu :  Korelačná úloha korelačného počtu Skúmať tesnosť - silu - závislosti k tomu slúžia miery tesnosti závislosti požadujeme, aby sa pohybovali v pevne ohraničanom intervale, a aby vrámci intervalu rástli s vyššiou silou závislosti Slide29:  Korelačná analýza predstavuje súhrn metód a postupov, pomocou ktorých overujeme vypovedaciu schopnosť kvantifikovaných regresných modelov ako celku aj jeho častí. Overovanie vypovedacej schopnosti kvantifikovaných regresných modelov vedie k výpočtu číselných charakteristík, ktoré v koncentrovanej forme popisujú kvalitu vypočítaných modelov. Index korelácie a index determinácie V základnom súbore Iyx odhadom z výberových údajov je iyx est Iyx = iyx . Princíp spočíva v rozklade variability závisle premennne Y:  Index korelácie a index determinácie V základnom súbore Iyx odhadom z výberových údajov je iyx est Iyx = iyx . Princíp spočíva v rozklade variability závisle premennne Y Celková variabilita závisle premennej Variabilita závisle premennej vysvetlená regresnou funkciou Variabilita nevysvetlená regresnou funkciou - reziduálna variabilita Slide31:  . Je zrejmé, že platí vzťah  C = V + N C = je celkový súčet štvorcov odchýlok V = je vysvetlený súčet štvorcov odchýlok N = je nevysvetlený (reziduálny) súčet štvorcov odchýlok. Index korelácie iyx :  Index korelácie iyx Index determinácie iyx2 Slide33:  Index determinácie môže nadobúdať hodnoty z intervalu 0 až 1 , čím viac sa hodnota indexu blíži k jednotke, tým väčšia časť celkovej variability je modelom vysvetlená a naopak, ak sa index determinácie blíži k nule, tým menšia časť celkovej variability je modelom vysvetlená.  Index determinácie sa bežne používa ako kritérium pri rozhodovaní o voľbe konkrétneho tvaru regresnej funkcie. Ak však majú regresné funkcie rôzny počet parametrov je potrebné upraviť index determinácie do korigovanej podoby v tvare: Slide35:  Testovacie kritérium v tabuľke je možné využiť k súčasnému testovaniu významnosti celého regresného modelu, indexu determinácie aj indexu korelácie. Vypočítanú hodnotu F testu porovnávame s kvantilom F rozdelenia a p-1 a n – p stupňov voľnosti tj. ak F považujeme regresný model za nevýznamný, podobne aj index determinácie a index korelácie. ak F > považujeme regresný model za štatisticky významný, podobne aj index determinácie a index korelácie Slide36:  K detailnému vyhodnoteniu kvality jednotlivých parametrov regresného modelu sa používajú t testy parametrov. Pri teste formulujeme nulovú hypotézu H0 : pre i = 0, 1 H1 : v ktorej predpokladáme nulové teda nevýznamné pôsobenie či vplyv premennej pri ktorej parameter stojí. Testovacie kritérium je definované vzťahom Slide37:  kde je hodnota parametra regresnej funkcie a je štandardná odchýlka parametra.   Vypočítanú hodnotu testovacieho kritéria porovnávame s kvantilom t rozdelenia na hladine významnosti a stupňov voľnosti tj.: - ak        nulovú hypotézu o nevýznamnosti parametra nezamietame -  ak       zamietame nulovú hypotézu a potvrdzujeme štatistickú významnosť posudzovaného parametra. Slide38:  Nelineárna regresná a korelačná analýza   Okrem lineárnych regresných funkcií sa v praxi veľmi často používa celý rad nelineárnych funkcií, pričom je možné použiť nelineárne funkcie s dvoma alebo viacerými parametrami. Niektoré nelineárne regresné funkcie je možné vhodnou transformáciou upraviť na lineárne v parametroch, ktoré potom môžeme riešiť metódou najmenších štvorcov.   Najčastejšie môžeme nelineárne funkcie s dvoma parametrami transformovať na tvar: Slide39:  ktorú odhadneme regresnou funkciou v tvare kde Funkcia sa potom vypočíta ako lineárna funkcia. Nie všetky nelineárne funkcie je možné takýmto spôsobom prepočítať, len tie ktoré sú lineárne v parametroch, tj existuje určitá forma transformácie, ktorú nazývame linearizujúca transformácia, najčastejšie sa jedná o substitúciu a logaritmickú transformáciu napr.: Slide40:  –        hyperbolická funkcia Slide41:  logaritmická funkcia Slide42:  exponenciálna funkcia Slide43:  mocninová (Cobb-Douglasova produkčná funkcia) Slide44:  Podobne je možné upraviť aj niektoré viacparametrické nelineárne funkcie ako je napr. parabola druhého stupňa Slide45:  hyperbola druhého stupňa Slide46:  Je potrebné si uvedomiť, že transformované regresné funkcie nemajú vždy rovnaké parametre ako pôvodné nelineárne regresné funkcie, takže je potrebné z odhadnutých parametrov transformovaných regresných funkcií spätne prepočítať odhady pôvodných parametrov. Takto získané odhady pôvodných parametrov síce nemajú optimálne štatistické vlastnosti, ale pre riešenie konkrétnych úloh často postačujú. Niektoré regresné funkcie nie je možné ani transformáciou premenných upraviť na funkcie lineárne v parametroch. Odhady parametrov takýchto funkcií sa získavajú pomocou rôznych aproximatívnych iteračných metód. Väčšina z nich je založená na postupnom zlepšovaní tzv. prvotných odhadov, ktorými môžu byť napríklad expertné odhady, odhady získané metódou vybraných bodov a pod. Slide47:  Viacnásobná regresná a korelačná analýza   Predpokladajme, že medzi závisle premennou Y a vysvetľujúcimi (nezávisle) premennými Xi ,i = 1, 2, ..., k  je lineárna závislosť, o ktorej sme sa už z časti zmienili v predchádzajúcich častiach popísaná rovnicou ktorú odhadneme rovnicou Slide48:  Koeficienty , ktoré sú odhadmi parametrov , musia spĺňať požiadavku metódy najmenších štvorcov keďže predpokladáme konkrétny tvar regresnej funkcie môžeme ho dosadiť do predchádzajúceho vzťahu a hľadať minimum tejto funkcie tj.: minimum funkcie určíme podobne ako pre prípad jednoduchej regresnej závislosti pomocou parciálnych derivácií funkcie Slide49:  Čo vedie k sústave normálnych rovníc v tvare Slide50:  Riešením tejto sústavy rovníc vypočítame hľadané koeficienty lineárnej regresnej rovnice Podobne ako pre jednoduchú lineárnu závislosť, môžeme odhad parametrov vypočítať z maticovej rovnice Kvalitu regresného modelu hodnotíme podobne ako pre jednoduchú lineárnu závislosť, ktorú sme popísali v predchádzajúcej časti

Related presentations


Other presentations created by dexterka

prednaska8 stat
30. 11. 2007
0 views

prednaska8 stat

prednaska11 em
09. 12. 2007
0 views

prednaska11 em

PhD entrance exam
16. 08. 2007
0 views

PhD entrance exam

prednaska10 em
16. 12. 2007
0 views

prednaska10 em

prednaska7 em
16. 12. 2007
0 views

prednaska7 em

prednaska9 stat
17. 12. 2007
0 views

prednaska9 stat

em prednaska1 LS
20. 02. 2008
0 views

em prednaska1 LS

em prednaska2 LS
20. 02. 2008
0 views

em prednaska2 LS

em prednaska3 LS
21. 02. 2008
0 views

em prednaska3 LS

em prednaska1 LS2
21. 02. 2008
0 views

em prednaska1 LS2

prednaska3 stat
30. 09. 2007
0 views

prednaska3 stat

prednaska2 em
25. 09. 2007
0 views

prednaska2 em

prednaska1 em
25. 09. 2007
0 views

prednaska1 em

prednaska2 stat
25. 09. 2007
0 views

prednaska2 stat

Prednaska1 stat
25. 09. 2007
0 views

Prednaska1 stat

prednaska3 em
30. 09. 2007
0 views

prednaska3 em