Rozsáhlý modul Lineární regrese nabízí bohaté komentované textové i grafické výstupy a diagnostiku pro obyčejných i obecných lineárních modelů. Nabízené metody zahrnují nejmenší čtverce, robustní metody jako M-odhady, L1-regrese, nejmenší medián, metodu kvantilové regrese, rezistentní metodu BIR. Uživatel může zadat váhy, definovat libovolný lineární nebo linearizovaný model s možností automatické korekční transformace (kvazilinearizace). Automatická tvorba polynomických modelů. Automatická tvorba Taylorových polynomů 2.stupně pro vícerozměrná data, výpočet optima responsní plochy. Při výpočtu se používá stabilní metoda pseudoinverze. Bohatá diagnostika zajistí odhalení všech problémů v datech. Metoda Stepwise-All, hodnocení všech možných (až 8000) regresních modelů, možnost výběru nejlepších modelů podle tří kritérií. Analýza regresního tripletu, analýza reziduí, výpočet predikce pro zadaná data a mnoho dalších možností.
Lineární regrese - manuál ve formátu Pdf
- Výpočet parametrů lineárních modelů.
- Proložení dat přímkou nebo křivkou.
- Predikce proměnné podle modelu.
- Automatické nalezení optimálního modelu metodou Stepwise-All.
- Kalibrace, verifikace, validace.
- Optimalizace responsních povrchů, optimalizace ekonomiky a technologií.
- Robustní metody pro "nekvalitní" data.
- Výkonné diagnostické metody pro odhalení zvláštností v datech.
Modely:
- Prosté lineární modely
- Polynomické modely
- Taylorovy kvadratické modely
- Uživatelsky definované lineární modely
- Vážená regrese
- Kvazilinearizace závisle proměnné
- Implicitní modely
- Stepwise - všechny podmnožiny
|
Metody:
- Nejmenší čtverce
- Korekce hodnosti
- Kvantilová regrese
- Lp-regrese
- Nejmenší medián
- IRWLS
- M-odhady
- Rezistentní metoda BIR
- Stepwise All
|
Protokol:
- Základní analýza
- Korelace X
- Multikolinearita
- Vlastní čísla, VIF
- Analýza rozptylu
- Parametry
- Intervaly spolehlivosti
- Statistické charakteristiky
- R, RSČ, AIC, MEP, atd.
- Klasická rezidua
- Závislost reziduí
- Regresní triplet
- Testy dat a reziduí
- Testy modelu
- Predikované statistiky
- Vlivná data
- Jackknife rezidua
- Projekční matice
- Cookova vzdálenost
- Atkinsonova vzdálenost
- Andrews-Pregibon
- Věrohodnostní vzdálenosti
- Predikce
|
Grafické výstupy:
- Regresní křivka
- Y-predikce
- Rezidua vs. Predikce
- Abs. rezidua
- Čtverec reziduí
- QQ-graf reziduí
- Autokorelace
- Heteroskedasticita
- Jackknife rezidua
- Predikovaná rezidua
- Parciální regresní grafy
- Parciální reziduální grafy
- Projekční matice
- Predikovaná rezidua
- Pregibon
- Williams
- McCulloh
- L-R Graf
- Cookova vzdálenost
- Atkinsonova vzdálenost
- Normalizovaná rezidua
- Andrewsův graf
- Predikovaná rezidua
- Jackknife rezidua
|
Základní panel lineární regrese:
Panel pro specifikaci textových a grafických výstupů:
Panel pro definici uživatelského modelu:
Ukázky použití:
Příklad regresní přímky s vyznačeným pásem spolehlivosti, identifikací odlehlých měření a souřadnicovou mřížkou:
Příklad porovnání dvou modelů:
První model má 5 členů a velmi dobře vystihuje data.
Model: [Rate] ~ Abs + [pH-value] + [pH-value]^2 + Ln([pH-value]) + Exp([pH-value])
Má však špatnou schopnost predikce mimo interval dat. Navíc jsou tři regresní koeficienty statisticky nevýznamné. Tento model je prakticky nepoužitelný.
Proměnná |
Odhad |
Směr.Odch. |
Závěr |
Pravděpodobnost |
Spodní mez |
Horní mez |
Abs |
2.178920359 |
0.4781566966 |
Významný |
2.0071724E-005 |
1.226172343 |
3.131668374 |
[pH-value] |
-0.2512150455 |
0.6432896894 |
Nevýznamný |
0.6972768229 |
-1.532997732 |
1.030567641 |
[pH-value]^2 |
0.0064187489 |
0.0397346354 |
Nevýznamný |
0.8721080375 |
-0.072754247 |
0.08559173928 |
Ln([pH-value]) |
1.502365814 |
1.109297323 |
Nevýznamný |
0.1797490765 |
-0.707957352 |
3.71268898 |
Exp([pH-value]) |
0.0002611483 |
3.1980627E-005 |
Významný |
6.2911891E-012 |
0.0001974255 |
0.0003248710 |
Reziduální variabilita |
12.21360278 |
Hodnota kritéria F |
359.6264707 |
Vícenásobný korelační koeficient R |
0.9752305217 |
Koeficient determinace R^2 |
0.9510745705 |
Predikovaný korelační koeficient Rp |
0.9418693616 |
Střední kvdratická chyba predikce MEP |
0.1836906899 |
Akaikeho informační kritérium |
-137.4849057 |
Druhý model má pouze 4 členy ale rovněž velmi dobře vystihuje data. Z původního modelu jsme vyloučili logaritmický člen.
Model: [Rate] ~ Abs + [pH-value] + [pH-value]^2 + Exp([pH-value])
Jeho schopnost predikce mimo interval dat je daleko lepší. Navíc jsme dosáhli statistické významnosti všech čtyř parametrů. Všimněte si výrazného zvýšení F-kritéria u druhého modelu.
Proměnná |
Odhad |
Směr.Odch. |
Závěr |
Pravděpodobnost |
Spodní mez |
Horní mez |
Abs |
1.619105504 |
0.2417007386 |
Významný |
3.3881958E-009 |
1.137612942 |
2.100598066 |
[pH-value] |
0.6052303125 |
0.1186739087 |
Významný |
2.4763148E-006 |
0.3688197633 |
0.8416408618 |
[pH-value]^2 |
-0.044536446 |
0.01284989911 |
Významný |
0.000877772615 |
-0.07013475788 |
-0.018938134 |
Exp([pH-value]) |
0.0002906152 |
2.3568737E-005 |
Významný |
0 |
0.00024366393 |
0.0003375666 |
Reziduální variabilita |
12.51634119 |
Hodnota kritéria F |
473.622371 |
Vícenásobný korelační koeficient R |
0.9746085658 |
Koeficient determinace R^2 |
0.9498618565 |
Predikovaný korelační koeficient Rp |
0.9417364687 |
Střední kvdratická chyba predikce MEP |
0.1841106266 |
Akaikeho informační kritérium |
-137.5506086 |
Metoda porovnání všech podmodelů
Výběr vhodných členů lineárního regresního modelu je úloha pro techniku prohledávání všech možných podmnožin modelu Stepwise-All. Grafické a numerické metody umožní výběr nejlepších modelů
Kvantilová regrese
Proložení dat křivkou s daným rizikem (pravděpodobností) výskytu dat nad a pod křivkou.
Hladina 15%: Y=1.950+1.961*X-0.121*X^2
|
Hladina 50%: Y=1.074+2.106*X-0.136*X^2
|
Hladina 90%: Y=-0.382+2.079*X-0.126*X^2
|
|
Robustní metody
Robustní metody nejsou citlivé na "znečištěná" data obsahující mnoho chyb, či vybočujících hodnot.
Metoda nejmenších čtverců
|
Robustní metoda (M-odhad)
|
Bohatá diagnostika
Numerická i grafická diagnostika zajistí odhalení jakéhokoliv problému v datech nebo modelu, který by mohl vést k nesprávné interpretaci. Tím je zajištěna věrohodnost výsledků. Jednotlivá data lze identifikovat interaktivně myší. Označená podezřelá data lze promítnout do všech ostatních grafů nebo do tabulky.
|