Měřeí závslostí. Průběh závslost spojtá křvka s jedoduchou rovcí ( jedoduchým průběhem), s malým počtem parametrů, která v rozmezí aměřeých hodot vsthuje průběh závslost, určeí kokrétího tpu křvk (přímka, parabola, hperbola, ) eí součástí úloh, deálí je, pokud užvatel je schope odvodt tp křvk apř. z fzkálě mechackých zákotostí sledovaého procesu ebo j má ověřeou z jých obdobých aalýz, parametr b měl být terpretovatelé, ezámé parametr křvk se odhadují metodou ejmeších čtverců, která má řadu modfkací, ejedodušší je verze pro fukce leárí v parametrech (prví parcálí dervace podle všech parametrů jsou leárí fukce), pro které vžd exstuje aaltcké řešeí, pokud fukce eí leárí v parametrech, může pro exstovat learzující trasformace, což však souvsí s moha potížem, pokud fukce eí leárí v parametrech a eexstuje pro learzující trasformace, jedá se o eleárí závslost (elze řešt aaltck, pouze umerck, kd se výchozí hodot parametrů zpřesňují teratvím algortmem), zvláští problém představují vázaé parametr apř. požadujeme, ab fukce procházela počátkem ebo jým určeým bodem, přímka měla požadovaou směrc apod. Toto je skutečě velký problém a hrac korektí statstk.. Itezta závslost bezrozměrá a určtém tervalu (apř. 0;, ; + ) ormovaá charakterstka, ta je založea a porováí součtu čtverců odchlek vrovaých a aměřeých hodot závsle proměé od jejch průměru, kde platí rovce rozkladu součtu čtverců
+ ) ( ) ( ) ( kde, jsou aměřeé a vpočteé hodot závsle proměé a dále platí 0 ) (,, dex determace je podíl (zpravdla ásobeý stem a udávaý v %) 00% 00) ( ) ( ) ( 0 dex korelace je druhá odmoca dexu determace (vjádřeého jako deseté číslo) ) ( ) ( 0 koefcet determace a korelačí koefcet jsou zvláštím případ dexu determace a dexu korelace, pokud průběh závslost měří přímka; korelačí koefcet lze alteratvě spočítat jako x x var var cov kde cov x je kovarace a var x, var jsou rozptl ezávsle a závsle proměé. rovce rozkladu součtu čtverců eplatí (a tudíž elze staovt smsluplý dex korelace) u fukce jejíž rovce bla vpočtea pomocí learzující trasformace a posléze verzí
trasformací vrácea do původího tvaru, apř. x b b 0 log logb0 + logb x pro přímku vzklou logartmováím expoecálí fukce rovce platí log log, po verzí trasformac už eplatí, u fukce s vázaým parametr platí protože ( ) 0,, u eleárí regrese, kde rovce platí je po určté úpravě. Dvě varat úloh o závslost (modelové případ, žvot je složtější). Je dáa jedosměrá příčá závslost (ezávsle proměá je příča a závsle proměá je úček), ezávsle proměá je řízeá, její hodot staovuje (více ebo méě vhodě) expermetátor; závsle proměá je pozorovaá (áhodá) velča Příklad katastrofálě evhodě zvoleé ezávsle proměé (s epatrou varabltou).
Závslost kazvost ovoce a době skladováí Vstžeá přímkou o rovc 0,9453 +, 55x s dexem determace 74,9 % (dex korelace je 0,866). Současě jde o koefcet determace a korelačí koefcet (přímka). Rozšířeím tervalů stupc a obou osách zjšťujeme, že emáme žádý důvod tvrdt, že přímka vsthuje leárí růst kazvost po celou dobu skladováí (0 až měsíců).
Kvadratcká fukce vsthuje závslost o ěco lépe, dex korelace je rove 0,905. Zopakujeme-l totéž co u přímk, vdíme že mmo terval měřeých hodot má fukce krajě edůvěrhodý průběh předpokládá ejprve pokles(?!) a pak strmý růst kazvost. Daleko šíleější věc vdíme, pokud používáme polom všších stupňů terpolace se zlepšuje s rostoucím stupěm
polomu, ovšem extrémí růst a pád mmo terval měřeých hodot, velký počet parametrů, žádá terpretace Přímk s vázaým parametr Červeá je původí přímka o oběma odhadovaým parametr. Modrá přímka je vedea tak, ab procházela počátkem (žádé skladováí, žádá kazvost). Zeleá přímka je vedea tak, ab procházela bodem o souřadcích [ ;0] (předpokládáme, že prví dva měsíce skladováí edochází k žádé změě v kazvost). U obou posledích přímek elze smsluplě určt teztu závslost (dex korelace může vjít záporě ebo větší ež jeda), součet odchlek vpočteých a aměřeých hodot závsle proměé eí ulový a rověž oba průměr se lší.
Výskt vbočující hodot (vlvého bodu) Ve statstce je epřípusté, ab jedá hodota výrazě změla výsledek úloh. Pokud takové měřeí v úloze exstuje, ozačuje se jako vlvý bod. Červeá přímka je vpočtea z původích dat. Modrá přímka vkazuje hodot parametrů a tudíž průběh slě ovlvěý vbočující hodotou. Dále (př splěí rovce rozkladu součtu čtverců) vkazuje podstatě žší teztu závslost. Závěr dohledat příč (apř. porušeí ochraé atmosfér, porucha klmatzace) a vlvý bod z dat vřadt..neí zřejmé, která proměá představuje příču a která úček. Obě jsou pozorovaé proměé (áhodé velč). Data tvoří tzv. elpsu rozptlu. Průběh závslost měří svazek dvou sdružeých regresích přímek, teztu závslost můžeme měřt buď dexem ebo koefcetem korelace (mají stejou absolutí hodotu, koefcet zamékem formuje o směru závslost).
Výška dezéu a pravém a levém kole jedé áprav př růzém počtu ujetých klometrů Obě přímk vkazují stejou teztu závslost.
Obě přímk (pokud je potřebujeme) zázorňujeme zpravdla do společého grafu Přímk se protíají v bodě, který má souřadce průměrů obou proměých. Úhel, který svírají, je tím meší, čím je závslost tezvější. Heterogeta v datech
Běžě se vsktující závada v datech, kd dojde ke spojeí souborů, které b měl být aalzová samostatě. To že data leží praktck a společé přímce (vz obrázek se třem dílčím soubor) vede k efektu zesíleí tezt závslost. Pokud ovšem aalzujeme každý soubor měřeí zvlášť, zjstíme (e utě!), že skutečost je poěkud já. Svědčí o tom teto a ásledující dva obrázk.
Někd to ovšem dopade podstatě hůře.
Doposud jsme k měřeí závslostí přstupoval popsým způsobem, tj. aalzoval jsme je kokrétí soubor měřeí bez šrších souvslostí. Iduktví úvah o závslost Naměřeé hodot (se svým chbam) jsou jedečým, eopakovatelým vzorkem realt a tak, jako je edokážeme bezezbtku reprodukovat, edokážeme přesě zopakovat a z ch vpočteé charakterstk závslost. Proto jsou z výběrového souboru vpočteé charakterstk (u regresí přímk apř. směrce) áhodým velčam s ějakou středí hodotou a směrodatou odchlkou, která se u výběrových charakterstk azývá směrodatá chba. Vedle tohoto pojmu operujeme ještě s pojmem přípustá chba, která udává kolka ásobek směrodaté chb považujeme ještě za přjatelý (svědčící o statstcké shodě) a aopak kolka ásobek jž vpovídá o statstcké eshodě vpočteých parametrů. Velkost přípusté chb u charakterstk závslost závsí a rozsahu souboru (počtu měřeí) čím je větší, tím je směrodatá chba meší,
a teztě závslost čím je závslost tezvější, tím je přípustá chba meší, a pravděpodobost (spolehlvost, hladě výzamost) duktví úvah čím je požadovaá pravděpodobost blžší jedé, tím je přípustá chba větší. Z úloh statstcké dukce je třeba jmeovat Bodový odhad, který slouží k určeí výběrové charakterstk v podobě jedého čísla. Jako příklad výběrových charakterstk můžeme jmeovat apř. absolutí čle ebo směrc přímk, regresí přímku jako celek ( to je výběrová charakterstka!), korelačí koefcet, ale také apř. rozdíl dvou směrc, rozdíl dvou ebo více korelačích koefcetů apod. (ted jedoduché fukce dvou ebo více charakterstk) Itervalový odhad, kd pro výběrové charakterstk sestrojujeme tzv. kofdečí terval (též terval spolehlvost), které s můžeme představt jako úsečk č polopřímk (podle potřeb volíme oboustraé č jedostraé terval), a kterých s vsokou předem zvoleou pravděpodobostí blízkou jedé výběrová charakterstka leží. Rzko tervalového odhadu pak udává pravděpodobost, s jakou výběrová charakterstka v kofdečím tervalu eleží. Poloha hrac kofdečích tervalů je odvozea od přípusté chb. Testováí hpotéz o charakterstkách závslost. Předem vsloveý předpoklad o ějaké charakterstce (rozdílu dvou charakterstk apod.) závslost se ověřuje a základě vpočteých hodot výběrových charakterstk jejch srováím s předpokládaou hodotou (ebo hodotou pocházející z jého aalogckého výběru). Výsledkem je vpočteá hodota tzv. testového krtéra, která vpovídá o udržtelost/eudržtelost původího předpokladu. Pomocí testováí hpotéz elze dokázat, že předpoklad je
jedozačě (s jstotou) pravdvý/epravdvý. Naopak, exstují dvě možost chbých rozhodutí pravdvý předpoklad se jeví jako eudržtelý (zamítutí pravdvé hpotéz, chba prvího druhu), epravdvý předpoklad je jeví jako udržtelý (ezamítutí epravdvé hpotéz, chba druhého druhu). Příklad: Jedou z možostí je sestrojt kofdečí terval pro regresí přímku. Te je smetrcký kolem vpočteé přímk, ejužší v oblast průměrů ezávsle a závsle proměé a postupě se a obě stra rozšřuje. Koferečí terval přímk je tím šrší, z čím mešího počtu hodot bla přímka vpočtea, čím slabší je závslost obou velč a čím větší spolehlvost (meší rzko) odhadu je požadováa. Kofdečí terval lze vužít pro ověřeí předpokladu o shodě průběhu dvou vpočteých výběrových regresích přímek. Kofdečí terval obou přímek se překrývají, předpoklad o shodě je udržtelý.
Obě závslost lze vjádřt společou regresí přímkou. Úlohu jsme zopakoval se stejým přímkam, vpočteým ze čtřásobého počtu měřeí. Kofdečí terval se tetokrát epřekrývají, průběh obou přímek se s vsokou pravděpodobostí lší. Obě závslost elze vjádřt společou přímkou.
Příklad eleárí regrese Tzv. záběrová křvka traktoru, která může být uvedea apř. ve tvaru (Grečeko, 994) b µ ( 0 + b )( bδ + 3 ( bδ ) 8) + δ + kde µ je bezrozměrý součtel záběru, δ je rověž bezrozměrý prokluz a b 0, b, b jsou parametr. Ze 8 měřeí bl po vrováí získá polom 6. stupě 5 µ 0,4 + 0,506δ 0,009δ + 4,5.0 δ 6,4.0 δ + 4,8.0 δ,4.0 δ 3 7 4 9 5 6 s RSS 0, 03, který z moha důvodů evhovuje. Grečekovou metodou bl získá výchozí odhad parametrů a záběrová křvka je pak ve tvaru 0,07505 µ ( + 0,83)(3,945 δ + 3 (3,945 δ ) + δ s rezduálím součtem čtverců odchlek RSS 0, 0366. Marquartovým algortmem eleárí regrese bl výchozí hodot parametrů zlepše a záběrová křvka je ve tvaru, 0008 µ ( 0 + 0, 580)( 7, 4685δ + 3 ( 7, 4685 ) 8) + δ δ + s rezduálím součtem čtverců odchlek RSS 0, 048. Testováím parametrů bla zjštěa statstcká evýzamost parametru b 0. Výsledý tvar křvk je pak + µ 0,587(7,4770 δ + 3 (7,4770δ ) 8) s rezduálím součtem čtverců odchlek 0, 048 + 8) RSS.
Polom 6. stupě 5 µ 0,4 + 0,506δ 0,009δ + 4,5.0 δ 6,4.0 δ + 4,8.0 δ,4.0 δ 3 7 4 9 5 6 Záběrová křvka µ 0,587(7,4770 δ + 3 (7,4770δ ) + 8)