Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné veličiny Např při hodu kostkou můžeme hovořit buď o padnutí šestky nebo můžeme říci, že náhodná veličina X, kterou je počet ok na kostce, se realizovala v hodnotě = 6 Žádnou preciznější definici náhodné veličiny nebudeme uvádět Pro diskrétní náhodnou veličinu je klíčová izolovanost jejích hodnot a počet možných realizací, který je buď konečný nebo nejvýše spočetně nekonečný Na věci nic nemění, že diskrétní náhodná veličina často nabývá celočíselných hodnot, mnohdy navíc pouze nezáporných (počet poruch za jednotku času, počet požadavků na obsluhu, počet měření zatížených hrubou chybou apod) alternativní rozdělení; binomické rozdělení; diskrétní veličina; distribuční funkce; hypergeometrické rozdělení; konečnostní násobitel; kovariance; nezávislost; parametry; Poissonovo rozdělení; pravděpodobnostní funkce; rozdělení pravděpodobnosti; rozptyl; směrodatná odchylka; sdružená distribuční funkce; sdružená pravděpodobnostní funkce; střední hodnota; úroveň; variabilita; variační koeficient; zákon rozdělení 1 Rozdělení pravděpodobnosti diskrétní náhodné veličiny Klíčovým pojmem pro diskrétní náhodnou veličinu je pravděpodobnostní funkce Tato funkce udává pravděpodobnost, že diskrétní náhodná veličina X se realizuje v hodnotě, P ( = P( X = Funkce může být vyjádřena tabulkou hodnot, vzorcem nebo graficky Příklad 1 Rozdělení pravděpodobnosti náhodné veličiny, která se může realizovat v hodnotách = 1, 0, 1, vyjádřené pravděpodobnostní funkcí je uvedeno v tabulce 1 Tab 1 Pravděpodobnostní funkce diskrétní náhodné veličiny -1 0 1 Součet P ( 0,400 0,333 0,67 1,000 Grafické znázornění pravděpodobnostní funkce úsečkovým (hůlkovým) grafem je na obrázku 1 Obr 1 Pravděpodobnostní funkce diskrétní náhodné veličiny P(
Pravděpodobnostní funkci lze vyjádřit vzorcem 5 pro = 1, 0, 1 P ( = 0 jinak Pravděpodobnostní funkce je nezáporná a normovaná, 0 P( 1, P( = 1 Další funkcí pomocí níž lze popsat rozdělení pravděpodobnosti náhodné veličiny je distribuční funkce Distribuční funkce je definována jako pravděpodobnost, že náhodná veličina X nepřesáhne hodnotu, F( = P( X Příklad 1 pokračování Rozdělení pravděpodobnosti popíšeme pomocí distribuční funkce, kterou vyjádříme tabulkou (tab ), graficky (obr ) a vzorcem Tab Distribuční funkce diskrétní náhodné veličiny -1 0 1 Součet F ( 0,400 0,733 1,000 Obr Distribuční funkce diskrétní náhodné veličiny F( Distribuční funkci lze rovněž vyjádřit vzorcem 0 pro < 1 [ ] 5 t F( = pro 1 1, t= 1 1 pro > 1 kde [ ] je celá část čísla Zápis distribuční funkce vzorcem je poměrně obtížný, takže autoři se mu zpravidla vyhýbají Srovnejte Srovnejte, jaké hodnoty nabývá pravděpodobnostní a distribuční funkce v příkladu 1 pro realizace náhodné veličiny = 5 ; 0, 5; 1, 5; 0 rozdělení relativních a kumulativních četností při bodovém třídění v Modulu 1 a rozdělení pravděpodobnosti diskrétní náhodné veličiny Zejména si všimněte pojmu četnostní funkce Rozdělení pravděpodobnosti diskrétní náhodné veličiny může být popsáno pomocí pravděpodobnostní nebo distribuční funkce, které mohou být vyjádřeny tabulkou, graficky nebo vzorcem 16
Charakteristiky diskrétní náhodné veličiny Klíčovými vlastnostmi každé náhodné veličiny je její úroveň a variabilita Charakteristikou úrovně náhodné veličiny je střední hodnota, která pro diskrétní náhodnou veličinu X je definována jako E ( = P( Charakteristikou variability náhodné veličiny je rozptyl, který je pro diskrétní náhodnou veličinu X D ( = E E( E( P( Alternativně lze rozptyl vyjádřit po definován jako [ ] = [ ] úpravě jako ( E ( = P( P( E Druhou odmocninou rozptylu je směrodatná odchylka D ( Bezrozměrnou charakteristikou variability je variační koeficient V ( = D( E( Srovnejte charakteristiky úrovně a variability datového souboru z Modulu 1 a právě uvedené charakteristiky diskrétní náhodné veličiny Zejména si všimněte způsobu výpočtu z relativních četností Pro diskrétní náhodnou veličinu z odstavce 1 vypočteme hodnoty charakteristik Příklad Charakteristiky diskrétní náhodné veličiny Střední hodnota E ( = 1 0,4 + 0 0,333 + 1 0,67 = 0, 133 Rozptyl (po úpravě vzorce) D ( = ( 1 0,4 + 0 0,333 + 1 0,67) ( 0,133) = 0, 6493 Směrodatná odchylka D ( = 0,6493 = 0, 8058 Hodnotu variačního koeficientu nebudeme v tomto případě určovat Úroveň a variabilitu náhodné veličiny měříme pomocí střední hodnoty a rozptylu, případně od něj odvozených charakteristik směrodatné odchylky a variačního koeficientu Vlastnosti střední hodnoty a rozptylu X, Y jsou náhodné veličiny, přičemž platí Y = kx + c, kde k, c jsou konstanty Mezi středními hodnotami a rozptyly platí E ( Y ) = ke( + c, D ( Y ) = k D (, W = X ± Y jsou náhodné veličiny, přičemž E ( W ) = E( ± E( Y ), D ( W ) = D ( + + D ( Y ) ± COV ( X, Y ) Jsou-li veličiny X, Y nezávislé, je kovariance COV ( X, Y ) = 0 Nezávislost diskrétních náhodných veličin V případě dvojice diskrétních náhodných veličin X, Y je jejich společné rozdělení popsáno pravděpodobnostní a distribuční funkcí, které jsou funkcemi dvou proměnných: P(,, F(, a nazývají se sdružené Platí-li P (, = P( P( a F (, = F( F(, jsou X, Y nezávislé náhodné veličiny Sdružená 5y y pravděpodobnostní funkce P(, =, kde X je náhodná veličina z 1 Jaký 0 tvar má funkce P (, pokud nezávislá veličina Y se realizuje v hodnotách 1, 4, 5? ( 1) 17
3 Některé zákony rozdělení diskrétních veličin Binomické rozdělení Diskrétní náhodná veličina X, jejíž realizace ( = 0, 1,,, n ) udává počet nastoupení jevu A v n nezávislých opakovaných pokusech, má binomické rozdělení Bi [ n;θ ], kde θ je pravděpodobnost jevu A v jednom pokusu Konstanty n, θ jsou parametry binomického rozdělení V hodnotách parametrů se binomicky rozdělené náhodné veličiny mohou vzájemně více či méně shodovat nebo lišit Pravděpodobnostní funkce binomického rozdělení je pro hodnoty = 0, 1,,, n dána Bernoulliovým vzorcem Ze známých parametrů n, θ lze určit střední hodnotu a rozptyl binomického rozdělení E ( = nθ, D ( = nθ (1 θ ) Použití binomického rozdělení je zřejmé z definice veličiny X Příklad 3 Vypočítáme střední hodnotu počtu správně vyřešených úkolů v testu odborné způsobilosti s 10 nezávislými úkoly, jestliže plný počet splněných úkolů mělo z 80 uchazečů pět Pro stanovení střední hodnoty potřebujeme znát n a θ, přičemž ze zadání vyplývá, že n = 10 Parametr θ určíme ze vztahu 10 10 0 5 θ (1 θ ) = = 0,065, z čehož θ = 0, 758 10 80 E ( = 10 0,758 = 7,6 (správných odpovědí) Mimochodem slabým místem úlohy je předpoklad, že všichni respondenti jsou stejně připraveni a všechny úkoly jsou stejně obtížné (konstantní pravděpodobnost úspěchu v jednom pokusu) Nejpravděpodobnější (typickou, modální) hodnotu binomického rozdělení najdeme s použitím vztahu E ( (1 θ ) ˆ E( + θ Jakou hodnotu má modus počtu správně vyřešených úkolů v příkladu 3? ( ) Alternativní rozdělení Zvláštním případem binomického rozdělení je rozdělení pro n = 1, Bi [ 1; θ ] Jde o rozdělení nulajedničkové náhodné veličiny a nazývá se rozdělení alternativní Po vzoru binomického rozdělení jsou jeho charakteristiky E ( = θ, D ( = θ (1 θ ) Alternativní rozdělení je nejjednodušším myslitelným případem rozdělení pravděpodobnosti náhodné veličiny λ e λ s pravděpodobnostní funkcí P( = pro! = 0, 1,, S rostoucím hodnota pravděpodobnostní funkce rychle klesá k nule, takže prakticky Poissonovo rozdělení Zvláštním případem binomického rozdělení pro n, θ 0, je-li při tom n θ = λ > 0, je rozdělení vzácných jevů Poissonovo rozdělení Po[ λ] stačí vzít v úvahu jen několik málo prvních hodnot Parametr λ má současně význam střední hodnoty i rozptylu, takže E ( = D ( = λ Poissonovo rozdělení má zvláštní význam a řídí se jím množství diskrétních náhodných veličin Poissonovo rozdělení má tzv Poissonovský proud jevů, kterým se modeluje např počet požadavků na obsluhu za jednotku času u mnoha obslužných zařízení (telefonní ústředny, čerpací stanice, servisní dílny, myčky vozidel apod) Je-li střední hodnota (tzv intenzita) Poissonovského proudu jevů rovna λ, má za časový interval délky t střední hodnotu t λ Součet n nezávislých náhodných veličin se stejným parametrem λ má střední hodnotu n λ 18
Příklad 4 Pobočka pojišťovny uzavírá pojistné smlouvy, přičemž očekávaná (tj střední) hodnota počtu uzavřených smluv pro běžný pracovní den je λ = 3 smlouvy Určíme pravděpodobnost, že v náhodně vybraném (a) běžném pracovním dni, (b) pětidenním pracovním týdnu, nebude uzavřena žádná smlouva 3 0 e 3 Řešení: (a) P (0) = = 0, 0498 (b) 0! P (0) = e 0! 0 = 3 10 7 S jakou pravděpodobností během běžného pracovního dne uzavřou tři pobočky pojišťovny (se stejným parametrem λ = 3 ) takový počet smluv, který právě odpovídá parametru lambda rozdělení počtu jimi společně uzavřených smluv? ( 3) Hypergeometrické rozdělení Diskrétní náhodná veličina X, jejíž realizace udává počet nastoupení jevu A v n závislých opakovaných pokusech, má tříparametrické hypergeometrické rozdělení H [ N; M ; n] Parametry opět souvisejí s charakteristikami úrovně a variability, neboť E ( = n a D ( = n(1 ) M M N n N N N 1 N n Výraz 1 N 1 < je konečnostní násobitel Hypergeometrické rozdělení proto má za jinak srovnatelných podmínek menší rozptyl, než rozdělení binomické, což vyplyne z příkladu 5 Příklad 5 Zadané veličiny jsou binomická veličina s n = 3, θ = 0, 5, hypergeometrická s N = 10, M = 5, n = 3, M (tj také = 0, 5 ) a veličina s Poissonovým rozdělením s parametrem λ = 3 0,5 = 1, 5 N Vypočteme střední hodnoty a rozptyly těchto tří diskrétních veličin Tab 3 Přehled charakteristik tří diskrétních veličin Rozdělení Binomické Hypergeometrické Poissonovo Realizace 0, 1,, 3 0, 1,, 3 0, 1,, Střední hodnota 1,5 1,5 1,5 Rozptyl 0,75 0,5833 1,5 Vidíme, že střední hodnoty se zcela shodují, nejmenší rozptyl 10 3 0,75 = 0, 5833 má hypergeometrické 10 1 rozdělení Nápadně vyšší hodnota rozptylu Poissonova rozdělení je způsobena podstatně širším oborem možných realizací náhodné veličiny ( P ( X > 3) je větší než 0,3) Zkontrolujte (přesným výpočtem) předešlé tvrzení o P ( X > 3) Σ 1 Diskrétní náhodná veličina se vyznačuje izolovaností hodnot, kterých je nejvýše spočetně nekonečný počet Často jde o nezáporné celočíselné hodnoty, není to však podmínkou Rozdělení pravděpodobnosti diskrétní náhodné veličiny může být popsáno pomocí pravděpodobnostní funkce, která pro každou hodnotu náhodné veličiny stanoví pravidlo, že se náhodná veličina realizuje 19
právě v této hodnotě 3 Rozdělení pravděpodobnosti diskrétní náhodné veličiny může být rovněž popsáno pomocí distribuční funkce, která pro každou hodnotu náhodné veličiny stanoví pravidlo, že se náhodná veličina realizuje nejvýše v této hodnotě 4 Klíčovými vlastnostmi náhodné veličiny je její úroveň a variabilita 5 Úroveň náhodné veličiny měří její střední hodnota 6 Variabilitu náhodné veličiny měří rozptyl a z něj odvozené charakteristiky směrodatná odchylka a variační koeficient 7 Náhodné veličiny mohou být ve dvojici závislé nebo nezávislé 8 Poznali jsme binomické, alternativní, Poissonovo a hypergeometrické rozdělení jako příklady rozdělení diskrétních náhodných veličin 9 Každé rozdělení má určitý počet parametrů, které jsou v určitých vztazích s jeho charakteristikami ( 1) 1 y P ( = pro = 1,4, 5 10 ( ) ˆ = 8 9 e 9 9! y ( 3) P (9) = = 0, 13 9 X je náhodná veličina z příkladu 18 Popište její rozdělení pravděpodobnosti pomocí pravděpodobnostní a distribuční funkce, které vyjádříte vzorcem, tabulkou a graficky Sestavte tabulku, ve které vyjádříte P ( X = 0) pro náhodnou veličinu s Poissonovým rozdělením pro parametry λ = 0,5;1;1,5; ; 3; 5 Hranice prakticky nemožného jevu je stanovena na 0,01 Lze pro některé zadané hodnoty λ tvrdit, že je prakticky nemožné, aby došlo k realizaci = 0? 3 Porovnejte graficky distribuční funkce binomického a hypergeometrického rozdělení z úlohy 5 4 Pro jakou hodnotu parametru θ má veličina Bi [ 1;θ ] největší rozptyl? 5 Jaká část vozidel odjíždí neobsloužena z ruční myčky za těchto podmínek: Proud požadavků má [ 3] Po hod -1 Kapacita myčky je vozidla hod -1 Pokud není myčka volná, vozidlo nečeká a odjíždí Jaká je střední hodnota počtu obsloužených vozidel za minutu (můžete pomocí ní stanovit využití kapacity link? 6 Podívejte se na předchozí příklad z pohledu řidiče a vypočtěte pravděpodobnost, že uspěje u myčky až na třetí pokus 7 Určete střední hodnotu, modus, rozptyl, směrodatnou odchylku a variační koeficient pro náhodnou veličinu z úlohy 1 tohoto cvičení 8 Kterou charakteristiku binomického rozdělení lze vyjádřit jako 1 θ nθ? 0
9 Určete střední hodnotu a rozptyl rozdílu nezávislých náhodných veličin X Y, pokud 10 Operace 5 P( = pro = 1;0; 1 E ( U ), D ( U ) a y P ( = pro = 1;4; 5 10 y X E( U =, kde X je náhodná veličina, se nazývá normování Určete D( 1