Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla (označme x) podléhá normálnímu rozdělení se střední hodnotou µ = 4lb/in 2 a standardní odchylku σ = 2lb/in 2, tj. x N(4, 2 2 ). Odběratel sáčků vyžaduje, aby sáčky měly sílu alespoň µ = 35lb/in 2. Jaká je pravděpodobnost, že sáček vyhoví požadavkům odběratele? Pravděpodobnost při normálním rozdělení je dána vztahem: P (x a) = F (a) = a σ 2π e 2 ( x µ σ )2 dx Tento integrál nelze vypočítat analyticky, nicméně můžeme provést substituci z = x µ σ, čímž dostaneme funkci, která není závislá na µ a σ 2 : P (x a) = P (z a µ σ ) = Φ(a µ σ ), kde Φ( ) je normální rozdělení N(, ). My chceme vyjádřit P (x 35) = P (x 35). 35 4 P (x 35) = P (z ) = P (z 2.5) = Φ( 2.5) = Φ(2.5) =.62. 2 Požadovaná pravděpodobnost je tedy P (x 35) = P (x 35) =.32 =.9938. Pozn: vyčíslení funkce Φ( ) bývá součástí statistických tabulek. Obrázek : Standardizace normálního rozdělení.
Charakteristiky spolehlivosti Předpokládejme, že poruchy nastávají náhodně v čase. Čas poruchy je ξ. Pravděpodobnost, že porucha, resp. čas poruchy, ξ (spojitá nezávislá veličina) nastane v čase t označme Q(t). Pravděpodobnost poruchy Q(t) definujeme jako distribuční funkci spojité nezávislé veličiny ξ (čas poruchy): Q(t) = F (t) = P (ξ t). Pravděpodobnost bezporuchového provozu R(t) je doplněk k pravděpodobnosti poruchy: R(t) = Q(t), což je pravděpodobnost, že porucha nenastane dříve než v čase t: R(t) = P (ξ > t). Hustota pravděpodobnosti f(t) je derivace distribuční funkce a tedy: f(t) = F (t) t = ( R(t)) t = R(t). t Další veličinou popisující spolehlivost je intenzita poruch λ(t), kterou definujeme jako podíl hustoty a pravděpodobnosti bezporuchového provozu: Střední doba bezporuchového provozu: Rozptyl náhodné doby poruchy: T s = λ(t) = f(t) R(t). D = E(ξ 2 ) E 2 (ξ) = tf(t)dt. t 2 f(t)dt T 2 s. Příklad 2 Nalezněte vztah pro výpočet pravděpodobnosti bezporuchového provozu z intenzity, tj. funkční předpis R(t) = fce(λ(t)). λ(t) = f(t) Q(t) R(t) R(t) = t R(t) = t R(t) R(t) λ(t) = R(t) Víme, že integrál z podílu derivace funkce a této funkce je logaritmus dané funkce. Tedy: T λ(t) dt = [ln R(t)] T = ln R(T ) ln R(). Pravděpodobnost bezporuchového provozu v čase nula je R() =, tedy ln R() = a proto druhý člen z levého výrazu vypadne. Nakonec po úpravě získáváme výsledný vztah: R(t) = e t λ(τ) dτ. 2
Příklad 3 Nalezněte vztah pro výpočet střední doby bezporuchového provozu T s z pravděpodobnosti bezporuchového provozu R(t). T s = tf(t) dt = t( R(t) ) dt = t( R(t)), dt = t = u = R(t) u = R(t) v = t v = = [R(t)t] + R(t) dt = R(t) dt První závorka [R(t)t] je rovná nule, protože pro t platí typicky R( ). 3
2 Exponenciální rozdělení Základní charakteristiky: λ(t) = λ λ >, t R(t) = e λ dt = e λt Q(t) = e λt f(t) = λe λt.8.6.4.2 density function f(t).8.6 m= m=.5 m=.5.4.2 2 3 4 5 t Obrázek 2: Distribuční funkce exponenciálního rozdělení pro dvě různé hodnoty λ. Příklad 4 Nalezněte vztah pro výpočet střední doby bezporuchového provozu T s. T s = tf(t) dt = tλe λt dt = u = λe λt u = e λt v = t v = ( λ ) t e λt + λ = λ. = lim t = [( λ t) e λt] = Příklad 5 Nalezněte vztah pro výpočet rozptylu náhodné doby poruchy D. D = t 2 λe λt dt Ts 2 = u = λe λt u = e λt v = t 2 v = 2t = [ t 2 e λt + 2 te λt dt ] T s 2 = = u = e λt u = λ eλt v = t v = = [ t 2 e λt 2t λ e λt + 2 λ e λt dt ] T s 2 = = lim ( t 2 2t)e λt + 2 ( ) 2 t λ 2 e λt = λ λ 2. Pozn.: Výměna neporušeného prvku s exponenciálním rozdělením poruch nepřinese zlepšení bezporuchovosti. Příklad 6 Předpokládejme nyní stroj, který se porouchá čtyřikrát za týden. Jaká je doba T β zaručující, že pravděpodobnost bezporuchového provozu je β = R(T β ) =.99? 4
V našem případě je intenzita poruch konstantní a rovna λ = 4týden = = 4 7 24 6 min. = 4 4 min. Nyní hledáme t takové, že R(T β ) = β. Po dosazení dostáváme a tedy R(t) = e T λ(t) dt = e λt β = β. λt β = ln β () T β = λ ln β = ln.99 = 25min. 4 4 Je dobré si uvědomit, že doba bezporuchového provozu T β je velmi citlivá na volbu β. To je způsobeno logaritmem ve vzorci (). Už při volbě β =.9 (tedy změně o.9) vzroste T β zhruba desetkrát na T β = 263 minut. Příklad 7 Předpokládejme součástku, jejíž spolehlivost má exponenciální rozdělení. Jaká je pravděpodobnost, že se součástka porouchá před očekávanou životností? Intenzita poruch je λ a očekávaná životnost (střední doba bezporuchového provozu) je λ. Chceme tedy vyčíslit: P (x λ ) = λ λe λt dt = e =.6322 Příklad 8 Výrobce kalkulaček nabízí jednoroční záruku. Pokud je kalkulačka v záruce vadná, je zákazníkovi vyměněna za novou. Spolehlivost kalkulačky je popsána následující hustotou pravděpodobnosti: f(x) =.25e.25x kde x je čas poruchy (roky). (a) Kolik procent kalkulaček se rozbije během záruční doby? (b) Výrobní cena kalkulačky je $5 a zisk z jedné kalkulačky je $25. Jaký je efekt výměny kalkulačky na čistý zisk? (c) Jaká musí být prodejní cena kalkulačky, abychom při výrobní ceně kalkulačky $5 měli čistý zisk (po započítání ztráty z výměny vadné kalkulačky) $25. (a) Hustota pravděpodobnosti má tvar f(t) = λe λt Dle hustoty pravděpodobnosti podléhá spolehlivost kalkulačky exponenciálnímu rozdělení s λ =.25. Pravděpodobnost poruchy v čase t = rok je tedy dána takto: F () = R(t) = e λt = e.25.8825 =.75, tj. rozbije se cca.75% kalkulaček. (b) Za každou rozbitou kalkulačku je nutno k nákladům přičíst $5, což jsou výrobní náklady na výměnu kalkulačky. To sníží profit z jedné kalkulačky o.75 5 = 5.875$. (c) Výsledná cena je součtem výrobní ceny, ceny za výměnu kalkulačky a požadovaného zisku: cena = 5 + 5.875 + 25 = $8.875 5
Příklad 9 Vypočtěte hodnotu mediánu pro exponenciální rozdělení s parametrem λ =.25. Pro medián t m platí: Po integraci Dosadíme meze: a vypočteme medián t m : Po dosazení: tm λe λt dt =.5 e λt tm =.5 e λtm + =.5 t m = ln.5 λ = ln 2 λ. t m = ln 2.25 = 5.54. Příklad Výrobce HDD uvádí hodnotu MTBF= 6 hodin. Kolik procent disků se porouchá v prvním roce? MTFB (Mean Time Between Failures) je střední doba mezi poruchami, tj. T s = MT BF, tedy λ = T s = 6 = 6. Pravděpodobnost poruchy v. roce je: Q(t) = R(t) = e λt = e 6 876 =.993 =.87. Pozn: počet hodin v roce je 24 365 = 876. U HDD se často jako parametr spolehlivosti uvádí AFR (Annualized Failure Rate), který je definován jako AFR = e 876/MT BF, kde MT BF je střední doba mezi poruchami v hodinách. AFR tedy není nic jiného než nám známá pravděpodobnost poruchy AFR = Q( rok). Příklad Máme naměřená data (časy poruch t i ). Odhadněte parametr λ pro exponenciální rozdělení metodou maximální věrohodnosti. Necht t,..., t n je n měření časů, ve kterých došlo k poruše prvku. Předpokládáme, že časy poruch jsou náhodné, nezávislé a pocházejí ze stejného rozdělení hustoty pravděpodobnosti. Tuto hustotu pravděpodobnosti chceme modelovat exponenciálním rozdělením s hustotou pravěpodobnosti Věrohodnostní funkce (obecně) je f(t) = λe λt. L(θ X, X 2,..., X n ) = f(t )f(t 2 )... f(t n ), 6
kde θ jsou parametry hustoty pravěpodobnosti a X i jsou měření. Exponenciálního rozdělení má jeden parametr (λ) a hodnoty X i = t i jsou naše časy poruch. L(λ t,..., t n ) = λe λt... λe λtn = λ n e λ n i= t i. Hledáme takové λ, které maximalizuje věrohodnostní funkci L, tj. ˆλ = arg min λ R L(λ t,..., t n ). Někdy je pro pro jednodušší výpočet možné hledat maximum logaritmu věrohodnostní funkce, tj. log L = log (f(t )f(t 2 )... f(t n )) = Pro případ exponenciálního rozdělení: n log(f(t i )). i= log L = log (λ n e λ ) n i= t i = n log λ λ Hledáme takové ˆλ, které maximalizuje log L n t i. i= log L λ = a odtud log L λ = n λ n n λ = ˆλ = n i= i= t i n n i= T i t i! = Střední hodnota exponenciálního rozdělení je T s = ˆλ, tedy n i= T s = t i, n což lze interpretovat jako střední hodnota naměřených časů poruch. Jednoduchý výpočet (odhad) parametru λ z naměřených dat je jedna z výhod exponenciálního rozdělení. Příklad 2 Pravděpodobnost bezporuchového provozu je dána R(t) = 2e λt e 2λt. Určete MTBF a hustotu pravděpodobnosti. Použijte metodu maximální věrohodnosti pro určení parametru λ. 7
MTBF = T s = = tf(t) dt = 2e λt dt f(t) = R(t) t R(t) dt = e 2λt dt = 2 λ 2λ = 3 2λ. = 2λe λt 2λe 2λt ( 2e λt e 2λt) dt =.25.2.5 f(t)..5 5 5 2 time.8.6 r(t), λ=.2 r(t), λ=.5 R(t).4.2 5 5 2 time 8