ROBUST 000, 7 4 c JČMF 00 BAYESŮV PRINCIP ZDENĚK PŮLPÁN Abstrakt. Poukážeme na možnost rozhodování pomocí Bayesova prncpu. Ten vychází z odhadu podmíněné pravděpodobnosta z předpokladu dsjunktního rozkladu základní množny (nebo z předpokladu dsjunktnost vzhledem k zavedené pravděpodobnost). Navrhneme jedno jeho rozšíření pro fuzzy množny. Rezme: V to$ stat~e zuqaet s prmenene metoda Baesa faz mnozestv.. Klascký Bayesův prncp Mějme dánu základní množnu Ω, jevové pole A Ω na Ω a pravděpodobnost P na A Ω. Pak podmíněnou pravděpodobnost p(a/b) zapodmínkyb A Ω, ndukovanou pravděpodobností P, defnujeme pro každé A A Ω vztahem () P (A B) p(a/b) =, P (B) když P (B) > 0 =0, když P (B) =0. Otom, žea p(a/b) je pravděpodobnost, se můžeme snadno přesvědčt: p(b/b) =; p(a/b) 0; p( A /B) = p(a /B), kde A jsou navzájem dsjunktní prvkyz A Ω, I a I je nejvýše spočetná množna. Budeme používat rozkladu prostoru Ω. Rozklad prostoru Ω je takový, nejvýše spočetný systém neprázdných množn B A Ω, I, kdei je nejvýše spočetná ndexová množna a platí a) B B j =pro j (vzájemná dsjunktnost) b) I B = Ω (pokrytí množny Ω). Mějme nyní jstý rozklad S = {B } I množnyω, kde B A Ω, I, a lbovolné A A Ω. Pak platí vzhledem k () a vlastnostem P na A Ω P (A) =P (A Ω) = P (A ( B )) = P ( (A B )) = () = P (A B )= P (B ) p(a/b ) I I a také pak () p(b /A)= P (B A) P (A) = P (B ) p(a/b ) P (B, když P (A) > 0 ) p(a/b ) =0, když P (A) =0. Vztah () se nazývá vztahem pro úplnou pravděpodobnost a vztah () je Bayesův. 000 Mathematcs Subject Classfcaton. 6C0. Klíčová slova. Bayesův prncp, fuzzy množny.
8 Zdeněk Půlpán Příklad : Uvažujme X jako konečnou množnu určtých symptomů. Označme znakem Ω = X množnu všech podmnožn množny X a vytvořme rozklad množny Ω například tak, že některé prvkyrozkladu budou reprezentovat přítomnost resp. nepřítomnost základních symptomů jen jedné určté choroby; mez jstým chorobam a třídam rozkladu B tak bude vzájemně jednoznačný vztah. Jsou-l odhadnutelné pravděpodobnost jednotlvých uvažovaných dagnóz P (B ) a podmíněné pravděpodobnost p(a/b ) souboru pozorovaných symptomů A př každé z uvažovaných dagnóz B, I, můžeme stanovt podle () pro každé I podmíněnou pravděpodobnost p(b /A). Rozhodování zvažujeme vzhledem ke vzájemným hodnotám p(b /A), I. Konkrétněj, nechť X = {x,x,,x k } je konečná množna základních symptomů (např. x zvýšená teplota, x bolest břcha,..., xk artróza kyčelního kloubu ) a přřadíme vzájemně jednoznačně každému prvku ω Ω= X k-rozměrný vektor v (ω) =(a,a,,a k )tak,žea =resp.0,kdyžjex ω resp. x ω. Je-l systém symptomů vzhledem k chorobám n,n,,n l, l< k, dobře vytvořen, je možné stanovt takový rozklad S na Ω (resp. na množně všech k-členných 0- posloupností), že některé jeho třídyrozkladu mohou být ztotožněnys chorobam n,n,,n l.nechťs = {B } q =,kdeq je počet prvků rozkladu S; B jsou tvořeny jstým k-prvkovým posloupnostm v (ω), které jsou dagnózam. Bodové odhady pravděpodobností P (B ) dostaneme součtem relatvních četností dagnóz obsažených v B. Podobně dostaneme bodové odhadypodmíněných pravděpodobností p(a/b ) jako součtyrelatvních četností dagnóz z A v množně dagnóz patřících k B. Máme zde však několk problémů. Jeden spočívá v tom, že bodové odhadypravděpodobností jsou spolehlvé jen když pocházejí z dostatečně rozsáhlého náhodného výběru. Vzhledem k tomu, že např. v lékařských rozhodováních potřebujeme velké množství dílčích dagnóz, je potřebné odhadyprovádět z relatvně velm rozsáhlého výběru. Druhý problém spočívá v hodnocení dílčích dagnóz, které pro seróznější celkovou dagnózu musí vycházet z přesnější charakterzace stavu než např., že pacent má nebo nemá bolest břcha. Nahradíme-l například položku x číselnou hodnotou tělesné teploty, např. s přesností ±0, o C, máme zde místo odhadu dvou možných stavů kolem 50 nových možností tělesných teplot. To znamená, že jž např. př podobných dagnózách máme zjšťovat odhadypravděpodobností pro 5 000 možných stavů! A to zřejmě není možné. Poznámka: Podmínku rozkladu množnyω pro platnost Bayesova vztahu () lze oslabt podmínkou P -rozkladu takto: Systém T = {B } I množn B A Ω je systémem P -dsjunktních množn, když a) P (B B j )=0pro j, b) P ( B )=, (4) c) P (B ) > 0, I. Platnost () za podmínek (4) vyplývá z toho, že ze (4) plyne pro P (A) vztah (5): (4) P (A) =P (A B )= v I P (A B ). Vděl jsme, že užtí Bayesova rozhodování př větším počtu odhadovaných položek předpokládá rozsáhlá výběrová šetření. Přtom s uvědomujeme, že některé dagnostkované položkymají podobu vágních dat. Zkusme proto nahradt rozsáhlé měření expertním odhadyfunkcí náležtostí fuzzymnožn à a B, I.
Baeysův prncp 9. Fuzzy Bayesův prncp Předpokládejme, že máme opět základní prostor Ω, jevové pole A Ω apravděpodobnost P na A Ω. Postupujme analogckys klasckým případem. Fuzzyjevem vzhledem k A Ω je každá fuzzy(pod)množna à množnyω, pro jejíž funkc příslušnost µ A platí (5) µ A (I) A Ω pro každý nterval I 0;. Pravděpodobnost fuzzyjevu à s funkcí příslušnost µ A defnujeme vztahem (6) P(Ã) = µ A dp = E(µ A ). Ω Podmíněná pravděpodobnost q pro fuzzyjev à za podmínkyfuzzyjevu B je defnována podobně jako v klasckém případě ([4]) (7) q(ã/ B) P(à B) = P( B), když P( B) > 0 =0, když P( B) =0. Mějme nyní dánu nejvýše spočetnou posloupnost { B } I fuzzyjevů množnyω. Platnost fuzzybayesova prncpu je pak podmíněna splněním ekvvalentních vztahů (9) a (0) pro jakýkolv fuzzyjev à množnyω: (8) P(Ã) = I P(à B ) (9) q( B /Ã) = P( B ) q(ã/ B ) j P( B ) q(ã/ B ), I. Hledejme proto podmínku pro fuzzymnožny B, I, k platnost (9) pro každou fuzzymnožnu à množnyω. Systém fuzzymnožn { B } I, který splňuje (9) pro každou fuzzymnožnu à nazveme systémem fuzzy dsjunktních množn. Rozebereme s problém fuzzydsjunktnost nejprve na příkladech. Příklad : Mějme Ω = 0; 0 a na ní rozložení pravděpodobností dané hustotou f(x) f(x) = 5 x; 0 x 5 = 5 x + 5 ; 5 <x 0. Systém fuzzy množn { B } =,, bude nejprve systémem ostrých množn (zapsaných ovšem jako fuzzymnožny) s funkcem příslušnost: µ B (x) =prox 0; =0prox/ 0;, µ B (x) =prox (; 6 =0prox/ (; 6, µ B (x) =prox (6; 0 =0prox/ (6; 0. Pak je P( B )= Ω µ B (x)f(x)dx =0, 8, P( B )=0, 50, P( B )=0, ; je jasné, že zde musí být = P (B )=.
40 Zdeněk Půlpán Pro fuzzymnožnu Ã: µ A (x) = x ; x 4 = x + 7 ;4 x 7 = 0 jnde, výpočtem dostaneme P(Ã) = Ω µ A(x) f(x)dx =0, 444. Uvažujeme-l průnk dvou fuzzymnožn buď ve smyslu Zadehovynebo Lukasewczovy(nebo jné) defnce dostaneme v našem případě volbysystému { B } =,, stejné hodnoty P ( B Ã) = 0, 06, P ( B Ã) = 0, 57, P ( B Ã) = 0, 04. Zde skutečně platí (9). Náš systém fuzzy množn { B } =,,, který je systémem dsjunktních množn ve smyslu dsjunktnost ostrých množn je systémem fuzzy dsjunktních množn (ve smyslu zmíněných defnc průnku fuzzy množn) a platí zde fuzzybayesův prncp. Zavedeme s nyní jný systém fuzzy množn { B } =,, defnovaných takto: (x) = x +; 0 x = 0; jnde (x) = 4 x ; 6 x 0 = 0; jnde (x) = 5 x 5 ; x 6 = x +7; 6 x 7 = 0; jnde. Můžeme s představt, že daný systém fuzzy množn reprezentuje jstou neostrou klasfkac na Ω. Dané fuzzymnožnynejsou dsjunktní ve smyslu Zadehovy(zde je µ A B (x) =mn(µ A (x),µ B (x))) an Lukasewczovydefnce (zde je µ A B (x) = max(µ A (x)+µ B (x) ; 0) průnku dvou fuzzymnožn. Pro tento systém fuzzy množn { B } =,, máme P( B )=0, 06; P( B )=0, 07; P( B )=0, 04. Vdíme tedy, že = P( B ). Pro průnkyfuzzymnožn, určovaných ze Zadehovydefnce mnma máme P(Ã B )=0, 07; P(Ã B )=0, 00; P(Ã B )=0, 47. Platí tedy = P(Ã B )=0, 84 0, 444 = P(Ã). Provedeme-l výpočet průnku fuzzymnožnyã s fuzzymnožnam B, =,,, pomocí Lukasewczovyspojky, dostaneme za předpokladu stejné základní pravděpodobnostní mírydané hodnotou f(x): P(Ã B )=0; P(Ã B )=0, 98; P(Ã B )=0. Zde je = P(Ã B )=0, 98 P(Ã). V obou uvedených případech tedyfuzzybayesův prncp (9) neplatí. Vdíme, že jsou sce případy, kdy (9) platí, ale v stuac, která je pro prax důležtá, tento prncp neplatí.
Baeysův prncp 4 Pokusme se nyní zeslabt podmínku (9) tak, abyfuzzybayesův prncp zahrnoval všechnyklascké případy() dsjunktních nonfuzzymnožn systému { B } I,který pokrývá Ω. Pro fuzzy- Bayesovské rozhodování je důležté vhodně odhadnout q( B /Ã), kde B, I, jsou různé fuzzymnožny, jejchž sjednocení nosčů je Ω; jak jsme přpomněl, ačkolv v klasckém (nonfuzzy) případě tvoří B, I, rozklad Ω, zde, vzhledem k obecnějšímu užtí, se nesnažíme předpokládat pro fuzzymnožny B, I, jejch vzájemnou fuzzydsjunktnost vzhledem k některé defnc průnku ([5]). Mějme dáno jevové pole A Ω a pravděpodobnost P na A Ω. Dále mějme dán systém fuzzymnožn { B } I, jejchž nosče pokrývají Ω a nechť B, I, jsou fuzzyjevy. Pro každou fuzzymnožnu B, I určeme novou fuzzymnožnu B 0 takto (0) µ B 0 (x) =nf j,j I max(µ B (x) µ Bj (x); 0); x Ω; I. Je jasné, že B 0 je pak také fuzzyjev vzhledem k A Ω. Nyní defnujme podmíněnou pravděpodobnost q( B /Ã) fuzzyjevu B za podmínkylbovolného fuzzyjevu à (vzhledem k A Ω) nově vztahem (): () q ( B /Ã) = P( B 0 Ã) P(Ã) ; I. Jsou-l fuzzymnožny B, I nterpretovatelné jako dsjunktní normální množnyz A Ω, pokrývající Ω, je B 0 = B, I, a platí () (). Průnk fuzzymnožn ve výrazu pro pravděpodobnost v čtatel výrazu () můžeme konstruovat podle různých defnc; použtí závsí na problému, který se zkoumá anazkušenostužvatele. Příklad : Počítejme pro data z příkladu hodnoty q (B 0/Ã) aq (B 0 /Ã) pro =,, podle () a užívejme Zadehovynterpretace fuzzyprůnku. Nejprve určíme příslušné fuzzymnožny: Platí B0 = B, =,,. Dále jsme vypočetl B 0: 0 (x) = (x) pro x 0; ) 8 5 x + 6 5 pro x ; 9 4 0 jnde; B 0 : B 0 : 0 (x) = 0 (x) = =0 prox 4 5 5 4 x 7 pro 4 5 <x 7 (x) pro 7 <x 0 8 5 x 6 5 pro 9 4 <x (x) pro <x 6 5 4 x + 7 pro 6 <x 4 5 0 jnde.
4 Zdeněk Půlpán Pak je v prvním případě podle () q ( B /Ã) = P(Ã) mn(0 (x),µ 0, 06 A(x)) f(x)dx = =0, 4 Ω 0, 444 q ( B /Ã) =0, 90; q (B/Ã) =0, 0. Ve druhém případě je podle () q ( B /Ã) =0, 0; q ( B /Ã) =0, 00; q ( B /Ã) =0, 68. Je jasné, že vzhledem k defnc fuzzymnožn B 0 a k () nemůžeme očekávat obecnou platnost vztahu I q ( B /Ã) =, analogckého ke vztahu pro non fuzzy podmíněné pravděpodobnost v žádné z nterpretací fuzzyprůnku. Hodnoty q (B /Ã), I, můžeme chápat jako mírysprávnost rozhodnutí pro alternatvu B za podmínky à a uvažovat o vektoru Q A (když card(i) =n) () Q A =(q ( B /Ã), q (B /Ã),,q (B n /Ã)). Tento vektor je možné normovat tak, abykaždé q (B /Ã) přešlovq ( B /Ã) 0 tak, aby () q( B /Ã) =. I Normované hodnoty q( B /Ã) pak mohou být nterpretoványjako váhyjednotlvých rozhodnutí B za předpokladu znalost à (např. předchozího rozhodnutí Ã). Nabízí se však ještě druhá možnost určení q( B /Ã), a to vztahem (5) (4) q ( B /Ã) = P( B 0 Ã) j I P( B I. j 0 Ã); Zde bereme v úvahu, že jmenovatel ve (4) nemusí nabývat hodnoty P(Ã) a příslušné q ( B /Ã) je pak mírou zastoupení hodnoty P ( B 0 Ã) vsoučtu j I P( B j 0 Ã). Pro q z (5) však ale přímo platí q ( B j /Ã) =. j I Příklad 4: ProdatazpředcházejícíchpříkladůaaopětproZadehovunterpretac průnku fuzzymnožn máme q ( B /Ã) =0, 0. = q ( B /Ã) q ( B /Ã) =0, 00. = q ( B /Ã) q ( B /Ã) =0, 97. = q ( B /Ã). V našem případě jsou oba výsledkytéměř dentcké.
Baeysův prncp 4. Závěr Byly naznačeny problémy, které vznkají ve snaze zavést Bayesův prncp pro fuzzy jevyanalogckys tímto prncpem v klascké teor pravděpodobnost. Je uvedeno jedno z možných řešení tohoto problému úpravou fuzzymnožn B, I, tvořících pak fuzzypokrytí základní množnyω. Je také možné využít tohoto prncpu v rozhodování, zobraztelném stromovým grafem. Lteratura Hntkka J., Suppes P.: Informaton and Inference, D. Redel Publ., Dordrecht, 970. Zmmermann H.-J.: FuzzySet Theoryand ts Applcaton, Kluwer Academc Publshers, Boston, 996. Cox E.: The FuzzySystems, Handbook, nd ed., AP Professonal, Academc Press, New York, 999. 4 Mesar R. a Paseck K.: Fuzzydsjunktnosť ndukovaná Bayesovým prncípom, Teóra a aplkáce fuzzymnožín IV - VII, JSMF, VVTŠ Lptovský Mkuláš, Praha, 989 5 Půlpán Z.: K problematce vágnost v humantních vědách, Academa, Praha, 997 Concluson We have descrbed the posbltes of decson makng wth the help of the fuzzy -Bayesformula. Konkludo En to artkolo n evolugs la fuzzy- Bayes formula. N uzas ton formulon en la decda procedo egz. en la medcno. Unverzta Hradec Králové,katedra matematky PdF,Víta Nejedlého 57,500 8 Hradec Králové E-mal: zdenek.pulpan@uhk.cz