Příklady aplikací bayesovských sítí Jiří Vomlel ÚTIA, Akademie věd ČR http://www.utia.cas.cz/vomlel 6. prosince 2011 J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 1 / 3
Jednoduchý příklad z medicíny X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 Pobyt v Asii Kuřák Tuberkulóza Rakovina plic Zánět průdušek Tuberkulóza nebo rakovina Positivní rentgenový nález Dušnost X 1 X 3 X 7 X 6 X 4 X 2 X 8 X 5 J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 2 / 3
Jednoduchý příklad z medicíny X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 Pobyt v Asii Kuřák Tuberkulóza Rakovina plic Zánět průdušek Tuberkulóza nebo rakovina Positivní rentgenový nález Dušnost X 1 X 3 X 7 X 6 X 4 X 2 X 8 X 5 Sdružená pravděpodobnostní distribuce definovaná bayesovskou sítí: 8 P(X 1, X 2,..., X 8 ) = P(X i { X j }j Pa(i) ) i=1 J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 2 / 3
Jednoduchý příklad z medicíny X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 Pobyt v Asii Kuřák Tuberkulóza Rakovina plic Zánět průdušek Tuberkulóza nebo rakovina Positivní rentgenový nález Dušnost X 1 X 3 X 7 X 6 X 4 X 2 X 8 X 5 Sdružená pravděpodobnostní distribuce definovaná bayesovskou sítí: 8 P(X 1, X 2,..., X 8 ) = P(X i { X j }j Pa(i) ) i=1 = P(X 8 X 6, X 5 ) P(X 7 X 6 ) P(X 6 X 3, X 4 ) P(X 5 X 2 ) P(X 4 X 2 ) P(X 3 X 1 ) P(X 2 ) P(X 1 ) J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 2 / 3
Podmíněná pravděpodobnost Jaká je pravděpodobnost, že pacient má tuberkulózu když víme, že je kuřák a trpí dušností? J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 3 / 3
Podmíněná pravděpodobnost Jaká je pravděpodobnost, že pacient má tuberkulózu když víme, že je kuřák a trpí dušností? X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 P(X 3, X 2 = 1, X 8 = 1) = P(X 2 = 1, X 3, X 8 = 1) P(X 2 = 1, X 8 = 1) J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 3 / 3
Podmíněná pravděpodobnost Jaká je pravděpodobnost, že pacient má tuberkulózu když víme, že je kuřák a trpí dušností? X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 P(X 3, X 2 = 1, X 8 = 1) = P(X 2 = 1, X 3, X 8 = 1) X 3 P(X 2 = 1, X 3, X 8 = 1) J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 3 / 3
Podmíněná pravděpodobnost Jaká je pravděpodobnost, že pacient má tuberkulózu když víme, že je kuřák a trpí dušností? X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 P(X 3, X 2 = 1, X 8 = 1) = P(X 2 = 1, X 3, X 8 = 1) = P(X 2 = 1, X 3, X 8 = 1) X 3 P(X 2 = 1, X 3, X 8 = 1) X 1,X 4,X 5,X 6,X 7 P(X 1, X 2 = 1, X 3,..., X 7, X 8 = 1) J. Vomlel (ÚTIA AV ČR) Aplikace bayesovských sítí 6. prosince 2011 3 / 3
Aplikace 1: modelování dědičných nemocí
Aplikace 2: podpora rozhodování Cíl: maximalizace očekávaného užitku
Aplikace 3: Technická diagnostika - popis problému Příčiny problému (závady) C C. Akce A A - opravné kroky, které mohou odstranit závadu. Otázky Q Q - kroky, které mohou pomoci identifikovat, kde je závada. Ke každé akci i otázce je přiřazena cena (c A značí cenu akce A, c Q cenu otázky Q). Cena může znamenat: dobu potřebnou k provedení akce či otázky, cenu za náhradní díl, který použijeme rizikovost akce nějaká kombinace výše uvedených.
Příklad technické diagnostiky tiskárny Trouble: světlý tisk. Troubleshooter: doporučí kroky, které pomohou odstranit trouble Akce a otázky A 1 :Remove, shake and reseat toner 5 cena A 2 :Try another toner 15 A 3 :Cycle power 1 Q 1 :Is the printerconfigurationpageprintedlight? 2 Možné závady při světlém tisku P(C i ) C 1 :Toner low 0.4 C 2 :Defective toner 0.3 C 3 :Corrupted dataflow 0.2 C 4 :Wrong driver setting 0.1
Light Print Problem - Bayesian Network Actions Causes A 1 Problem C 1 c 1 c 2 C 2 c 3 c 4 C 3 C 4 A 2 A 3 Questions Q 1
Světlý tisk - strategie odstranění závady A 1 = yes Q 1 = no A 1 = no Q 1 = yes A 2 = no A 2 = yes
Application 4: Adaptivní testování znalostí T 1 : Příklady úloh: ( 34 56 ) 1 8 = 24 15 8 1 = 5 8 8 1 = 8 4 = 1 2 T 2 : 1 6 + 1 12 = 2 12 + 1 12 = 3 12 = 1 4 1 T 3 : 4 1 2 1 = 1 4 32 = 3 8 ( T 4 : 12 12 ) ( 13 + 1 3) = 4 1 23 = 12 2 = 1 6.
Základní a operační dovednosti CP Porovnávání (spol. čitatel nebo jmenovatel) 1 2 > 1 3, 2 3 > 1 3 AD Sčítání (spol. jmenovatel) 1 7 + 2 7 = 1+2 7 = 3 7 SB Odečítání (spol. jmenovatel) 2 5 1 5 = 2 1 5 = 1 5 1 MT Násobení 2 35 = 10 3 ( ( CD Spol. jmenovatel 12, 3) 2 = 36, 6) 4 CL Krácení 4 6 = 2 2 2 3 = 2 3 CIM Konv. na slož. zlomek 7 2 = 3 2+1 2 = 3 1 2 CMI Konv. na nepravý zlomek 3 1 2 = 3 2+1 2 = 7 2
Špatné postupy Označení Popis Výskyt MAD MSB MMT1 MMT2 MMT3 MMT4 MC a b + d c = b+d a+c 14.8% a b d c = b d a c 9.4% a a c b cb = a a+c b cb = a a d b cd = a a c b cd = b 14.1% b b 8.1% b c 15.4% b+d 8.1% a b c = a b c 4.0%
Model studenta HV2 HV1 ACMI ACIM ACL ACD AD SB CMI CIM CL CD MT CP MAD MSB MC MMT1 MMT2 MMT3 MMT4
Model úlohy T1 ( 3 4 5 ) 1 6 8 = 15 24 1 8 = 5 8 1 8 = 4 8 = 1 2 T1 MT & CL & ACL & SB & MMT3 & MMT4 & MSB CL ACL MT SB MMT4 MSB T1 P(X1 T1) MMT3 X1
Model studenta spojený s modely otázek
Užitkovou funkcí je informační zisk Čím nižší je entropie, tím více o studentovi víme. H (P(X)) = x P(X = x) log P(X = x) 1 entropy 0.5 0 0 0.5 1 probability Informační zisk v uzlu n strategie IG(e n ) = H(P(S)) H(P(S e n ))
Skill Prediction Quality 92 90 adaptive average descending ascending 88 Quality of skill predictions 86 84 82 80 78 76 74 0 2 4 6 8 10 12 14 16 18 20 Number of answered questions