Klasifikační stromy. Metriku, pro níž je E( C, použijeme jako kořen.



Podobné dokumenty

Obr. 1 - Seznam smluv

Počítačové šachy. Otakar Trunda

FAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ PRO AKADEMICKÝ ROK

přirozený algoritmus seřadí prvky 1,3,2,8,9,7 a prvky 4,5,6 nechává Metody řazení se dělí:

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Teoretické úlohy celostátního kola 53. ročníku FO

GRAFY A GRAFOVÉ ALGORITMY

Sborník vědeckých prací Vysoké školy báňské - Technické univerzity Ostrava číslo 1, rok 2010, ročník X, řada stavební článek č. 17.

Mária Sadloňová. Fajn MATIKA. 150 řešených příkladů (vzorek)

NÁVRH A REALIZACE WWW PREZENTACE ČKR

Algoritmus Minimax. Tomáš Kühr. Projektový seminář 1

Novinky v programu Účtárna 2.05

ŽÁDOST O NADAČNÍ PŘÍSPĚVEK

Regresní a korelační analýza

CVIČENÍ 1 PRVKY KOVOVÝCH KONSTRUKCÍ

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

Václav Mentlík Pavel Trnka, Magdaléna Trnková Lumír Šašek. Spolehlivostní aspekty elektrotechnologie

Národní informační středisko pro podporu kvality

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Řešení elektronických obvodů Autor: Josef Sedlák

8 A (strana 1) Soubory a složky, procházení, orientace

KRITERIA PRO STANOVENÍ SPOLEHLIVOSTI PROGRAMOVATELNÝCH SYSTÉMŮ A OVLÁDACÍCH PRVKŮ (PROJEKT Č )

MATEMATIKA 1 4 A B C D. didaktický test. Zadání neotvírejte, počkejte na pokyn! Krok za krokem k nové maturitě Maturita nanečisto 2006

MODELOVÁNÍ V INVENTORU CV

Poznámky k předmětu Aplikovaná statistika, 9.téma

5.2.7 Zobrazení spojkou I

Měření povrchového napětí kapaliny metodou maximální kapky

Nové výsledky o zlomkových kuželosečkách v rovině a prostoru

Předmět: Ročník: Vytvořil: Datum: ŠČERBOVÁ M. PAVELKA V. VZPĚR VZPĚR

Zpráva, hodnotící postup a výsledky nových forem práce Pozemkového spolku Meluzína (PSM) Využití satelitní navigace (GPS) pro práci pozemkového spolku

ČSN EN Zatížení větrem 1. Všeobecně 2. Návrhové situace 3. Modely zatížení větrem 4. Rychlost a tlak větru 5. Zatížení větrem 6.

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

South Bohemia Mathematical Letters Volume 23, (2015), No. 1, DĚLENÍ KRUHU NA OBLASTI ÚVOD

Využití faktorového plánu experimentů při poloprovozním měření a v předprojektové přípravě

Tomáš Karel LS 2012/2013

Katedra obecné elektrotechniky Fakulta elektrotechniky a informatiky, VŠB - TU Ostrava

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

Rozhodovací stromy a lesy

METODIKA ANALÝZY ODMĚŇOVÁNÍ ZAMĚSTNANCŮ ZPRACOVATELSKÉHO PODNIKU METHODOLOGY OF EMPLOYEE REWARDING ANALYSIS IN A PRODUCER ENTERPRISE

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Novinky v programu MSklad 1.36

Kód uchazeče ID:... Varianta: 14

5 Rekurze a zásobník. Rekurzivní volání metody

Zakázka: D Stavba: Sanace svahu Olešnice poškozeného přívalovými dešti v srpnu 2010 I. etapa Objekt: SO 201 Sanace svahu

VÝPOČTOVÉ MODELOVÁNÍ KONSTRUKCÍ PODKROVÍ

FYZIKÁLNÍ PRAKTIKUM FJFI ČVUT V PRAZE. Úloha 4: Balmerova série vodíku. Abstrakt

AdvAnch g Uživatelský manuál v. 1.0

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

INTERAKTIVNÍ TABULE A MATEMATICKÝ SOFTWARE GEOGEBRA PŘI VÝUCE MATEMATIKY V ANGLICKÉM JAZYCE

A B = A A B P A B C = P A P B P C = =

napájecí zdroj I 1 zesilovač Obr. 1: Zesilovač jako čtyřpól

Analýza spolehlivosti tlakové nádoby metodou Monte Carlo

Západočeská univerzita v Plzni. Fakulta aplikovaných věd Katedra matematiky. Geometrie pro FST 1. Pomocný učební text

FAKTOROVÉ PLÁNOVÁNÍ A HODNOCENÍ EXPERIMENTŮ PŘI ÚPRAVĚ VODY

2 Spojité modely rozhodování

Testování vyhledávačů Google a Seznam.cz

Biostatistika a matematické metody epidemiologie- stručné studijní texty

VYSOKÉ UČENÍ TECHNICKÉ Fakulta strojního inženýrství Ústav strojírenské technologie

Mapa kontaminace půdy České republiky 137 Cs po havárii JE Černobyl

Technická mechanika - Statika

Rozbor řešení projektu a celkové shrnutí

Rozhodovací procesy 10

Metody konstrukce výnosových křivek

StatSoft Odkud tak asi je?

Gymnázium Přírodní škola Mapa výjezdů Přírodní školy

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 530 VÝBĚR VZORKŮ

KGG/STG Statistika pro geografy

Pro lepší přehlednost a srozumitelnost práce jsem si stanovil tyto tři hlavní hypotézy:

NEXIS 32 rel Generátor fází výstavby TDA mikro

Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,r)

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ VÝZKUMNÁ ZPRÁVA STABILITA VYBRANÝCH KONFIGURACÍ KOLEJOVÉHO SVRŠKU

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Geometrie zakřiveného prostoru aplikace s fyzikální tématikou

Digitální učební materiál

. Opakovací kurs středoškolské matematiky podzim 2015

Helios RED a Internetový obchod

Obr. 1 Stavební hřebík. Hřebíky se zarážejí do dřeva ručně nebo přenosnými pneumatickými hřebíkovačkami.

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Výpočetní složitost I

Vedení a technologie: Výhody videokomunikace pro středně velké podniky

Příklad generátor fází výstavby a TDA mikro

Výpočtové modelování deformačně-napěťových stavů ve zdravých a patologických kyčelních kloubech

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

R 3 R 6 R 7 R 4 R 2 R 5 R 8 R 6. Úvod do elektrotechniky

Adresa: Kontaktní osoba: Mgr. Martina Šobíšková Vršovická 65/ Telefon: Praha 10 Fax:

Důvěrné. Draft k diskusi. Vladislav Severa Partner. Boris Mišun Senior Manager

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA ATMOSFÉRICKÉ A TOPOGRAFICKÉ KOREKCE DIGITÁLNÍHO OBRAZU ZE SYSTÉMU SPOT 5 V HORSKÝCH OBLASTECH

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry.

RŽP D nová edice. Obsah. Základy práce v systému POS

Materiály charakteristiky potř ebné pro navrhování

Experimentální určení velikosti vzorku potřebného k porovnání kvality práce dvou různých sklízečů cukrovky

PROTOKOL. č. C2858c. Masarykova univerzita PF Ústav chemie Chemie konzervování a restaurování 1 POPIS PRAKTICKÉHO CVIČENÍ. 1.

Rozhodovací stromy a jejich konstrukce z dat

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

TECHNICKÁ UNIVERZITA V LIBERCI FAKULTA STROJNÍ

Řešení úloh celostátního kola 55. ročníku fyzikální olympiády.

1. Faradayovy zákony elektrolýzy Cíle Ověřit platnost Faradayových zákonů elektrolýzy. Cílová skupina 2. ročník Klíčové kompetence

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Fakulta strojního inženýrství VUT v Brně Ústav konstruování. KONSTRUOVÁNÍ STROJŮ převody. Přednáška 6

Transkript:

Příklad použití klasifikačního stromu ve spolehlivosti software metoda plovoucích mezí Jan A. Strouhal Abstrakt: Příspěvek se zabývá příkladem konstrukce klasifikačního stromu pro použití ve spolehlivosti software. V první části je popsána základní konstrukce, která počítá s expertním počtem i hodnotami hrac metrik, v další části je popsán příklad vylepšení této základní konstrukce vyhledáním optimálních hrac metrik pomocí programu. Klasifikační stromy Vezmeme-li části programu (moduly), které máme již otestované, můžeme z jejich vlastností (metrik) zkonstruovat klasifikační strom, kterým pak můžeme klasifikovat netestované části programu, u kterých chceme zjistit, zda je máme či nemusíme testovat. Tento zkonstruovaný strom nám může pomoci zkrátit dobu testování nebo dokonce zvýšit spolehlivost, protože se při testování zaměříme více na části, které jsou skutečně potřeba otestovat a odladit. Postup byl řešen na konferenci ROBUST 2006. Funkce výběru metrik: F( ; ) = log 2 log2, kde p je počet pozitivních modulů ( třída), a n je počet negativních modulů v i-tém uzlu. Čím je F menší, tím větší je homogeta v uzlu. v Metriku, pro níž je E( C, A) = [ wi * F(, )], kde wi = i= 1 C použijeme jako kořen.

Pos vstupních údajů Dále popsané vstupní údaje jsou z vyvýjeného programu CSC Atlas pro správu domů, kde jednotlivé moduly jsou ucelenými částmi tohoto programu tj. objednávky, faktury, domy, jednotky, nájemci, evidence plateb, atd. Data o těchto modulech byla sbírána v průběhu roku 2005, nově klasifikované moduly taktéž. Základní konstrukce pevné meze Vstupní údaje U závislé proměnné (metrika: počet chyb) budeme předpokládat, že při počtu chyb větším než 120 je modul náchylný k chybám a tudíž jej budeme řadit do třídy Metrika A B C D E F G H I J K Počet chyb 30 20 125 130 80 105 140 12 32 25 14 Třída - - - - - - - - Nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) Metrika A B C D E F G H I J K Funkce R R F R P F P P P P R Propojení dat 90 20 200 150 110 50 0 170 82 190 70 Počet revizí 0 7 6 4 3 10 11 2 5 9 2 Kódování Vezmeme nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) a pomocí kódování rozdělíme do tří skun α, β,γ Metrika α β γ Funkce α =Práce se soubory (F) β =Uživatelské rozhraní (R) γ =Řízení procesu (P) Propojení dat α = 0 x 79 β = 80 x 149 γ = x 150 Počet revizí α = 0 x 3 β = 4 x 8 γ = x 9

můžeme pak psát Metrika A B C D E F G H I J K Funkce β β α β γ α γ γ γ γ β Propojení dat β α γ γ β α α γ β γ α Počet revizí α β β β α γ γ α β γ α Třída - - - - - - - - Příklad výpočtu pro základní kořen uvažována Metrika Funkce Pomocí metriky Funkce rozdělíme (tučně zvýrazněny pozitivní třídy): α - C,F; β - A,B,D,K; γ - E,G,H,I,J P n Celkem váha F(p,n) Váha*F(p,n) Větev 1 1 1 11 0,182 0,000 0,000 Větev 2 1 3 11 0,364 0,811 0,295 Větev 3 1 4 11 0,455 0,722 0,328 Součet 0,623.α ( 3) Počet.γ ( 9) revizí A, E, H, K (M,R) B (N).α ( 79) B, C, D, I (N,P,Q,S,T) β (80 149) Propojení dat I (P,S,T) β (4 8).γ ( 150) C, D (Q) Funkce.α (F).β (P).γ (R) F (O) G J Obr. 1: Výsledný strom (kurzívou v závorce vyznačeny nově klasifikované moduly)

Nově klasifikované moduly Pro nová data získaná dalším testováním na dalších modulech získáváme po průchodu stromem jejich výsledné třídy. Průchod je vidět ve stromu z kurzívou označených modulech. Nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) Metrika M N O P Q R S T Funkce R R F R P F P P Propojení dat 195 75 0 130 172 51 24 132 Počet revizí 2 4 11 8 7 0 5 5 Třída - - - - - - - Závěr: Pro modul Q je vysoká pravděpodobnost více než 120 chyb. Nová metoda metoda plovoucích mezí Při vytváření klasifikačního stromu předem dané (expertní) hrace metrik nemusí být vždy optimální a mohou způsobovat vytvoření stromu se slepými koncovými listy nebo s koncovými listy, které jsou stále nehomogenní přestože jsou již vyčerpány všechny metriky. Pokud však budeme procházet všechny možné meze (také i počet mezí) můžeme dostat menší hodnoty E() a tím i lepší dělení jednotlivých větví stromu. Tuto metodu nazveme metoda plovoucích mezí. Protože by bylo náročné procházet ručně všechny možné meze a zjišťovat vhodnou metriku a meze vytvořili jsme pomocný program, který propočítává mimum E() přes všechny metriky. Program generuje tyto meze v polovinách mezi všemi naměřenými hodnotami pro danou metriku. Výsledkem (výstupem) programu je vyhledání optimální metriky pro kořen (přes mimum E()). Následně je pak možné vybrat pouze moduly jdoucí určitou větví a znovu určit optimální metriku pro další kořen. Vstupní údaje Pro konstrukci stromu pomocí nové metody jsme opět použili údaje z programu CSC Atlas.

.α ( 3) Počet revizí.β (>3) A, E, H, K B, C, D, I, F, G, J.γ ( 86) Propojení dat.α ( 10) C, D, J G.β <10 86> B, F, I Funkce.α (P).β (F).γ (R) J C D Obr. 3: Aplikace klasifikačního stromu na nových modulech pro novou metodu Nezávislé proměnné (metriky: funkce, propojení dat, počet revizí) Metrika M N O P Q R S T Třída - - - - - -

Závěr: Pro moduly O a P je vysoká pravděpodobnost více než 120 chyb. Tento výsledek byl potvrzen emricky a lze tedy konstatovat, že nová metoda se v tomto případě ukázala být lepším odhadem modulů náchylných k chybám. Literatura [1] Strouhal J. A.: Klasifikační stromy ve spolehlivosti software. Sborník příspěvků konference ROBUST 2006, JČMF Praha, ISBN 80-7015-073-4, str. 461-468 [2] Hahn A., Radkova L., Achiemere G., Klement V., Strouhal J.: Evaluation of Our Therapeutic Approach to the Patients Suffering from Chroc Tintus. Acta Oto-Laryngologica, zasláno k publikaci [3] Dohnal G.: Markovské modely spolehlivosti software. Sborník příspěvků konference ROBUST 2006, JČMF Praha, ISBN 80-7015-073-4, str. 453-461 Adresa autora: Ing. Jan Adam Strouhal, České vysoké učení techcké v Praze, Fakulta strojní, Ústav techcké matematiky, Karlovo nám. 13, 121 35 Praha 2 e-mail: j.strouhal@cqr.cz Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR