VE VÝKOVCÍCH NA ZÁKLADĚ TAVBOVÉHO OBSAHU VODÍKU FORGINGS ON THE BASIS OF HEAT CONTENT OF HYDROGEN. Adam Kracík

Podobné dokumenty
Návrh a vyhodnocení experimentu

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Návrh a vyhodnocení experimentu

Vzorová prezentace do předmětu Statistika

GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Vánoční sety Christmas sets

Aplikovaná statistika v R - cvičení 2

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Úvod. Struktura respondentů

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

KORELACE. Komentované řešení pomocí programu Statistica

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Uni- and multi-dimensional parametric tests for comparison of sample results

HODNOCENÍ VLASTNOSTÍ VÝKOVKŮ ROTORŮ Z OCELI 26NiCrMoV115

Cvičení 12: Binární logistická regrese

LOGBOOK. Blahopřejeme, našli jste to! Nezapomeňte. Prosím vyvarujte se downtrade

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

ACOUSTIC EMISSION SIGNAL USED FOR EVALUATION OF FAILURES FROM SCRATCH INDENTATION

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Národníinformačnístředisko pro podporu jakosti

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

4ST201 STATISTIKA CVIČENÍ Č. 7

= = 2368

USING VIDEO IN PRE-SET AND IN-SET TEACHER TRAINING

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Social Media a firemní komunikace

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Popis využití: Výukový materiál s úkoly pro žáky s využitím dataprojektoru, notebooku Čas: 15 minut

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Jednofaktorová analýza rozptylu

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

STATISTICA Téma 7. Testy na základě více než 2 výběrů

NEPARAMETRICKÉ TESTY

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

INFLUENCE OF SPEED RADAR SIGN ON VELOCITY CHANGE IN THE SELECTED LOCATION

Tabulka 1 Stav členské základny SK Praga Vysočany k roku 2015 Tabulka 2 Výše členských příspěvků v SK Praga Vysočany Tabulka 3 Přehled finanční

Jednostranné intervaly spolehlivosti

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Tomáš Karel LS 2012/2013

TECHNICKÁ UNIVERZITA V LIBERCI

Cvičení 9: Neparametrické úlohy o mediánech

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

Lineární regrese. Komentované řešení pomocí MS Excel

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Comparation of mobile

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Zelené potraviny v nových obalech Green foods in a new packaging

Statistické testování hypotéz II

ZNALOSTI A DOVEDNOSTI ČESKÝCH ŽEN V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

WORKSHEET 1: LINEAR EQUATION 1

Ilustrační příklad odhadu LRM v SW Gretl

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Kdo jsme Čím se zabýváme Nabídka služeb pro veřejnou správu Ověřeno v praxi u tisíce uživatelů v podnikatelské a bankovní sféře Plně využitelné u

Czech Republic. EDUCAnet. Střední odborná škola Pardubice, s.r.o.

Regresní analýza nehodovosti na světelně řízených křižovatkách

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Energy vstupuje na trh veterinárních produktů Energy enters the market of veterinary products

VY_32_INOVACE_06_Předpřítomný čas_03. Škola: Základní škola Slušovice, okres Zlín, příspěvková organizace

Regresní analýza. Eva Jarošová

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Cvičení ze statistiky - 9. Filip Děchtěrenko

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

Jednofaktorová analýza rozptylu

Pravděpodobnost a matematická statistika

Plánování experimentu

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Korelační a regresní analýza

Příprava dat a) Kontrola dat

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Měření dat Filtrace dat, Kalmanův filtr

Návod na vypracování semestrálního projektu

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Plánování experimentu

FJFJ Cvičení 1. Lukáš Frýd

Korelace. Komentované řešení pomocí MS Excel

Jana Vránová, 3. lékařská fakulta, UK Praha

VÝZKUM VLASTNOSTÍ SMĚSI TEKBLEND Z HLEDISKA JEJÍHO POUŽITÍ PRO STAVBU ŽEBRA

Transkript:

VYUŽITÍ STATISTICKÝCH NÁSTROJŮ K PREDIKCI VZNIKU VLASOVÝCH TRHLIN VE VÝKOVCÍCH NA ZÁKLADĚ TAVBOVÉHO OBSAHU VODÍKU USE OF STATISTIC TOOLS FOR PREDICTION OF FORMATION OF FINE CRACKS IN FORGINGS ON THE BASIS OF HEAT CONTENT OF HYDROGEN Adam Kracík ŠKODA STEEL s.r.o. člen konsorcia ŠKODA STEEL Tylova 1/57, 316 00 Plzeň adam.kracik@skoda-steel.cz Abstrakt: Tento příspěvek je inspirován reálným problémem, při jehož řešení došlo k mezioborové spolupráci materiálového experta a matematika. Tato spolupráce se ukázala jako velice přínosná a produktivní. Je zřejmé, že jednotlivé vědní disciplíny by se neměli uzavírat do sebe a tvořit tak izolované ostrůvky, ale společně se snažit posunout naše vědění zase o kousek dál, otvírat nám oči a ukazovat to, co jsme dosud neviděli! Na mezioborové spolupráci je nejzajímavější její poměr cena/výkon, kdy jednotliví spolupracovníci nemusejí vynaložit tolik sil, na rozdíl od bádání na vlastní pěst, mezi úzkými mantinely svého vědního oboru. Nejvíce sil však paradoxně stojí umět naslouchat a snažit se porozumět tomu druhému. Abychom porozuměli, je třeba vědět, že horizont našeho oboru není horizontem světa, ale právě jen ta nejasně definovaná mez naší disciplíny O přínosu statistických metod všude tam, kde je dostatek dat, nemůže být dnes již pochyb. Jedině statistické metody dokáží vydolovat z nasbíraných dat objektivní a tedy lidským úsudkem nezkreslené informace. Často se ale setkáváme s malými soubory dat, které navíc nesplňují mnohdy požadované předpoklady. Dokáže být matematická statistika přínosem i v těchto případech? Abstract: This paper has been inspired by an actual problem whose solution involved interprofessional cooperation between a material expert and a mathematician. This cooperation proved to be very beneficial and effective. It is obvious that individual science branches should not work separately and create isolated islands but in joint effort they should try to advance our knowledge ever further, open our eyes and show what we have not been able to see so far! The most attractive feature of cooperation between individual science branches is its price/performance ratio, when individual co-workers must not exert too much power compared to research performed separately within the narrow boundaries of their branch. However, the greatest effort paradoxically has to be exerted when trying to learn to listen and understand the other side. To understand the other party, you need to be aware of the fact that the horizon of your branch is not the utmost horizon there is, but just the vaguely defined limit of your branch There is no doubt about the benefit of statistic methods in all situations with sufficient amount of data. Only statistic methods may find objective information i.e. not biased by human opinion in the collected data. However, we often come across small sets of data which often do not comply with the required conditions. May mathematic statistics be a contribution even in such cases? 1

1. ÚVOD Při výrobě velkých zalomených hřídelí z legované oceli a ingotů o hmotnosti 55t 70t se vyskytl problém praskání těchto hřídelí během tepelného zpracování. Byla vyslovena hypotéza, že na vznik trhlin ve výkovcích by mohl mít vliv obsah vodíku v materiálu. Přestože obsahy vodíků v modelovém příkladu se pohybují pod obecně uznávanou hranicí nebezpečnosti, mohl by mít tento vysoce reaktivní prvek v souvislosti s tepelným zpracováním špatný vliv. Bylo tedy rozhodnuto sesbírat data z výroby za poslední 2 roky a pomocí statistických metod a softwaru Minitab je vyhodnotit. H 2 výsledek1 H 2 výsledek1 H 2 výsledek1 H 2 výsledek1 H 2 výsledek1 1,3 T 1,0 OK 0,5 OK 0,5 OK 0,8? 1,1 T 0,5 OK 0,9 OK 0,9 OK 0,6? 0,7 OK 0,8 OK 0,5 OK 0,9 OK 0,5? 1,0 OK 0,7 OK 0,8 OK 1,0 T 0,8? 0,9 OK 0,5 OK 0,5 OK 0,5 OK 0,7? 0,8 T 1,0 OK 0,5 OK 1,0 T 0,5? 1 OK 0,7 OK 0,8 OK 1,2? 0,5? Tab.1 Obsahy vodíku [% ppm]; trhliny jsou označeny barevně Tab.1 Content of hydrogen [% ppm]; cracks are marked in colour 2. ZOBRAZENÍ DAT Vhodné grafické zobrazení dat je vždy prvním krokem, který umožňuje udělat si dobrou představu o procesu výroby a zároveň generovat hypotézy, které jsou po té vyhodnocovány matematicko-statistickými testy. Obr.1 Bodový graf rozložení obsahu H 2 ve výkovcích Fig.1 Scatter diagram of distribution of content of H 2 in forgings 2

Přestože tento graf podporuje vyslovenou hypotézu, objektivní odpověď můžeme dostat pouze po použití statistického testu. Protože normalita dat byla zamítnuta (Obr.2), nemůžeme použít dvouvýběrový t-test a musíme se obrátit na neparametrické metody. (Normalitu dat zamítáme pro p-hodnotu 0,05.) Obr.2 Test Normálního rozdělení Fig.2 Test of normal distribution 3. DVOUVÝBĚROVÝ WILCOXONŮV TEST Mnoho statistických testů je založeno na různých omezujících předpokladech. Z pravidla na požadavku normálního rozdělení, shodnosti rozptylů či spojitosti. Často však pracujeme s výběry poměrně malých rozsahů, kde porušení normality má mnohem větší negativní důsledky než u velkých rozsahů. Pro práci s nimi byly vypracovány tzv.neparametrické metody, které nepotřebují předpoklad o konkrétním typu rozdělení. Neparametrickou obdobou dvouvýběrového t-testu je dvouvýběrový Wilcoxonův test. Při testování, zda oba výběrové soubory pochází ze stejné populace, nebudeme používat střední hodnoty, ale mediány obou výběrů. Vyhodnocení proběhlo pomocí softwaru Minitab. Po zadání vstupních dat, provedl Minitab následující výpočet (Obr.3). Pomocí p-hodnoty = 0,0052 (resp.0,0044) zamítáme nulovou hypotézu, že oba výběrové soubory pocházejí ze stejné populace. Jinými slovy, výběr obsahující výkovky s trhlinami (H2_T), jehož medián je rovný 1, se statisticky významně liší od výběru výkovků bez trhlin (H2_OK), jehož medián je 0,75. (Nulovou hypotézu zamítáme, je-li p-hodnota zvolené hladině testu.) 3

Obr.3 Výpočet Wilcoxonova testu pomocí Minitabu Fig.3 Calculation of Wilcoxon test using Minitab 4. LOGISTICKÁ REGRESE Logistická regrese je nástroj pro modelování vztahu mezi jednou či více vstupními proměnnými X a diskrétní výstupní proměnou Y. V našem případě bude výstupní proměnnou Y výskyt trhlin ve výkovcích. Tato proměnná nabývá pouze dvou hodnot (1, 0 ano, ne) a proto je diskrétní. Vstupní proměnnou bude tavbový obsah vodíku. Tato proměnná je spojitého charakteru. Jelikož Y není spojité, je na místo něj modelována pravděpodobnost jeho výskytu P(Y=1). Logistický model pro výpočet pravděpodobnosti má tento tvar (Vzorec1). b e 1+ e + b 0 1 ( = 1 ) = b + b x P Y Vzorec1: Logistický model pravděpodobnosti Formula 1: Logistic model of probability 0 x 1 V Minitabu byla vypočtena konstanta b 0 a koeficient b 1. Pomocí p-hodnot byla ověřena adekvátnost modelu a významnost b 0 a b 1. U koeficientu b 1 však musíme přimhouřit oči, protože nebyla splněna podmínka 95%, ale 94% spolehlivosti jeho významnosti (Obr.4). 4

Obr.4 Výpočet Logistické regrese a její ověření pomocí Minitabu Fig.4 Calculation of logistic regression and its verification by means of Minitab Obr.4: b 0 = Konstant = -11,6065 p-hodnota = 0,041 b 1 = H2 = 11,1656 p-hodnota = 0,057 Po dosazení b 0, b 1 a x do vzorce1, můžeme vykreslit graf pravděpodobnosti modelující pravděpodobnost výskytu trhlin v závislosti na tavbovém obsahu vodíku (Obr.5). Při dosazení x = 1,2 do vzorce 1 vyjde pravděpodobnost vzniku trhliny 85.7%. To znamená, že u dosud nevyšetřeného výkovku s tavbovým obsahem vodíku 1,2 je více než 85% pravděpodobnost vzniku trhlin. 5

Obr.5 Pravděpodobnost výskytu trhlin v závislosti na obsahu H 2 Fig.5 Probability of occurrence of cracks in dependence on heat content of H 2 5. ČÁSTEČNÝ ZÁVĚR - Pomocí dvouvýběrového Wilcoxova testu byl prokázán vliv tavbového obsahu vodíku na vznik trhlin při vychlazování výkovku. - Pomocí Logaritmické regrese byl tento vztah vymodelován formou pravděpodobnostní fce výskytu trhlin v závislosti na tavbovém obsahu vodíku. 6. POKRAČOVÁNÍ MODELOVÉHO PŘÍKLADU Po půl roce byl doplněn sběr dat z tabulky 1 (Tab.2), pro ověření a zpřesnění prvních závěrů. Z osmi nevyšetřených kusů z tabulky 1 byly v jednom případě indikovány trhliny, ostatní výkovky byly bez trhlin. H 2 výsledek2 H 2 výsledek2 H 2 výsledek2 H 2 výsledek2 H 2 výsledek2 1,3 T 1,0 OK 0,5 OK 0,5 OK 0,8 OK 1,1 T 0,5 OK 0,9 OK 0,9 OK 0,6 OK 0,7 OK 0,8 OK 0,5 OK 0,9 OK 0,5 OK 1,0 OK 0,7 OK 0,8 OK 1,0 T 0,8 OK 0,9 OK 0,5 OK 0,5 OK 0,5 OK 0,7 OK 0,8 T 1,0 OK 0,5 OK 1,0 T 0,5 OK 1 OK 0,7 OK 0,8 OK 1,2 T 0,5 OK Tab.2 Doplněná data Tab.2 Complemented data Zobrazení doplněných dat: 6

Obr.6 Bodový graf doplněných dat Fig.6 Scatter diagram of complemented data Wilkoxonův test 2 z doplněných hodnot pouze potvrdil závěr z předcházející části o zamítnutí hypotézy, že oba výběry pocházejí ze stejné populace (Obr.6). Obr.7 Výpočet Wilkoxonova testu 2 Fig.7 Calculation of Wilcoxon test 2 Logistická regrese doplněných dat: Koeficienty regresní fce vyšly tentokrát takto: b 0 = -13,4068 p-hodnota = 0,018 b 1 = 13,0225 p-hodnota = 0,025 Podmínka 95% spolehlivosti významnosti b 0 i b 1 je tentokrát splněna beze zbytku. 7

Obr.8 Výpočet Logistické regrese 2 a její ověření Fig.8 Calculation of logistic regression 2 an its verification Grafické zobrazení pravděpodobnosti: Následující graf porovnává křivku pravděpodobnosti výskytu trhlin prvního výpočtu (přerušovaná čára) a křivku pravděpodobnosti vycházející z doplněných dat (plná čára). Dá se konstatovat, že došlo pouze ke kosmetickým úpravám, nicméně lépe vycházející p-hodnoty ve výpočtu na Obr.7 činí tento výpočet a graf legitimnější. 8

Obr.9 Pravděpodobnost výskytu trhlin v závislosti na obsahu H 2 Fig.9 Probability of occurrence of cracks in dependence on the content of H 2 7. ZÁVĚR - Výpočet s doplněnými daty upřesnil a potvrdil správnost částečného závěru. - Na modelovém přikladu bylo demonstrováno užití dvou statistických testů, přestože výběrový soubor obsahoval pouze 27 respektive 35 hodnot. Správnost a korektnost byla v obou příkladech potvrzena p-hodnotami. Literatura: [1] ANDĚL J.: Matematická statistika, SNTL 1978 [2] ANDĚL J.: Statistické metody, MFF UK 1998 9