VLIV TYPU STATISTICKÉ DISTRIBUCE LOŽISKOVÝCH ÚDAJŮ NA MODEL LOŽISKA NEROSTNÝCH SUROVIN

Podobné dokumenty
Karta předmětu prezenční studium

Uni- and multi-dimensional parametric tests for comparison of sample results

INTERAKTIVNÍ PROGRAMOVÝ SYSTÉM PRO APLIKACI MODERNÍCH METOD HODNOCENÍ UHELNÝCH LOŽISEK A JEJICH DÍLČÍCH ČÁSTÍ V KOMPLIKOVANÝCH PODMÍNKÁCH

Svazek specializovaných map s odborným obsahem

Svazek specializovaných map s odborným obsahem

Vliv metody vyšetřování tvaru brusného kotouče na výslednou přesnost obrobku

Svazek specializovaných map s odborným obsahem

Svazek specializovaných map s odborným obsahem

GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

Svazek specializovaných map s odborným obsahem

Database systems. Normal forms

Využití hybridní metody vícekriteriálního rozhodování za nejistoty. Michal Koláček, Markéta Matulová

Popis programu 3D_VIZ

Aplikace matematiky. Dana Lauerová A note to the theory of periodic solutions of a parabolic equation

WORKSHEET 1: LINEAR EQUATION 1

Gymnázium, Brno, Slovanské nám. 7 WORKBOOK. Mathematics. Teacher: Student:

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

Introduction to MS Dynamics NAV

Klepnutím lze upravit styl předlohy. nadpisů. nadpisů.

Ja n T. Št e f a n. Klíčová slova: Řada knih, srovnání cen v čase, cena vazby a ocelorytové viněty, lineární regresní analýza.

Obrábění robotem se zpětnovazební tuhostí

Jak importovat profily do Cura (Windows a

Problém identity instancí asociačních tříd

Národní informační středisko pro podporu kvality

USING VIDEO IN PRE-SET AND IN-SET TEACHER TRAINING

The Over-Head Cam (OHC) Valve Train Computer Model

EXACT DS OFFICE. The best lens for office work

Compression of a Dictionary

Analýza dat na PC I.

Programový systém pro rychlé hodnocení uhelných ložisek

Digitální model jihomoravského lignitového revíru

Pokročilé metody geostatistiky v R-projektu

DC circuits with a single source

1, Žáci dostanou 5 klíčových slov a snaží se na jejich základě odhadnout, o čem bude následující cvičení.

Odhad dlouhodobého a hloubkového geochemického vývoje důlních vod rosicko-oslavanské uhelné pánve ve vztahu k optimalizaci nutného čištění důlních vod

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

CHAPTER 5 MODIFIED MINKOWSKI FRACTAL ANTENNA

VÝZKUM VLASTNOSTÍ SMĚSI TEKBLEND Z HLEDISKA JEJÍHO POUŽITÍ PRO STAVBU ŽEBRA

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

LOGOMANUÁL / LOGOMANUAL

2. Entity, Architecture, Process

PROSTOROVÉ ŘEŠENÍ APOLLONIOVÝCH ÚLOH POMOCÍ PROGRAMU CABRI 3D

Využití matematického zpracování údajů o množstvi plynnovzdušné směsi získaných z monitoringu odplyňovacích vrtů

Karta předmětu prezenční studium

Převod prostorových dat katastru nemovitostí do formátu shapefile

STLAČITELNOST. σ σ. během zatížení

Vybrané mzdové charakteristiky v krajích ČR členěné podle věku a pohlaví v roce 2008

KULOVÝ STEREOTEPLOMĚR NOVÝ přístroj pro měření a hodnocení NEROVNOMĚRNÉ TEPELNÉ ZÁTĚŽE

Litosil - application

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

SOFTWARE NA ZPRACOVÁNÍ MRAČEN BODŮ Z LASEROVÉHO SKENOVÁNÍ. Martin Štroner, Bronislav Koska 1

USER'S MANUAL FAN MOTOR DRIVER FMD-02

VYSOKÁ ŠKOLA HOTELOVÁ V PRAZE 8, SPOL. S R. O.

Zápočtová práce STATISTIKA I

CHAIN TRANSMISSIONS AND WHEELS

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Transportation Problem

VY_32_INOVACE_06_Předpřítomný čas_03. Škola: Základní škola Slušovice, okres Zlín, příspěvková organizace

Geostatistické zpracování dat v programovém produktu ISATIS

AIC ČESKÁ REPUBLIKA CZECH REPUBLIC

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Fórum mladých geoinformatikov TU Zvolen, 16. máj 2008 REALIZACE A VYUŽITÍ PROGRAMOVÝCH PROSTŘEDKŮ PRO ÚČELY MODELOVÁNÍ UHELNÝCH SLOJÍ.

4 TABULKY ZÁKLADNÍCH STATISTICKÝCH CHARAKTE- RISTIK TÌLESNÝCH ROZMÌRÙ TABLES OF BASIC STATISTICAL CHARACTERISTICS OF BODY PARAMETERS

PARAMETRICKÁ STUDIE VÝPOČTU KOMBINACE JEDNOKOMPONENTNÍCH ÚČINKŮ ZATÍŽENÍ

VYUŽITÍ DATA DRIVEN PAGES

Dynamic Development of Vocabulary Richness of Text. Miroslav Kubát & Radek Čech University of Ostrava Czech Republic

TKGA3. Pera a klíny. Projekt "Podpora výuky v cizích jazycích na SPŠT"

Použití modelu Value at Risk u akcií z

Počítačové kognitivní technologie ve výuce geometrie

Vánoční sety Christmas sets

Air Quality Improvement Plans 2019 update Analytical part. Ondřej Vlček, Jana Ďoubalová, Zdeňka Chromcová, Hana Škáchová

MOŽNOSTI APROXIMACE ROZDĚLENÍ KOLEKTIVNÍHO RIZIKA

PRODEJNÍ EAUKCE A JEJICH ROSTOUCÍ SEX-APPEAL SELLING EAUCTIONS AND THEIR GROWING APPEAL

Radiova meteoricka detekc nı stanice RMDS01A

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Výuka odborného předmětu z elektrotechniky na SPŠ Strojní a Elektrotechnické

FUNKČNÍ VZOREK FUNKČNÍ VZOREK ZAŘÍZENÍ HTPL-A PRO MĚŘENÍ RELATIVNÍ TOTÁLNÍ EMISIVITY POVLAKŮ

Interpolace trojrozměrných dat magnetické rezonance

Silicified stems of upper Paleozoic plants from the Intra Sudetic and Krkonoše Piedmont basins

Foster Bohemia s.r.o. Laboratoř měření imisí Immission Measurement Laboratory. Mezi Rolemi 54/10, Praha 5, Jinonice, Česká republika

WYSIWYG EDITOR PRO XML FORM

PC/104, PC/104-Plus. 196 ept GmbH I Tel. +49 (0) / I Fax +49 (0) / I I

Ing. Pavel Staša, doc. Dr. Ing. Vladimír Kebo, Vladimír Strakoš V 2

Čipové karty Lekařská informatika

GENERAL INFORMATION RUČNÍ POHON MANUAL DRIVE MECHANISM

II_ _Listening Pracovní list č. 2.doc II_ _Listening Pracovní list č. 3.doc II_ _Listening Řešení 1,2.doc

ACOUSTIC EMISSION SIGNAL USED FOR EVALUATION OF FAILURES FROM SCRATCH INDENTATION

CZ.1.07/1.5.00/

Vybrané procesy potravinářských a biochemických výrob

Energy vstupuje na trh veterinárních produktů Energy enters the market of veterinary products

Modelování ve vodním hospodářství II. Modeling in Water Management

Použití programového systému pro interaktivní výběr bilancované mocnosti uhelné sloje v oblasti jihomoravského lignitového revíru

Soubor specializovaných map s odborným obsahem

POČET ROČNÍKŮ JEHLIC POPULACÍ BOROVICE LESNÍ. Needle year classes of Scots pine progenies. Jarmila Nárovcová. Abstract

Odhady polohy mzdového rozdělení pomocí vybraných robustních odhadových funkcí

Právní formy podnikání v ČR

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

Transkript:

Sborník vědeckých prací Vysoké školy báňské Technické univerzity Ostrava Řada hornicko-geologická Volume LI (2005), No.2, p. 79-88, ISSN 0474-8476 František STANĚK *, Vlastimil KAJZAR ** VLIV TYPU STATISTICKÉ DISTRIBUCE LOŽISKOVÝCH ÚDAJŮ NA MODEL LOŽISKA NEROSTNÝCH SUROVIN EFFECT OF NATURE OF STATISTICAL DISTRIBUTION OF DEPOSIT DATA ON DEPOSIT MODEL OF MINERAL RAW MATERIALS Abstrakt Pouze na základě správného popisu statistické distribuce zpracovávaných ložiskových údajů lze odhadnout statistické charakteristiky a realizovat následné zpracování. Je známým faktem, že empirické distribuce většiny veličin popisujících geologická tělesa nevyhovují běžně uvažovanému normálnímu rozdělení, ale že mají distribuci asymetrickou. Přitom je ale normální distribuce základní podmínkou použití mnoha dalších matematických postupů. V článku je popsáno programové řešení tohoto problému při modelování uhelné sloje v Interaktivním programovém systému pro aplikaci moderních metod hodnocení uhelných ložisek a jejich dílčích částí v komplikovaných podmínkách (vyvíjeném na IGI HGF VŠB-TU Ostrava v rámci řešení projektu GA ČR č. 105/03/1417) v případě, že je statistickým testem zjištěna jiná než normální distribuce. V tomto procesu se využívá tzv. kvantilová transformace vstupních údajů. V několika ukázkách je demonstrováno, jaké nepřesnosti bez použití této transformace vznikají při modelování atributů uhelné sloje. Abstract A correct formulation of statistical distribution of processed deposit data is a necessary condition to estimate statistical parameters and to realize subsequent data processing. It is a well-known fact that empirical distributions of most quantities describing geological bodies do not comply with a normal distribution, they are often asymmetric. However, most common mathematical procedures assume these quantities as normal distributed ones. We describe a method of transforming the initial data distributed asymmetrically into the normal distributed ones, applied in the field of coal seam modeling with use of Interactive software system for application of modern methods of evaluation of coal deposits and their parts under complicated conditions (This software is developed by IGI HGF VŠB-TU Ostrava within the frame of GA ČR project No 105/03/1417.). We use the so-called quantile transformation of input data. On several case studies we show which inexactitudes arise without application of such transformation when modeling attributes of coal seam. Key words: statistical data processing, frequency distribution, skewed distributions, lognormal distribution, data transformation, quantile transformation procedure, geomodeling, mineral deposits, coal deposits. Úvod Jednou ze základních úloh statistického rozboru i volby dalších metod zpracování je studium charakteru statistické distribuce. Jen na základě správného popisu distribuce lze odhadnout statistické charakteristiky a realizovat další zpracování. Je známým faktem, že empirické distribuce většiny veličin popisujících geologická tělesa nevyhovují běžně uvažovanému normálnímu rozdělení N(U;µ,σ 2 ), ale že mají distribuci asymetrickou (převážně kladně) nejčastěji lognormální. Přitom je ale normální distribuce základní podmínkou použití mnoha dalších matematických postupů. Bez správného přístupu k zešikmeným datům není možné dělat například geostatistické analýzy a odhady, neboť nejlepší lineární odhad je ten, který je získaný z experimentálních hodnot, řídících se normálním Gaussovým rozdělením (Vizi, Timčák 2002). * Doc. RNDr., Ph.D., Institut geologického inženýrství, VŠB-TU Ostrava, e-mail: frantisek.stanek@vsb.cz ** Ing., interní doktorand, Institut geologického inženýrství, VŠB-TU Ostrava, e-mail: vlastimil.kajzar.hgf@vsb.cz 79

Vzniká proto otázka, jaká chyba vznikne při modelování ložiska nerostných surovin - například ložiska uhlí, pokud se neprovede transformace vstupních údajů pro zešikmená data. Transformace ložiskových údajů Pro popis zpravidla asymetricky rozložených veličin popisujících geologická tělesa se využívají různé transformace, např. obecná logaritmická v = ln(a+bu), která vede k velmi často používanému obecnému lognormálnímu rozdělení LN(U;µ,σ 2,a,b), jejíž konstanty lze stanovit minimalizací šikmosti a koncentrace distribuce. Tento proces je schematicky demonstrován na obr. 1. Zešikmená distribuce je ukázána na obr. 1 a) s nejčetnější hodnotou modu h, mediánu m a střední hodnotou x. Obr. 1 b) ukazuje rozdělení četnosti stejných hodnot po jejich logaritmické transformaci. Vrchol křivky četnosti nyní představuje medián. Jestliže je distribuce přesně lognormální, potom je medián m identický s logaritmem geometrického průměru γ. β 2 označuje rozptyl logaritmovaných hodnot. y četnost 2 β 2 e y x h = modus x = aritmetický průměr původní, nelogaritmované hodnoty m = medián transformace do normální distribuce funkcí ln četnost 2 β 2 ln x h x logaritmované hodnoty m = ln γ (ln γ = logaritmus geometrického průměru) Obr. 1: Převod doprava zešikmené distribuce do normální distribuce transformací jednotlivých hodnot funkcí ln(x) (Wellmer 1998, upraveno) Figure 1: Transfer of a distribution skewed to the right into a normal distribution by transfer of the single values into logarithms (Wellmer 1998, adapted) Je třeba si ale uvědomit, že lognormální distribuce je jedním z mnoha typů možných distribucí souboru hodnot. Existuje praktická cesta pro transformaci libovolné distribuce do distribuce normální a zpět použití tzv. kvantilové (nebo také grafické) transformace vstupních údajů. V případě, že vstupní soubor dat nevyhovuje normální distribuci, lze provést grafickou transformaci vstupního souboru tak, že výsledný soubor má normované normální rozdělení (se střední hodnotou nula a směrodatnou odchylkou 1). Tento proces ilustruje obr. 2. Tuto transformaci realizuje například program nscore v geostatistickém toolboxu GSLIB (Deutsch, Journel 1998). Tato transformace je oboustranná pod podmínkou, že histogram neobsahuje tzv. spikes interpopulační, konstantní hodnoty. Tyto je nutno před samotnou transformací vyhladit (Deutsch 2002). 80

V případě modelování uhelné sloje jsou z nepravidelně rozmístěných průzkumných bodů interpolovány hodnoty jednotlivých ložiskových atributů do pravidelné sítě bodů tzv. gridu. Jelikož se jedná o lineární matematické postupy, je nutné, aby vstupní údaje byly rozloženy normálně. Aby se modelovaná sloj co nejvíce blížila realitě, je nutné použít pro interpolaci normálně rozložené vstupní hodnoty jednotlivých ložiskových atributů. Proto je v programovém řešení Interaktivního programového systému pro aplikaci moderních metod hodnocení uhelných ložisek a jejich dílčích částí v komplikovaných podmínkách (dále IPSHUL) vyvíjeného v rámci řešení projektu GA ČR č. 105/03/1417 v případě, že je statistickým testem zjištěna jiná než normální distribuce, programově provedena výše popsaná kvantilová grafická transformace vstupních údajů do normovaného normálního rozdělení (dále NNR), následně se provede interpolace vybranou interpolační metodou a hodnoty gridu pak budou programově zpětně transformovány opět pomocí kumulovaných četností (empirické distribuční funkce). Legenda: Frequency četnost, Normal Score normovaná normální distribuce, Cumulative Frequency kumulativní četnost. Obr. 2: Postup transformace hodnot do normální distribuce. Pro transformaci jsou použity kumulativní četnosti (vlevo dole) histogramu (vlevo nahoře). Příklad transformace hodnoty 0,2: 1. zjištění kumulativní četnosti pro hodnotu 0,2, 2. odečtení odpovídající hodnoty distribuční funkce normovaného normálního rozdělení (vpravo dole) a odpovídající hodnoty (-0,949) (Deutsch 2002) Figure 2: Procedure for transforming values to normal score values. The histograms are shown at the top of the figure. The cumulative distributions, shown at the bottom, are used for transformation. To transform 0.2 value: 1. read the cumulative frequency corresponding to the 0.2 value, 2. go to the same cumulative frequency on the normal distribution and read the normal score value (-0.949) (Deutsch 2002) Tento proces je pro atribut obsah popela A d vybrané části dubňanské sloje jihomoravského lignitového revíru znázorněn na obr. 3 a pro jednu vybranou hodnotu obsahu popela je transformace tam do NNR demonstrována v tabulce 1 a transformace zpět z NNR v tabulce 2. 81

Tabulka 1: Příklad transformace - pro hodnotu 50 % A d do NNR Table 1: Example of transforming of ash content for value 50% A d to standardized normal distribution (SND/NNR) Transformovaná hodnota 50 % Ve třídě od [%]; [odpovídající empirická kumulativní četnost] Ve třídě do [%]; [odpovídající empirická kumulativní četnost] 49.89; 0.75 50.04; 0.7666667 Transformovaná hodnota 50 [%]; [odpovídající empirická kumulativní četnost] 50; 0,7622222 (lineární interpolace) Transformovaná hodnota (NNR) 0,7136670 Tabulka 2: Příklad transformace obsahu popela - pro hodnotu 50 % A d z NNR Table 2: Example of transforming of ash content for value 50 % A d from SND Transformovaná hodnota (NNR) 0,7136670 Distribuční funkce NNR Ve třídě od [empirická kumulativní četnost]; [odpovídající %] Ve třídě do [empirická kumulativní četnost]; [odpovídající %] 0,7136670 0.6744897; 49,89 0.7279133; 50.04 Zpětně transformovaná hodnota [%] 50,0000005 (lineární interpolace) 20 0,5 Četnost 15 10 0,4 0,3 0,2 5 0,1 0 14 22 30 38 46 54 62 70 Obsah popela [%] 0-3 -2-1 0 1 2 3 NNR 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0,7622222 0% 10 20 30 40 50 60 70 80 Obsah popela [%] 50 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,7622222 0-3 -2-1 0 1 2 3 0,7136670 Obr. 3: Postup transformace obsahu popela části dubňanské sloje JLR do normální distribuce a zpět Figure 3: Procedure for transforming ash content of apart of Dubňany coal seam in South Moravia lignite coalfield to normal distribution and back Tato grafická transformace je v podstatě přiřazení odpovídajících kvantilů dvou typů distribucí. Na obr. 3 kvantil q 0,7666667 původních hodnot obsahu popela (na obr. vlevo) odpovídá kvantilu q 0,7136670 NNR (na obr. vpravo). Kvantilová závislost mezi vzorky obsahu popela vybrané části sloje (původní hodnoty) a odpovídajícími hodnotami NNR je graficky zobrazena na obr. 4. 82

3 2 1 NNR 0 15 25 35 45 55 65 75-1 -2-3 Obsah popela [%] Obr. 4: Grafická závislost mezi obsahem popela (původní hodnoty) a odpovídajícími hodnotami NNR ze všech vstupních údajů Figure 4: Graphic dependence between ash content (original values) and corresponding SND values from all input data Technický popis realizace transformace Aplikace byla vyvíjena pomocí programovacího jazyka Microsoft Visual Basic 6.0 s využitím programových objektů programu Golden Surfer 8 a programu Microsoft Excel 2003. Vstupní data o vrtech ve formátu MS Excel obsahují tyto základní údaje lokalizaci vrtu v prostoru pomocí souřadnic souřadného systému JTSK (převedených do kartézské souřadné soustavy), název vrtu a hodnoty sledovaného ložiskového atributu (například obsahu popela). Vstupní údaje jsou seřazeny vzestupně podle zpracovávaného atributu a následně jsou dopočteny další hodnoty kumulativní četnost, relativní četnost a hodnota inverzní funkce k distribuční funkci NNR vypočítaná s pomocí funkce MS Excel NORMINV. V tabulce 3 je ukázka takto připravených vstupních údajů. Tabulka 3: Ukázka doplněných vstupních dat Table 3: Specimen of prepared input data X Y Nazev A d Kumul Relat NNR -570794-1205218 BP14 17.34 1 0.016667-2.12805-571964 -1205273 BP30 19.37 2 0.033333-1.83391-572959 -1204477 HB26 23.39 3 0.050000-1.64485-580679 -1204208 HB75 66.97 58 0.966667 1.833915-581762 -1208451 HB128 68.20 59 0.983333 2.128045-582528 -1207836 HB127 73.11 60 0.999000 3.090232 Na základě těchto vstupních údajů se vybranou interpolační metodou stanoví hodnoty sledovaného ložiskového atributu v pravidelné síti bodů tzv. gridu. Pro usnadnění výběru vhodné interpolační metody se v IPSHUL využívá modul tzv. bumerangové metody (Cross Validation), kdy se pro bod se stanovenou hodnotou provede výpočet lokálního odhadu z ostatních hodnot. Výsledkem je vypočtená hodnota v místě, kde známe skutečnou hodnotu. Můžeme tedy 83

stanovit chybu odhadu v tomto místě a následně pro všechny body (Deutsch 2002, Staněk 1999). Testování se provádí pro konečnou množinu interpolačních metod s různými parametry. Po výběru jedné z možných interpolačních metod (viz tabulka 4) jsou v zadané oblasti vytvořeny pomocí objektu GridData (Surfer) dva gridy: Grid A - na základě původních hodnot (sloupec A d obsah popela v tabulce 3), Grid B - na základě hodnot vypočtených pomocí funkce NORMINV (sloupec NNR v tabulce 3), přičemž jsou hodnoty takto vypočteného gridu následně pomocí zpětné transformace (viz tabulka 2) převedeny z NNR do původní distribuce. Tabulka 4: Interpolační metody implementované v programu Surfer [6] Table 4: Interpolation methods implemented within Surfer software [6] Hodnota parametru SrfGridAlgorithm (GridData) srfinversedistance srfkriging srfmincurvature srfshepards srfnaturalneighbor srfnearestneighbor srfregression srfradialbasis srftriangulation Popis Inverse Distance to a power Kriging Minimum Curvate Modified Shepard s Method Natural Neighbor Nearest Neighbor Polynomial Regression Radial Basis functions Triangulation with Linear Interpolation a) b) c) Obr. 5: Metoda inverzních vzdáleností a) grid vytvořený z původních hodnot, b) grid vytvořený z transformovaných hodnot, c) zobrazení gridu rozdílů absolutních hodnot gridů vytvořených z původních a transformovaných hodnot Figure 5: Inverse Distance to a Power gridding method - a) grid formed from original values, b) grid formed from transformed values, c) grid of differences of absolute values between grids formed from original values and of transformed values 84

Zajímavé je vizuální porovnání gridů A a B vytvořených stejnou interpolační metodou z původních, resp. transformovaných hodnot. Hodnoty odpovídajících vybraných gridů obsahu popela interpolovaných metodou inverzních vzdáleností z původních hodnot a hodnot převedených do NNR ukazuje prostorové zobrazení na obr. 5a a 5b. Absolutní hodnoty rozdílů těchto gridů jsou názorně zobrazeny na obr. 5c. Hodnoty odpovídajících vybraných gridů obsahu popela interpolovaných metodou kriging z původních hodnot a hodnot převedených do NNR ukazuje prostorové zobrazení na obr. 6a a 6b. Absolutní hodnoty rozdílů těchto gridů jsou názorně zobrazeny na obr. 6c. ; a) b) c) Obr. 6: Metoda krigování a) grid vytvořený z původních hodnot, b) grid vytvořený z transformovaných hodnot, c) zobrazení gridu rozdílů absolutních hodnot gridů vytvořených z původních a transformovaných hodnot Figure 6: Kriging method a) grid formed from original values, b) grid formed from transformed values, c) grid of differences of absolute values between grids formed from original and transformed values Závěr Empirické distribuce většiny veličin popisujících geologická tělesa nevyhovují běžně uvažovanému normálnímu rozdělení, ale mají distribuci asymetrickou. V článku je teoreticky popsáno, že pouze na základě správného popisu statistické distribuce zpracovávaných ložiskových údajů lze odhadnout statistické charakteristiky a realizovat následné zpracování. Jedním z možných postupů pro transformaci údajů do normální distribuce, která je, jak známo, základní podmínkou použití mnoha statistických a numerických postupů, je právě kvantilová grafická transformace vstupních údajů do normovaného normálního rozdělení. V článku je prezentováno programové řešení tohoto procesu při modelování uhelné sloje v Interaktivním programovém systému pro aplikaci moderních metod hodnocení uhelných ložisek a jejich dílčích částí v komplikovaných podmínkách (vyvíjeném na IGI HGF VŠB-TU Ostrava v rámci řešení projektu GA ČR č. 105/03/1417). Na příkladu tvorby gridu obsahu popela uhelné sloje jsou demonstrovány rozdíly interpolovaných hodnot s použitím kvantilové grafické transformace a bez jejího použití v případě, že je zjištěna 85

jiná než normální distribuce vstupních údajů. V grafických ukázkách je názorně demonstrováno, jaké nepřesnosti vznikají bez použití této transformace při modelování uhelné sloje. Poděkování Autor děkuje Grantové agentuře České republiky za podporu prací prezentovaných v tomto článku projektem reg. č. 105/03/1417. Acknowledgement The authors would like to thank to Grant Agency of ČR (GA ČR) for support of their research presented in this paper within project No 105/03/1417. Literatura [1] Deutsch, C., V., Journel, A., G.: GSLIB Geostatistical Software Library and User's Guide. Second Edition. New York, Oxford University Press, Oxford, 1998, 369 s. [2] Deutsch, C., V.: Geostatistical Reservoir modeling. Oxford, Oxford university press, 2002, 376 s. [3] Vizi, L., Timčák, G., M.: Význam štúdia lognormálného rozdelenia v geológii a baníctve. In Sb. věd. prací VŠB-TU Ostrava, řada hornicko-geologická, Ostrava, 1, 2002, s. 29-39. [4] Wellmer, F., W.: Statistical Evaluations in Exploration for Mineral Deposits. Berlin, Springer, 1998, 379 s. [5] Staněk, F.: Vliv výběru interpolační metody na přesnost výpočtu zásob uhelného ložiska. Věstník Českého geologického ústavu 74, 2, 1999d, s. 211-222. [6] Surfer 8 User s Guide. Golden (California, USA) : Golden Software, Inc., 2002, 640 s. Summary One of main tasks of statistical data analysis is to study the nature of statistical distribution. We need to describe a data distribution correctly to be able to estimate statistical parameters and to realise subsequent data processing. Use of normal distribution N(U;µ,σ 2 ) is often not relevant. Empirical distributions of quantities describing geological bodies are typically asymmetric (predominantly positively skewed). Many mathematical procedures can be applied only on normal distributed data. Without a correct approach to skewed data it is impossible to make for instance geostatistical analysis and assessments, because the best linear assessment is the one obtained from experimental values driven by Gauss distribution (see Vizi, Timčák, 2002). The question is what error would occur when modeling a raw material deposit (i.e. coal deposit) with non-transformed input data. For description of asymmetrically distributed quantities describing geological bodies we can apply various transformation methods, e.g. general logarithmic method v = ln(a+bu) leading to the frequently used general lognormal distribution LN(U: µ, σ 2, a, b). Its constants can be determined by minimization of skewness and kurtosis. This process is demonstrated schematically in Figure 1. A skewed distribution is indicated in Figure 1a with the most frequent mode value h, median value m, and arithmetic mean value x. Figure 1b indicates a frequency distribution of identical values after their logarithmic transformation. The peak of frequency curve is now represented by a median. If the distribution is lognormal, the median m is identical with logarithm of geometric mean γ. By β 2 we indicate the variance of logarithmized values. The lognormal distribution is only one among all the types of potential data distributions. There exists a way how to transform an arbitrary distribution into normal distribution and vice versa - application of so-called quantile (graphic) transformation of input data. If the input data set does not comply with the normal distribution, it can be transformed by means of the quantil transformation into a data set with a standardized normal distribution (SND) with a zero mean value and a standard deviation of value 1. This process is illustrated in Figure 2. Such transformation can be realized e.g. 86

with use of program nscore in geostatistical toolbox GSLIB (see Deutsch, Journel, 1998). This transformation is bilateral if the histogram does not contain so-called spikes - interpopulation constant values. These values have to be eliminated before the transformation takes place (see Deutsch, 2002). In case of modeling of coal seam the values of individual deposit attributes are interpolated from irregular deployed survey points into a regular grid. Because linear mathematical procedures are used, their input data should be normally distributed. That is why the quantile transformation of non-normally distributed input data into the normally distributed ones take place in program solution of Interactive software system for application of modern methods of evaluation of coal deposits and their individual parts under complicated conditions (IPSHUL). Subsequently interpolation with use of a selected interpolation method is performed and the grid values are transformed back, again by means of cumulated frequencies (empirical distribution functions). This process is represented in Figure 3 for the attribute of ash content A d of selected part of Dubňany coal seam in South Moravia lignite coalfield. Transformation of a single selected ash content value the hither into SND is demonstrated in Table 1 and the back transformation is demonstrated in Table 2. This quantile transformation is in fact an assigning of corresponding quantiles of two distribution types. In Figure 3 the quantile q 0.7666667 of original values ash content (in the left figure) corresponds to the quantile q 0.7136670 SND (in the right figure). The quantile dependence between samples of ash content from a chosen coal seam part (original values) and the corresponding SND values is graphically illustrated in Figure 4. The application was developed by means of programming language Microsoft Visual Basic 6.0 with use of program objects of Golden Surfer 8 software and of Microsoft Excel 2003 software. The input data of survey holes in MS Excel format contain spatial location of drill hole by means of co-ordinates of JTSK coordination system (transformed into Cartesian co-ordination system), name of survey hole, and values of observed deposit attribute (e.g. ash content). The input data are arranged in ascending order according to the processed attribute (e.g. ash content) and subsequently other values are calculated - cumulative frequency, relative frequency, and inverse function value of SND distribution function using function NORMINV of MS Excel. In Table 3 sample input data prepared in this way are shown. Based on such input data the values of observed deposit attribute are determined by a selected interpolation method in a regular grid. To make the selection of proper interpolation method in IPSHUL easier a module of so-called cross validation method is used. For each point with known value a local estimate from the other known values is calculated. The result is an estimate of the value in the point where the accurate value is also known. For all points with known values it is possible to compute the error of estimate (Deutsch, 2002; Staněk, 1999). Testing is applied on a finite set of interpolation methods with various parameters. After selection of one interpolation methods (see Table 4) the following two grids are formed in a considered area using GridData (Surfer) object: Grid A based on original values (column A d ash content - in Table 3), Grid B based on values calculated by means of NORMINV function (column NNR/SND in Table 3). The values of the grid calculated in this way are subsequently transformed from SND to original distribution by means of the back transformation (see Table 2). Let us make a visual assessment of grids A and B formed with use of the same interpolation method from original and transformed values, respectively. The values of corresponding grids of ash content interpolated by method of inverse distances from original values and from values transformed into SND are depicted in Figure 5a and Figure 5b, respectively. Absolute values of differences between these grids are depicted in Figure 5c. The values of corresponding selected grids of ash content interpolated with use of kriging method from original values and from values transformed into SND are shown in Figure 6a and Figure 6b, respectively. The absolute values of differences between these grids are depicted in Figure 6c. Empirical distributions of most quantities describing geological bodies do not comply with usually considered normal distribution, but they are asymmetric. We show that only based on correct description of statistical distribution of processed deposit data it is possible to estimate statistical characteristics and to realize a subsequent data processing. One of possible procedures for transforming data to normal distribution, which, as it is well-known, is a principal condition for applying many statistical and numerical procedures, is the quantile (graphic) transformation of input data to standard normal distribution and back to original distribution. 87

In the paper a program solution of this process is presented when modeling a coal seam within Interactive program system for application of modern methods of evaluation of coal deposits and their parts under complicated conditions (developed by IGI HGF VŠB-TU Ostrava within frame of solving GA ČR project N o 105/03/1417). Differences between values obtained with use of quantile transformation and values obtained without this transformation are shown on example of forming grid of ash content. It is shown graphically, which inexactitudes would arise without application of this transformation method when modeling a coal seam. Recenzenti: Prof. Ing. Gejza Timčák, Ph.D., FBERG, Košice, Doc. RNDr. Jarmila Doležalová, CSc., VŠB-TU Ostrava. 88