Využití pojmu Hilbertovy báze pro ověření hypotézy o shodnosti strukturálních a kombinatorických imsetů

Podobné dokumenty
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

10. Vektorové podprostory

Báze a dimenze vektorových prostorů

Lineární algebra : Metrická geometrie

Učební texty k státní bakalářské zkoušce Matematika Základy lineárního programování. študenti MFF 15. augusta 2008

1 Linearní prostory nad komplexními čísly

Matematika pro informatiky

6 Lineární geometrie. 6.1 Lineární variety

Základní pojmy teorie množin Vektorové prostory

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

1 Lineární prostory a podprostory

0.1 Úvod do lineární algebry

0.1 Úvod do lineární algebry

5. Lokální, vázané a globální extrémy

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

2. kapitola: Euklidovské prostory

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

(ne)závislost. α 1 x 1 + α 2 x α n x n. x + ( 1) x Vektoru y = ( 1) y říkáme opačný vektor k vektoru y. x x = 1. x = x = 0.

3 Lineární kombinace vektorů. Lineární závislost a nezávislost

1 Báze a dimenze vektorového prostoru 1

Matematika 2 pro PEF PaE

Lineární algebra : Báze a dimenze

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

FREDHOLMOVA ALTERNATIVA

7 Konvexní množiny. min c T x. při splnění tzv. podmínek přípustnosti, tj. x = vyhovuje podmínkám: A x = b a x i 0 pro každé i n.

Matematika B101MA1, B101MA2

9 Kolmost vektorových podprostorů

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

1. července 2010

NMAI059 Pravděpodobnost a statistika

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

maticeteorie 1. Matice A je typu 2 4, matice B je typu 4 3. Jakých rozměrů musí být matice X, aby se dala provést

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

ALGEBRA. Téma 5: Vektorové prostory

Úvod do teorie her

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

1 Vektorové prostory.

Matice lineárních zobrazení

Základy teorie množin

VĚTY Z LINEÁRNÍ ALGEBRY

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy

SVD rozklad a pseudoinverse

Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda

Lineární algebra : Polynomy

Věta o dělení polynomů se zbytkem

1 Řešení soustav lineárních rovnic

Dijkstrův algoritmus

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

Definice. Vektorový prostor V nad tělesem T je množina s operacemi + : V V V, tj. u, v V : u + v V : T V V, tj. ( u V )( a T ) : a u V které splňují

2. Schurova věta. Petr Tichý. 3. října 2012

Kolik existuje různých stromů na pevně dané n-prvkové množině vrcholů?

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Principy indukce a rekursivní algoritmy

Příklad z učebnice matematiky pro základní školu:

Věta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)

1 Kardinální čísla. množin. Tvrzení: Necht X Cn. Pak: 1. X Cn a je to nejmenší prvek třídy X v uspořádání (Cn, ),

Soustavy linea rnı ch rovnic

10 Přednáška ze

6.1 Vektorový prostor

1 Soustavy lineárních rovnic

Soustavy. Terminologie. Dva pohledy na soustavu lin. rovnic. Definice: Necht A = (a i,j ) R m,n je matice, b R m,1 je jednosloupcová.

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Lineární algebra : Skalární součin a ortogonalita

5 Orientované grafy, Toky v sítích

4EK201 Matematické modelování. 2. Lineární programování

1 Úvod do celočíselné lineární optimalizace

1 Projekce a projektory

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Matice. Předpokládejme, že A = (a ij ) je matice typu m n: diagonálou jsou rovny nule.

METRICKÉ A NORMOVANÉ PROSTORY

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

Lineární programování

Lineární algebra : Úvod a opakování

Derivace funkcí více proměnných

Matice. Je dána matice A R m,n, pak máme zobrazení A : R n R m.

To je samozřejmě základní pojem konvergence, ale v mnoha případech je příliš obecný a nestačí na dokazování některých užitečných tvrzení.

Zpracoval: 7. Matematická indukce a rekurse. Řešení rekurentních (diferenčních) rovnic s konstantními koeficienty.

IB112 Základy matematiky

[1] Vzhledem ke zvolené bázi určujeme souřadnice vektorů...

Západočeská univerzita v Plzni. Fakulta aplikovaných věd. Ivana Kozlová. Modely analýzy obalu dat

Stromové rozklady. Definice 1. Stromový rozklad grafu G je dvojice (T, β) taková, že T je strom,

Úlohy nejmenších čtverců

Báze konečněrozměrných vektorových prostorů, lineární zobrazení vektorových prostorů

[1] Definice 1: Polynom je komplexní funkce p : C C, pro kterou. pro všechna x C. Čísla a 0, a 1,..., a n nazýváme koeficienty polynomu.

Cyklické kódy. Definujeme-li na F [x] n sčítání a násobení jako. a + b = π n (a + b) a b = π n (a b)

Pavel Horák, Josef Janyška LINEÁRNÍ ALGEBRA UČEBNÍ TEXT

Parametrické programování

Vektorový prostor. Př.1. R 2 ; R 3 ; R n Dvě operace v R n : u + v = (u 1 + v 1,...u n + v n ), V (E 3 )...množina vektorů v E 3,

Pavel Horák LINEÁRNÍ ALGEBRA A GEOMETRIE 1 UČEBNÍ TEXT

α β ) právě tehdy, když pro jednotlivé hodnoty platí β1 αn βn. Danou relaci nazýváme relace

Matice. a m1 a m2... a mn

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

Arnoldiho a Lanczosova metoda

AB = 3 CB B A = 3 (B C) C = 1 (4B A) C = 4; k ]

4EK213 LINEÁRNÍ MODELY

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

Vlastní čísla a vlastní vektory

označme j = (0, 1) a nazvěme tuto dvojici imaginární jednotkou. Potom libovolnou (x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0) = x + jy,

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

Úloha - rozpoznávání číslic

Transkript:

Využití pojmu Hilbertovy báze pro ověření hypotézy o shodnosti strukturálních a kombinatorických imsetů Petr Šimeček, Milan Studený 2. září 2004 Abstrakt Klíčovým problémem v metodě popisu struktur podmíněné nezávislosti (mezi N náhodnými veličinami) pomocí tzv. imsetů je otevřená otázka shodnosti dvou množin celočíselných vektorů, tzv. strukturálních a kombinatorických imsetů. Tato otázka svoji povahou spadá do oblasti celočíselného programování a souvisí úzce s úlohou nalezení tzv. minimální celočíselné Hilbertovy báze pro jistý racionální konvexní kužel. Tématem tohoto příspěvku jsou počítačové experimenty, jejichž cílem je potvrdit či vyvrátit hypotézu o shodnosti těchto dvou množin vektorů. S pomocí počítače se podařilo hypotézu ověřit pro N 4, navíc byly dosaženy částečné výsledky pro N = 5 a nastíněny další možné směry postupu. Tento příspěvek se věnuje řešení klíčového problému z oblasti popisu struktur podmíněné nezávislosti (mezi N náhodnými veličinami) pomocí tzv. imsetů a to ověření hypotézy o shodnosti množin strukturálních a kombinatorických imsetů. Základní definice a většinu značení nalezne čtenář toužící po hlubším vhledu do problematiky v [1] a [2]. Zde se také nacházejí důkazy tvrzení, jež se nám zdály příliš zřejmé či naopak příliš obtížné na to, abychom je prezentovali v tomto příspěvku. 1 Základní pojmy Zde si připomeňme alespoň základní pojmy. Nechť N je přirozené číslo (odpovídající počtu náhodných veličin). Definice. Imsetem rozumíme zobrazení potenční množiny P({1, 2,..., N) do množiny celých čísel Z. Hodnotu imsetu v pro A {1, 2,..., N značíme v(a). Imset lze chápat také jako celočíselný vektor v R 2N, jehož složky jsou indexovány podmnožinami {1, 2,..., N. Definice. Elementárním imsetem odpovídajícím nezávislosti (nezávislostnímu vztahu) mezi náhodnými veličinami X i a X j dáno {X k ; k C, kde {i, {j a C jsou po dvou disjunktní podmnožiny {1, 2,..., N, budeme rozumět imset Práci na tomto příspěvku byla poskytnuta podpora z grantu GA ČR 201/04/0393. 1

u i,j C takový, že u i,j C ({i, j C) = u i,j C (C) = 1, u i,j C ({i C) = u i,j C ({j C) = 1 a zbylým prvkům potenční množiny přiřadí u i,j C nulu. Množinu všech elementárních imsetů budeme značit E N. Povšimněme si, že E N = ( N 2 ) 2 N 2. Například pro N = 3 množinu všech elementárních imsetů E 3 znázorňuje následující tabulka: {1 {2 {3 {1,2 {1,3 {2,3 {1,2,3 u 1,2 1 1 1 0 1 0 0 0 u 1,3 1 1 0 1 0 1 0 0 u 2,3 1 0 1 1 0 0 1 0 u 2,3 {1 0 1 0 0 1 1 0 1 u 1,3 {2 0 0 1 0 1 0 1 1 u 1,2 {3 0 0 0 1 0 1 1 1 Definice. Množinou kombinatorických imsetů C N budeme rozumět všechny možné součty konečně mnoha elementárních imsetů, neboli { k C N = α i u i ; α i N, u i E N, k N 0. Rozklad kombinatorického imsetu na součet elementárních imsetů není jednoznačný, například platí u 1,2 {3 + u 1,3 = u 1,3 {2 + u 1,2. Jednoznačný je však stupeň kombinatorického imsetu v = k α iu i, který je definován jako deg(v) = k α i, neboť toto číslo jak pozorný čtenář snadno nahlédne 1 je rovno výrazu deg(v) = 1 2 A {1,...,N A ( A 1) v(a). (1) Povšimněme si, že stupeň kombinatorického imsetu je lineární forma. Navíc pomocí formule (1) můžeme rozšířit definici stupně deg(v) na libovolný (nejen kombinatorický) imset v. Dále můžeme nahlédnout, že jediný kombinatorický imset stupně nula je nulový imset a kombinatorické imsety stupně jedna jsou právě elementární imsety. Definice. Množinou strukturálních imsetů S N budeme rozumět všechny imsety, jež lze vyjádřit jako nezápornou reálnou 2 kombinaci konečně mnoha elementárních imsetů, neboli { k S N = α i u i Z P({1,2,...,N) ; α i R +, u i E N, k N 0. 1 Stačí dokázat, rovnost (1) platí pro všechny elementární imsety, a ukázat, že takto definovaný stupeň je lineární forma. 2 Lze ukázat, že pokud slovo reálnou nahradíme slovem racionální, dostaneme ekvivalentní definici. 2

Stupeň strukturálního imsetu je celé číslo, jak je možno snadno nahlédnout z formule (1). Povšimněme si, že u imsetu nízkého stupně je poměrně snadné rozhodnout, zda je kombinatorický. Na druhé straně otázka, zda-li je či není strukturální, je mnohem obtížnější. I z tohoto, avšak nejen z tohoto důvodu 3 je zajímavá otázka, zda náhodou neplatí, že pro všechna N nastává rovnost C N = S N. Tento příspěvek si neklade za cíl tuto otázku teoreticky rozřešit. Pouze ji zodpovíme pro dostatečně nízká N a formulujeme tvrzení, jež mohou být základem dalšího bádání. Úhelným kamenem dalšího postupu bude pojem minimální celočíselné Hilbertovy báze. 2 Pojem minimální celočíselné Hilbertovy báze Definice. Každý konvexní kužel K v R n kónicky generovaný konečnou množinou celočíselných vektorů obsahuje tzv. minimální celočíselnou Hilbertovu bázi, což je množina celočíselných vektorů w 1,..., w m z K taková, že x K Z n (α 1,..., α m ) N m 0 : x = m α i w i. Tento pojem jsme přejali z knihy [4], kde je dokázáno, že tato definice je konzistentní, a tamtéž je na straně 233 v důkazu věty 16.4 ukázáno, že pokud e 1,..., e l jsou generátorem výše zmíněného kužele, pak minimální celočíselnou Hilbertovu bázi stačí hledat v mnohostěnu M tvořeném body { l M = λ i e i ; λ i [0, 1]. Pakliže výše zmíněnou metodu aplikujeme na náš případ, zjistíme, že otázka, zda C N = S N, je ekvivalentní s otázkou, zda minimální celočíselná Hilbertova báze kužele generovaného E N (jeho celočíselné body jsou S N ) je rovna E N (přičemž zjevně E N obsahuje). Protože rozhodnout, zda daný bod patří či nepatří do mnohostěnu M a tedy i nalézt všech body mnohostěnu M je v praxi obtížné, volíme postup pro nalezení Hilbertovy báze pro dané N následovně: 1. Zavedeme vhodný obal O mnohostěnu M. Vhodný v tomto kontextu znamená, že počítač dokáže rychle rozhodnout, zda daný imset do O patří či nikoli, a že dokáže v reálném čase prohledat všechny imsety v O obsažené. 2. Postupně volíme n od jedné do E N = ( N 2 ) 2 N 2. Procházíme všechny imsety z O mající stupeň n, u každého z nich rozhodneme, zda jej lze zapsat jako součet nějakého imsetu stupně n 1 (ty už máme vyhledané v minulém kroku a uložené v paměti) a nějakého elementárního imsetu. Pokud ano, pokračujeme, pokud ne, nalezli jsme prvek O, jehož zápis ve tvaru nezáporné celočíselné kombinace prvků E N je problematický. 3 Ověření této hypotézy má zásadní vliv na počítačovou implementaci inferenčního mechanismu. 3

3. Pokud algoritmus skončí a žádný problematický imset nenalezne, můžeme učinit závěr, že C N = S N. Pokud jej nalezne, nemusí být závěr jednoznačný, záleží na obalení mnohostěnu M pomocí O. Obtíže nastanou již u prvního bodu výše uvedeného scénáře. Pokud jako obal použijeme kužel generovaný prvky E N, můžeme tento popsat jako průnik jistých poloprostorů 4. Postup jejich hledání s využitím Fourier-Motzkinovy transformace za pomoci programu PORTA je popsán v [3]. Tento postup však díky jeho obrovské výpočetní složitosti můžeme použít jen pro N 5, kdy pro N rovno třem, čtyřem a pěti potřebujeme po řadě 5, 37 a 117 978 nadrovin udávajících výše zmíněné poloprostory. Proto se nadále budeme soustředit pouze na případ N 5. Tento kužel zcela jistě obsahuje mnohostěn M, přičemž můžeme jistě jako obal O brát pouze takové jeho imsety v, že A {1,..., N : v(a) deg(v). 3 Výsledky počítačových experimentů Dále rozebereme výsledky našeho výzkumu pro různá N: N = 3: Použili jsme výše zmíněný postup a v několika málo sekundách sekundách se podařilo ověřit, že C 3 = S 3. N = 4: Zde již bylo nutné postupovat mnohem opatrněji. Za prvé si lze všimnout, že pro libovolný strukturální imset v platí v(a) = 0, A {1,...,N a také že pro každé i {1,..., N platí A {1,...,N, i A v(a) = 0. Díky těmto dvěma vlastnostem stačí strukturální imset reprezentovat pomocí jeho hodnot pro A {1,..., N : A 2, neboť hodnoty pro A {1,..., N : A 1 jsou již těmito jednoznačně určeny. Tím se nám dimenze problému snižuje o N + 1, přičemž se nijak nekomplikuje výpočet stupně. Užitečné je též uvědomit si, že imsety z mnohostěnu M nabývají pro A {1,..., N : A = 2 hodnot od 4 do 2, pro A = 3 hodnot od 3 do 3 a pro A = 4 hodnot od 0 do 6. Stačí se tedy omezit se na takovéto imsety. Tato změna je o to významnější, že nám umožní změnit meze do sebe vnořených 11 = 2 4 (4 + 1) for cyklů. Dále je důležité vhodně zvolit datové typy, aby výpočet nebyl příliš náročný na paměť, a v bodě 2 výše zmíněného scénáře šikovně implementovat vyhledávání v imsetech stupně n 1 za pomoci jejich setřízení a hašovací tabulky, jinak 4 odvozených od jeho stěn nebo chcete-li od extremálních paprsků duálního kužele neboli tzv. skeletonu. 4

úloha neskončí v reálném čase. Zdrojový kód pro GNU Pascal je možné nalézt na adrese: http://5r.matfyz.cz/ctyri.pas. Výpočet na stroji Artax s procesorem Intel Pentium 4 HT 2800 MHz a 1 GB paměti trval 12 minut, přičemž bylo využito 530 MB operační paměti. N = 5: Zde jsme sice využili další zmenšení obalu O založené na tom, že každý strukturální imset v musí zjevně splňovat (v(a)) + 2 deg(v), (v(a)) 2 deg(v). A {1,...,N A {1,...,N A také, že pro libovolnou B {1,..., N musí platit v(a) 0, A: B A {1,...,N nicméně i při této redukci jsme byli schopni vyšetřit jen imsety stupně nejvýše čtyři, přičemž výpočet trval necelé tři dny. Program je k nahlédnutí na adrese http://5r.matfyz.cz/pet.tar.gz. 4 Myšlenka fixovaného stupně Nadějným směrem dalšího možného postupu je namísto obalování celého mnohostěnu M aproximovat průniky M s množinou imsetů daného stupně n. Lze totiž ukázat: Věta. Nechť v je strukturální imset stupně deg(v) = n z mnohostěnu { M = λ i e i ; λ i [0, 1], e i E N potom tento imset náleží i do mnohostěnu, jenž je konvexním obalem množiny všech součtů n různých elementárních imsetů neboli množiny { n B n = v = e i ; D E N, D = n. e i D Důkaz. Dokážeme nejprve pomocné tvrzení, že každý bod r rozměrné jednotkové krychle, jehož součet souřadnic je n N 0, je konvexní kombinací bodů z krychle o souřadnicích (s 1,..., s r ) takových, že i : s i {0, 1 a s 1 + s 2 + + s r = n. Pokud toto tvrzení platí, pak po dosazení r = E N, koeficienty λ i použité v M definují příslušný bod krychle a prohozením příslušných sum snadno nahlédneme požadovaný závěr. Pomocné tvrzení dokážeme indukcí podle r zároveň pro všechna přípustná n: pro r 2 tvrzení evidentně platí. Předpokládáme-li platnost tvrzení pro 5

všechna r < r, pak jeho platnost pro r (a libovolné n) dokážeme nejprve pro body na stěnách krychle. Vezměme si tedy libovolnou stěnu krychle, bez újmy na obecnosti tedy třeba tu s pevnou první souřadnicí s 1 = 0, respektive s 1 = 1. Tedy má-li mít bod na této stěně součet souřadnic n, musí být součet druhé až r té souřadnice roven n, respektive n 1, a indukční předpoklad nám zaručuje, že takovýto bod již bude požadovanou konvexní kombinací. Zbývá totéž dokázat o bodech uvnitř krychle. Ale každý takový bod je konvexní kombinací dvou bodů, pro něž platnost tvrzení již byla nahlédnuta. Vskutku ke každému ( bodu uvnitř ) krychle můžeme přičíst i odečíst vhodný násobek vektoru 1, 1 r 1,..., 1 r 1 tak, že dostaneme body ležící na stěnách krychle, z kterých lze tento bod nakombinovat. Problémem, na který opět narážíme, je obrovská výpočetní složitost. Ukazuje se, že asi nebude možné najít přesný popis konvexního uzávěru B n ve tvaru průniku poloprostorů, ale spíše nějakou jeho vnější aproximaci. 5 Závěr Podařilo se nám hypotézu, že C N = S N ověřit pro N 4. Problém pro N = 5 nadále zůstává otevřený a uvítáme náměty či rady, jak postupovat při jeho řešení. Zatím je známo pouze to, že pakliže existuje prvek minimální celočíselné Hilbertovy báze S 5 neobsažený v E 5, pak má tento prvek stupeň ostře vyšší než 4. Nadějné se zdá být hledání imsetů v mnohostěnech pro jednotlivé stupně, které však zatím naráží na příliš vysokou časovou náročnost. Reference [1] Studený M. (2001): On mathematical description of probabilistic conditional independence structures, doktorská práce, ÚTIA AV ČR. [2] Studený M. (2005): On Probabilistic Conditional Independence Structures, Springer. [3] Studený M., Bouckaert R.R., Kočka T. (2000): Extreme supermodular set functions over five variables, výzkumná zpráva číslo 1977, ÚTIA AV ČR. [4] Schrijver A., (1998): Theory of Linear and Integer Programming, John Wiley. 6