Využití teorie náhodných matic



Podobné dokumenty
Dyson s Coulomb gas on a circle and intermediate eigenvalue statistics

Teorie náhodných matic aneb tak trochu jiná statistika

Úvod do problematiky měření

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

You created this PDF from an application that is not licensed to print to novapdf printer (

Spektrální vlastnosti negaussovských náhodných matic

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

1. Přednáška. Ing. Miroslav Šulai, MBA

Pearsonův korelační koeficient

KGG/STG Statistika pro geografy

Regresní analýza 1. Regresní analýza

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

KORELACE. Komentované řešení pomocí programu Statistica

Přijímací zkouška - matematika

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Aplikace teoretických postupů pro ocenění rizika při upisování pojistných smluv v oblasti velkých rizik

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Jednofaktorová analýza rozptylu

KMA Písemná část přijímací zkoušky - MFS 2o16

Korelace. Komentované řešení pomocí MS Excel

KGG/STG Statistika pro geografy

Regresní a korelační analýza

1 Analytické metody durace a konvexita aktiva (dluhopisu) $)*

Vícerozměrné statistické metody

4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k?

Normální rozložení a odvozená rozložení

You created this PDF from an application that is not licensed to print to novapdf printer (

Jana Vránová, 3. lékařská fakulta UK

Statistická analýza jednorozměrných dat

Pravděpodobnost a aplikovaná statistika

vzorek vzorek

STATISTICKÉ ODHADY Odhady populačních charakteristik

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

INDUKTIVNÍ STATISTIKA

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Moderní aplikace statistické fyziky II - TMF050

Vlastnosti a modelování aditivního

Úvodem Dříve les než stromy 3 Operace s maticemi

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

, Brno Hanuš Vavrčík Základy statistiky ve vědě

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Kontingenční tabulky, korelační koeficienty

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Kontingenční tabulky, korelační koeficienty

Vzpěr jednoduchého rámu, diferenciální operátory. Lenka Dohnalová

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

POŽADAVKY K SOUBORNÉ ZKOUŠCE Z MATEMATIKY

Tomáš Karel LS 2012/2013

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Regresní a korelační analýza

Časové řady, typy trendových funkcí a odhady trendů

01MDS.

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Vybraná rozdělení náhodné veličiny

Testování hypotéz o parametrech regresního modelu

Požadavky k opravným zkouškám z matematiky školní rok

Testování hypotéz o parametrech regresního modelu

Stavový model a Kalmanův filtr

Optické spektroskopie 1 LS 2014/15

4. Aplikace matematiky v ekonomii

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

PRAVDĚPODOBNOST A STATISTIKA

S E M E S T R Á L N Í

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Porovnání dvou výběrů

Matematické modelování dopravního proudu

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Ilustrační příklad odhadu LRM v SW Gretl

Počítačové simulace fyzikálních problému TASEP

Ranní úvahy o statistice

4.2.3 ŠÍŘE FREKVENČNÍHO PÁSMA CHOROVÉHO ELEMENTU A DISTRIBUČNÍ FUNKCE VLNOVÝCH NORMÁL

Cyklické změny v dynamice sluneční konvektivní zóny

Časové řady, typy trendových funkcí a odhady trendů

České vysoké učení technické v Praze Fakulta jaderná a fyzikálně inženýrská OKRUHY. ke státním závěrečným zkouškám BAKALÁŘSKÉ STUDIUM

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Model pro simulaci staví na výpočtu hrubého domácího produktu výdajovou metodou:

Regresní a korelační analýza

Popisná statistika kvantitativní veličiny

Téma 22. Ondřej Nývlt

Simulace pohybu chodců pomocí celulárních modelů

Úvod do kvantového počítání

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Markovovy modely v Bioinformatice

Transkript:

Využití teorie náhodných matic Hana Srbová Fakulta jaderná a fyzikálně inženýrská, ČVUT Praha 17. 4. 2012

Obsah 1 Úvod 2 Chaos 3 Approach to financial cross-correlations 4 Analysis of Human EEG Data 5 Control of HIV infection

Využití teorie náhodných matic Statistika více proměnných Numerická analýza Teorie grafů Finanční korelace při dokonalé konkurenci Modelování dopravy a pohybu chodců Jaderná a kvantová fyzika Bezdrátová komunikace Šíření zvuku Studium lidského EEG Studium HIV

CHAOS IN ONE-DIMENSIONAL INTEGRABLE QUANTUM SYSTEM Šeba P., Vašata D.. Physics Letters A, Vol. 373 (2009), pp. 826 831.

Model Kvantová částice rozmístěna na kruhu s n bodovými interakcemi rozmístěnými na pozicích 0 < x 1 <... < x n < 2π Bodová interakce na počátku popsána hraničními podmínkami 1 α f (0 ) = f (0 + ), f (0 ) = f (0 + ), kde α (0, + ) je parametr

Model Hamiltonián systému je reprezentován jednorozměrným Laplaceovým operátorem a hraničními podmínkami: T α = d2 dx 2 f (2π ) = f (0 + ), f (2π ) = f (0 + ), (1) 1 α f (x k ) = f (x k+ ), f (x k ) = f (x k+ ). (2) Pozice bodových interakcí jsou x k = 2π p k pn+1, k = 1, 2,..., n, kde p k označuje k-té prvočíslo

Výsledky pro případ α = 1 Místo vlastních čísel E l = k 2 l, které jsou dvakrát degenerované, uvažujeme hodnoty e l = 2 k l Řešení: e 2l 1 = e 2l = 2l, l = 1, 2,... Definujeme-li rozestupy s l = e l+1 e l, je potom hustota pravděpodobnosti tvaru P(s) = (δ(s) + δ(s 2)) 2

Výsledky pro případ α 1 Popis systému se liší pro sudá a lichá vlastní čísla Rozestupy lichých vlastních čísel podléhají Wignerově distribuci blížící se distribuci P GOE P W (s) = π 2 s e πs2 /4 Distribuce rozestupů sudých vlastních čísel se nikdy nepřiblíží teorii náhodných matic

Obrázek: Srovnání hustoty pravděpodobnosti rozestupů s 2j 1 lichých vlastních čísel pro 47 bodových interakci, α = 1,001 a počet použitých rozestupů roven 1 10 5 s Wignerovou distribucí (plná čára) a přesným řešením GOE (hvězdy).

Obrázek: Srovnání hustoty pravděpodobnosti rozestupů sudých vlastních čísel pro 9 bodových interakci, α = 1,9 a počet použitých rozestupů roven 1 10 5 s Wignerovou distribucí (plná čára) a přesným řešením GOE (hvězdy).

Obrázek: Srovnání hustoty pravděpodobnosti rozestupů vlastních čísel pro model na přímce pro 9 bodových interakci, α = 1,8 a počet použitých rozestupů 1 10 5 s Wignerovou distribucí (plná čára) a přesným řešením GOE (hvězdy).

A RANDOM MATRIX THEORY APPROACH TO FINANCIAL CROSS-CORRELATIONS Plerou V., Gopikrishnan P., Rosenow B., Amaral L.A.N., Stanley H.E.. J. Phys. A: Statistical Mechanics and its Applications, Vol. 278 (2000), pp. 374 382.

Úvod do problematiky Analyzujeme 30-minutový výnos 1 000 největších US akcií v rozmezí dvou let 1994 1995 20 z největších vlastních čísel (2%) vykazují odchylky od RMT ukazují na vlastnosti specifické pro daný systém U zbylých určujeme korelační matici a testujeme rozestupy vl. čísel, abychom určili, zda jsou opravdu náhodné Rozestupy získáme ze vztahu s λ i+1 λ i, kde posl. λ i označuje rozbalená vlastní čísla seřazená podle velikosti

Výsledky Pro korelační matici C vypočtenou ze vztahu C ij = G ig j G i G j σ i σ j, kde G i je časový sled cenových fluktuací pro i-tou akcii i = 1,..., N a σ i = Gi 2 G i 2 byla prokázána shoda s reálnou symetrickou náhodnou maticí (či GOE maticí) Aplikace mnohem citlivějšího testu - rozptyl počtu vlastních čísel potvrdila shodu C s RMT

Problémy vyčíslení korelací Chybí algoritmus pro určení interakční síly mezi dvěma společnostmi (přestože by každá ze společností měla interagovat přímo či nepřímo, přesná povaha interakcí je neznámá) Korelace by neměly zahrnovat jen dvě společnosti, ale celý shluk Korelace C ij se mění v čase Pro každou akcii máme pouze konečný počet interakcí G ij, ze kterých tvoříme průměrnou korelaci mezi firmami i a j

Analýza vlastních vektorů Složky vlastních vektorů náhodné korelační matice jsou normálně rozloženy se střední hodnotou rovnou 0 a rozptylem 1 Největší vlastní číslo je silně negaussovské, má tendenci být z rovnoměrného rozdělení, což signalizuje, že všechny společnosti jsou navzájem propojeny Stabilita vlastních vektorů klesá směrem k hranici předpovědi RMT

Obrázek: Rozdělení složek vlastních vektorů.

Analýza výnosů a S&P 500 indexu G SP500 500 i=1 w ig i, kde G i jsou výnosy jednotlivých firem, w i S i / N j=1 S j, S i označuje trhové financování i-té společnosti Očekávání konvergence G SP500 ke Gaussovu rozdělení G i i G SP500 mají stejné asymptotické chování blížící se k 1 x 1+α, kde 1 + α 4 V případě promíchání času pro G i (t), pozorované chování mezi výnosy S&P 500 indexů již neplatí, což naznačuje existenci netriviálních korelací

Další zajímavosti Distribuce růstových sazeb firemních tržeb nezávisí na odvětví průmyslu ani na trhovém financování Šíře σ těchto distribucí klesá se zvyšujícím se S, σ(s) S β pro β 1/6 Podobné β objeveny také např. v případě, že za S byl zvolen počet zaměstnanců Obdobné statistické vlastnosti nalezeny i pro GDP (gross domestic product) či pro financování univerzitních výzkumů

RANDOM MATRIX ANALYSIS OF HUMAN EEG DATA Šeba P.. Phys. Rev. Lett., Vol. 91 (2003), 198104.

Záznamy 90 lidí nejprve v klidu, poté stimulovaných Měření elektrodami umístěnými na pokožku hlavy - některé měření pomocí 19 elektrod, některé pomocí 15 sestavení korelační matice Potvrzení očekávání, že spektrální analýza je závislá na jedinci, avšak některé rysy jsou společné Pro malá vl. čísla závisí od jedince, pro velká pozorován algebraický chvost zdánlivě individuální mozková aktivita obsahuje určitou hladinu synchronizace

Obrázek: Hustota vlastních čísel pro data získaná od 3 osob v klidu.

Seřazení vlastních čísel ξ n podle velikosti a definování rozestupů s n = ξ n+1 ξ n Rozdělení rozestupů shodné s Wignerovou distribucí P(s) Rozptyl počtu Σ 2 (L), kde L je počet po sobě jdoucích prvočísel, lze přibližně vyjádřit jako Σ 2 (L) 2 ( ) π 2 log(2πl) + 1,5772 π2 8 Při analýze vynechaná data s vlivy typu mrkání, pohyb jedince atd.

Obrázek: Hustota rozestupů pro jedince v klidu (křížky) a pro stimulovaní jedince (čtverce) srovnaná s Wignerovou formulí (plná čára).

Obrázek: Rozptyl počtu pro jedince v klidu (křížky) a pro stimulované jedince (čtverce) srovnaný s výše uvedenou aproximací.

EFFECTS OF THYMIC SELECTION OF THE T-CELL REPERTOIRE ON HLA CLASS I-ASSOCIATED CONTROL OF HIV INFECTION Košmrlj A., Read E.L., Qi Y., Allen T.M., Altfeld M., Deeks S.G.,Pereyra F., Carrington M., Walker B.D., Chakraborty A.K.. Nature, Vol. 465 (2010), pp. 350 354.

Úvod do biologických pojmů T-buňka imunitní buňka patřící ke skupině bílých krvinek TCR receptor T-buňky MHC (major histocompability complex) komplex, který vystavuje části proteinů T-buňce v případě, že se jedná o cizí proteiny, nastává imunitní reakce HLA (human leukocyte antigen) lidský MHC Mamu MHC makaků pmhc peptid MHC

Článek se skládá z těchto 4 částí: HLA-peptide binding predictions Thymic selection model and antigen recognition Host-pathogen interaction dynamics HLA-allele association with ability to control HIV

HLA-peptide binding predictions Peptidy odvozené od lidského proteomu dávaly v podstatě stejné výsledky jako náhodně generované peptidy Pro cca 10 7 jedinečných peptidů odvozených od lidského proteomu máme tyto výsledky: 7 10 4 se naváže na HLA-B*5701 imunitní reakce 18 10 4 se spojí s HLA-B*0701 imunitní reakce nenastává Využité metody: Artificial neural networks (ANN) Stabilized matrix method (SMM)

Obrázek: Pravděpodobnost, s kterou se repertoár T-buňky spojí určitou interakční silou s peptidy viru. Konkrétní repertoár T-buňky rozpozná peptidu viru, když vazebná síla překročí poznávací práh (přerušovaná čára).

Host-pathogen interaction dynamics Koeficient šíření řetězce viru pochází z rovnoměrného rozdělení mezi 0 2 000 nových buněk viru za den. Interakce volné energie mezi T-buňkou daného klonotypu a zbytkem viru na určeném epitopu je náhodná veličina z rovnoměrného rozdělení, přičemž šířka tohoto rozdělení určuje, jaká je pravděpodobnost, že daná T-buňka rozpozná peptid viru. Rozdělení repertoárů T-buněk se blíží k normálnímu rozdělení interagujících energií. Rozdílnosti ve vzájemném působení mezi antigenem a imunitním receptorem jsou kromě virové šiřitelností zachycené ve veličině σ ij, jejíž rozdělení je zobrazené viz následující obrázek.

Obrázek: Model generování prvků σ ij matice popisující rozpoznání pmhc T-buňkou. Stupeň reaktivity v simulacích závisí na rovnoměrném rozdělení, ze kterého jsou náhodně vybrány interakční síly mezi jednotlivými pozůstatky epitopů a TRC (vpravo).

Děkuji za pozornost.