Úvod do kvantitativní lingvistiky. Radek Čech
|
|
- Matyáš Bartoš
- před 8 lety
- Počet zobrazení:
Transkript
1 Úvod do kvantitativní lingvistiky Radek Čech
2 Historie KL G. K. Zipf ( ) PLK B. Trnka (problematika těsnopisu) M. Těšitelová a kol. G. Altmann, R. Köhler, L. Hřebíček
3 Místo KL v lingvistice cíle lingvistiky (obecně) metody lingvistiky (obecně) předmět lingvistiky (obecně)
4 Základní rysy KL cílem nikoliv popis (klasifikace) jednotek jazykového systému, ale vytvoření modelu, jehož vlastnosti jsou založeny na empiricky testovatelných hypotézách lingvistika jako experimentální věda
5 KL (teorie) verbální formulace hypotézy + operacionalizace matematická formalizace experiment matematické vyhodnocení experimentu lingvistická explanace
6 Kvantitativní lingvistika Co je teorie? Jak poznat, která teorie je lepší než jiná? Plyne něco z teorie? Lingvistické teorie?
7 KL (teorie) verbální formulace hypotézy + operacionalizace matematická formalizace experiment matematické vyhodnocení experimentu lingvistická explanace
8 Kvantitativní lingvistika Co je hypotéza? Formální vlastností hypotézy? Lingvistické hypotézy
9 Hypotéza která tvrzení jsou/nejsou testovatelnými hypotézami? 1. hodně mužů má pleš 2. pokud se v knize vyskytují biblický příběh, je to apokryf 3. jestli se zavedou řidičáky na zkoušku, může se snížit nehodovost mladých řidičů a řidiček 4. muži mají častěji pleš než ženy 5. jestliže se je sloveso dokonavé, častěji se na něj váže přímý akuzativní předmět než na sloveso nedokonavé 6. ženy jsou citlivé 7. čím je slovo frekventovanější, tím je větší jeho polysémie 8. jestli se zavedou řidičáky na zkoušku, sníží se nehodovost mladých řidičů a řidiček 9. nářečí často ovlivňují podobu mluveného jazyka obyvatel dané nářeční oblasti
10 KL (teorie) verbální formulace hypotézy + operacionalizace matematická formalizace experiment matematické vyhodnocení experimentu lingvistická explanace
11 Kvantitativní lingvistika Operacionalizace vs. klasifikace Způsoby klasifikace jevů V(A) = V(B), nebo V(A) V(B). V(A) > V(B), nebo V(A) = V(B), nebo V(A) < V(B) V(A) V(B) = d
12 Operacionalizace je třeba jasně a jednoznačně definovat proměnné, mezi kterými se předpokládá závislost H: čím je slovo frekventovanější, tím je polysémnější v čem může být problém?
13 Operacionalizace je třeba jasně a jednoznačně definovat proměnné, mezi kterými se předpokládá závislost H: čím je slovo frekventovanější, tím je polysémnější frekvence: je třeba jasně uvést co se myslí slovem jak se budou počítat frekvence polysémie: je třeba uvést jak se bude polysémie kvantifikovat
14 Operacionalizace H: ženy mají větší pasivní slovní zásobu než muži jak definovat pasivní slovní zásobu?
15 Operacionalizace špatná operacionalizace znehodnocuje celou analýzu H: subjekt je v češtině v průměru delší než objekt Muž v triku veze naše dopisy pokuste se formulovat některé problémy s určováním délky
16 Operacionalizace špatná operacionalizace znehodnocuje celou analýzu H: subjekt je v češtině v průměru delší než objekt Muž v triku veze naše dopisy některé problémy s určováním délky: rozvitý vs. nerozvitý subjekt/objekt? počet slov? počet slabik? počet morfémů? je neslabičná předložka samostatným slovem? způsob měření ovlivňuje podobu výsledku!!!
17 KL (teorie) verbální formulace hypotézy + operacionalizace matematická formalizace experiment matematické vyhodnocení experimentu lingvistická explanace
18 Kvantitativní lingvistika Matematická formalizace vyjádření sledovaných vlastností čísly např. frekvenční distribuce, vztah mezi dvěma vlastnostmi atp.
19 Matematická formalizace hypotéza čím více morfo-fonetických změn se v daném tvaru slova projevuje (vzhledem k nominativu), tím menší je jeho frekvence zdůvodnění Minimisation of producing, encoding, memory effort (speaker) Minimisation of decoding, (hearer) the conserving effect of token frequency
20 Matematická formalizace počet změn f
21 KL (teorie) verbální formulace hypotézy + operacionalizace matematická formalizace experiment matematické vyhodnocení experimentu lingvistická explanace
22 Kvantitativní lingvistika Co je experiment? vlastnosti chyby replikace
23 KL (teorie) verbální formulace hypotézy + operacionalizace matematická formalizace experiment matematické vyhodnocení experimentu lingvistická explanace
24 Kvantitativní lingvistika Matematické vyhodnocení experimentu náhoda vs. mechanismus statistický test
25 Statistické testy významnosti testuje se pravděpodobnost toho, zda je pozorovaná závislost způsobena náhodou, či ne hod mincí (100x) pokud padne 50x panna a 50x orel, nepředpokládá se, že by někdo podváděl pokud padne 52x panna a 48x orel, nepředpokládá se, že by někdo podváděl padne-li však 98x panna, dá se předpokládat, že někdo podvádí a co když padne panna 59x nebo 60x nebo 61x nebo 62x?
26 Statistické testy významnosti dá se spočítat (srov. např. Greis 2010, s. 33nn), že pokud padne panna 61x, tak je větší než 95procentní pravděpodobnost, že jeden z hráčů podvádí jinými slovy: pravděpodobnost, že budeme neoprávněně tvrdit, že jeden z hráčů nepodvádí, je menší než 5procentní
27 Statistické testy významnosti porovnávají se dvě hypotézy nulová hypotéza: tvrzení, které obvykle deklaruje žádný rozdíl, tj. nalezený rozdíl je dán variablitou dat, náhodou (např. mince není falešná; mezi formou jazyka a četností užívaní bychom/bysme není rozdíl) alternativní hypotéza: situace, kdy nulová hypotéza neplatí, tj. mezi proměnnými se předpokládá závislost; důležité je přitom nějaké teoretické zdůvodnění
28 Statistické testy významnosti hladina významnosti pravděpodobnost, že se zamítne nulová hypotéza, ačkoliv ona platí obvykle 5 % (0,05) nebo 1 % (0,01)
29 Chí-kvadrát test dobré shody příklad: předpokládáme, že v románech se bude častěji používat nespisovná varianta slova bychom než v publicistických textech proměnnými jsou: a) typ textu; b) varianta slova H 0 : mezi typem textu a používáním nespisovné varianty slova bychom není žádný vztah H 1 : mezi typem textu a používáním nespisovné varianty slova bychom je vztah, tj. tato forma se častěji vyskytuje v próze
30 Chí-kvadrát test dobré shody SYN2005nov (romány) SYN2005pub (publicistika) bychom bysme % bysme 13,6 0,6 SYN2005nov (romány) SYN2005col (povídky) bychom bysme % bysme 13,6 8,2
31 Chí-kvadrát test dobré shody SYN2005nov (romány) SYN2005pub (publicistika) bychom bysme % bysme 13,6 0,6 p = 0, SYN2005nov (romány) SYN2005col (povídky) bychom bysme % bysme 13,6 8,2
32 Chí-kvadrát test dobré shody SYN2005nov (romány) SYN2005pub (publicistika) bychom bysme % bysme 13,6 0,6 p = 0, SYN2005nov (romány) SYN2005col (povídky) bychom bysme % bysme 13,6 8,2 p = 0,
33 Statistické testy významnosti někteří lingvisté (vesměs korpusoví) jsou přesvědčeni, že čím více dat máme k dispozici, tím lépe Sinclair: The more, the better! z hlediska použitelnosti statistických testů to však neplatí, srov. Rietvield T. et al.: Pitfalls in Corpus Research. Computers and the Humanities 38: , 2004.
34 Statistické testy významnosti romány novely Σ % novely konstrukce A ,09% konstrukce B ,93% Σ chi^2 = 5.43, p=0,020
35 KL (teorie) verbální formulace hypotézy + operacionalizace matematická formalizace experiment matematické vyhodnocení experimentu lingvistická explanace
36 Kvantitativní lingvistika popis vs. interpretace vs. explanace
37
38
39 Kvantitativní lingvistika International Quantitative Linguistics Association ( journals: Journal of Quantitative Linguistics ( e=njql20#.uytfjfl5om4) Glottotheory ( Glottometrics ( book series Quantitative Linguistics (de Gruyter) Studies in Quantitative Linguistics (RAM-Verlag)
40 Kvantitativní lingvistika
41 Děkuji za pozornost! (
Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami. reg. č.: CZ.1.07/2.2.00/
Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami reg. č.: CZ.1.07/2.2.00/28.0076 Úvod do kvantitativní lingvistiky Radek Čech Kvantitativní lingvistika co Vás napadne,
Úvod do kvantitativní lingvistiky. Radek Čech
Úvod do kvantitativní lingvistiky Radek Čech Historie KL G. K. Zipf (1902-1950) PLK B. Trnka (problematika těsnopisu) M. Těšitelová a kol. G. Altmann, R. Köhler, L. Hřebíček Místo KL v lingvistice cíle
Kvantitativní analýza textu (její nástrahy, meze, perspektivy) Radek Čech
Kvantitativní analýza textu (její nástrahy, meze, perspektivy) Radek Čech http://www.cechradek.cz Kvantitativní analýza textu kvantifikace a její důsledky kvantifikace a operacionalizace případ volby jazykových
MAL. one of the best corroborated law in linguistics
MAL one of the best corroborated law in linguistics proč se vo tom pořád dohadujete, když je to tak dobře dokázaný? proč se vo tom pořád dohadujete, když je to tak dobře dokázaný? hmm není to tak jednoduché,
Kvantitativní analýza žánrů. Radek Čech & Miroslav Kubát
Kvantitativní analýza žánrů Radek Čech & Miroslav Kubát Východiska 1. jazyk jako projev chování 2. jazykové chování ovlivněno pragmatickými faktory (kontextem) 3. některé kontexty se opakují a vykazují
Kvantitativní analýza textu. miroslav kubát FF OU Ostrava
Kvantitativní analýza textu miroslav kubát FF OU Ostrava Kvantitativní lingvistika Hledání zákonů v jazyce (např. MAL) Nalezení jazykové teorie. Korpusová lingvistika. Klasifikace textů, určování autorství
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Sociologický výzkum (stručný úvod) Michal Peliš
Sociologický výzkum (stručný úvod) Michal Peliš vědy exaktní X sociální tvrzení deterministického charakteru univerzální platnost experiment prokazování kauzality tvrzení pravděpodobnostního charakteru
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Frekvence Korelační analýza Jazykové zákony
Frekvence Korelační analýza Jazykové zákony EVJA miroslavkubat.webnode.cz Tematické okruhy ke zkoušce Empirický výzkum v jazykovědě. Kvantitativní a kvalitativní metody. Vzorek a populace. Testování vědeckých
SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní
ŘEŠENÍ PRAKTICKÝCH ÚLOH UŽITÍM SOFTWARE STAT1 A R Obsah 1 Užití software STAT1 1 2 Užití software R 3 Literatura 4 Příklady k procvičení 6 1 Užití software STAT1 Praktické užití aplikace STAT1 si ukažme
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
Projekt výzkumu v graduační práci
Projekt výzkumu v graduační práci Základní manuál Prof. PhDr. Beáta Krahulcová, CSc. Fáze výzkumu Přípravná, teoretická fáze (výsledek kumulovaného poznání,precizace výzkumného úkolu, formulace vědecké
GEN104 Koncipování empirického výzkumu
GEN104 Koncipování empirického výzkumu Hypotézy Proměnné Konceptualizace Operacionalizace Měření Indikátory Využity podklady Mgr. K. Nedbálkové, Ph.D. etapy výzkumu I Formulace problému (čtu, co se ví,
Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup
Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom
Pravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
JAK INTERPRETOVAT VÝZKUMNÁ DATA
JAK INTERPRETOVAT VÝZKUMNÁ DATA NA PŘÍKLADU KONKRÉTNÍHO KVANTITATIVNĚ ORIENTOVANÉHO VÝZKUMU prof. PhDr. Miroslav Chráska, CSc. Fakulta humanitních studií UTB ve Zlíně Základní znaky KVANTITATIVNĚ ORIENTOVANÉHO
Testy. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup
Statistika Testování hypotéz statistická indukce Neparametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by
Mgr. Radek Čech, Ph.D.
Mgr. Radek Čech, Ph.D. V letech 1992 1998 studoval na Pedagogické fakultě Univerzity Palackého v Olomouci český jazyk a občanskou výchovu. Na Filozofické fakultě téže univerzity vystudoval historii (1994
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Cvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte
Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
Náhodné (statistické) chyby přímých měření
Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně
formulujte hypotézy z následujících výzkumných problémů
HYPOTÉZY Hypotéza je tvrzrní (výrok) vyjařující vztah mezi proměnnými Hypotézy vychází z výzkumného problému. Hypotézy se stanoví na začátku výzkumu. Ne naopak. formulujte hypotézy z následujících výzkumných
Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11
Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce
Úvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Statistické metody v medicíně II. - p-hodnota
Statistické metody v medicíně II. - p-hodnota Martin Hynek Gennet, Centre for Fetal Medicine, Prague EuroMISE Centre, First Faculty of Medicine of Charles University in Prague p-hodnota p-value (p-level)
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
ČVUT FAKULTA DOPRAVNÍ
ČVUT FAKULTA DOPRAVNÍ 2011-2012 STATISTICKÝ PROJEKT STATISTICKÉ ZPRACOVÁNÍ DOTAZNÍKU 2 40 ROMAN VOKÁČ VALERIYA SIMBAEVA Obsah 1. Úvod...1 2. Plány studentů po maturitě...2 3. Volba vysoké školy...3 4.
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Testování hypotéz Biolog Statistik: Matematik: Informatik:
Testování hypotéz Biolog, Statistik, Matematik a Informatik na safari. Zastaví džíp a pozorují dalekohledem. Biolog "Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! " "Existují bílé
Výzkumný problém. Přednášky ze Základů pedagogické metodologie Kateřina Vlčková, PdF MU Brno
Výzkumný problém Přednášky ze Základů pedagogické metodologie Kateřina Vlčková, PdF MU Brno 1 Formulace výzkumného problému Výzkum musí začít vymezením výzkumného problému toho, co chceme řešit, které
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat
Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně
HYPOTÉZY. Kvantitativní výzkum není nic jiného než testování hypotéz. (Disman 2002, s. 76) DEDUKCE (kvantitativní přístup)
HYPOTÉZY Hypotéza není ničím jiným než podmíněným výrokem o vztazích mezi dvěma nebo více proměnnými. Na rozdíl od problému, který je formulován v podobě otázky explicitně, nebo implicitně vyjádřené, hypotéza
Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017
Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 207 Zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia
Dotazník výzkumného šetření. 2. Uveďte nejvyšší stupeň dosaženého vzdělání? základní střední bez maturity / vyučen střední s maturitou vysokoškolské
Přílohy Příloha A Dotazník výzkumného šetření 1. Jste v současné době v pracovním poměru? ano ne 2. Uveďte nejvyšší stupeň dosaženého vzdělání? základní střední bez maturity / vyučen střední s maturitou
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
2 ) 4, Φ 1 (1 0,005)
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
České vysoké učení technické v Praze Fakulta dopravní
České vysoké učení technické v Praze Fakulta dopravní Statistika (11SIS) Semestrální práce Akademický rok 2012/2013 Vypracovali: Veronika Kratochvilová, Antonín Volný skupina 2 36 Obsah Téma... 2 Grafická
Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016
Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016 Zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
Tematická koncentrace textu. Radek Čech
Tematická koncentrace textu Radek Čech Cíle pomocí kvantitativní textové analýzy odhalit ústřední téma textu (pokud existuje) zjistit tematickou sílu jednotlivých slov reprezentujících témata textu zjistit
LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR
LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Ve většině případů pracujeme s výběrovým souborem a výběrové výsledky zobecňujeme na základní soubor. Smysluplné
Pravděpodobnost a statistika (BI-PST) Cvičení č. 1
Pravděpodobnost a statistika (BI-PST) Cvičení č. 1 Katedra aplikované matematiky Fakulta informačních technologií České vysoké učení technické v Praze ZS 2014/2015 (FIT ČVUT) BI-PST, Cvičení č. 1 ZS 2014/2015
Fisherův exaktní test
Katedra pravděpodobnosti a matematické statistiky Karel Kozmík Fisherův exaktní test 4. prosince 2017 Motivace Máme kontingenční tabulku 2x2 a předpokládáme, že četnosti vznikly z pozorování s multinomickým
ZÁKLADNÍ METODOLOGICKÁ PRAVIDLA PŘI ZPRACOVÁNÍ ODBORNÉHO TEXTU. Martina Cirbusová (z prezentace doc. Škopa)
ZÁKLADNÍ METODOLOGICKÁ PRAVIDLA PŘI ZPRACOVÁNÍ ODBORNÉHO TEXTU Martina Cirbusová (z prezentace doc. Škopa) OSNOVA Metodologie vs. Metoda vs. Metodika Základní postup práce Základní vědecké metody METODOLOGIE
TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník Vypracovaly: Klára Habrová,
VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.
Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
Metodologie Kinantropologie
Metodologie Kinantropologie Sbírka studijních materiálů Mgr. Martin Sebera, Ph.D. Fakulta sportovních studií MU 2012 Doporučená literatura a zdroje Disman, M. Jak se vyrábí sociologická znalost. Eco, U.
Testování hypotéz. 4. přednáška 6. 3. 2010
Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
Stav a možná implementace DRG v zásadních otázkách
Stav a možná implementace DRG v zásadních otázkách? Ústav zdravotnických informací a statistiky ČR, Praha Řídící rada pro implementaci CZ-DRG 21.11. 2018 CO JSOU / BUDOU DRG UZNATELNÉ NÁKLADY? Bude rozsah
Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Očekávané výstupy z RVP Učivo Přesahy a vazby Dokáže pracovat se základními obecné poučení o jazyce (jazykové příručky)
Český jazyk a literatura - 6. ročník Dokáže pracovat se základními obecné poučení o jazyce (jazykové příručky) jazykovými příručkami Odliší spisovný a nespisovný jazykový projev Rozpozná nejdůležitější
Pravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké
Základy počtu pravděpodobnosti a metod matematické statistiky
Errata ke skriptu Základy počtu pravděpodobnosti a metod matematické statistiky K. Hron a P. Kunderová Autoři prosí čtenáře uvedeného studijního textu, aby případné další odhalené chyby nad rámec tohoto
KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica
KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica Vstupní data transformace před vložením Než data vložíme do tabulky ve Statistice, musíme si je předpřipravit. Označme si P Prahu, S Šumperk
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Bakalářský seminář - 3
- 3 JUDr. Ing. Otakar Schlossberger, Ph.D., vedoucí katedry financí VŠFS a externí odborný asistent katedry bankovnictví a pojišťovnictví VŠE Obsah: Postup při vypracování samotné závěrečné bakalářské
Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina , zapsala Veronika Vinklátová Revize zápisu Martin Holub,
ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina - 22. 3. 2018, zapsala Revize zápisu Martin Holub, 27. 3. 2018 I. Frekvenční tabulky opakování z minulé hodiny Frekvenční tabulka je nejzákladnější nástroj
Dynamic Development of Vocabulary Richness of Text. Miroslav Kubát & Radek Čech University of Ostrava Czech Republic
Dynamic Development of Vocabulary Richness of Text Miroslav Kubát & Radek Čech University of Ostrava Czech Republic Aim To analyze a dynamic development of vocabulary richness from a methodological point
7.1. Podstata testu statistické hypotézy
7. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 7.1. Podstata testu statistické hypotézy Statistická hypotéza určitý předpoklad o parametrech nebo tvaru rozdělení zkoumaného st. znaku. Testování hypotéz proces ověřování
Testování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Téma číslo 5 Základy zkoumání v pedagogice II (metody) Pavel Doulík, Úvod do pedagogiky
Téma číslo 5 Základy zkoumání v pedagogice II (metody) Pavel Doulík, Úvod do pedagogiky 1 Teoretická východiska empirického zkoumání pedagogických jevů. Typy výzkumů, jejich různá pojetí. Základní terminologie
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz DATA, VÝZKUM, ANALÝZY ve výzkumu se střídají fáze prozkoumávací
. Filozofické problémy přírodních věd Teorie a zákon. Lukáš Richterek. lukas.richterek@upol.cz. Podklad k předmětu KEF/FPPV
Filozofické problémy přírodních věd Teorie a zákon Lukáš Richterek Katedra experimentální fyziky PF UP, 17 listopadu 1192/12, 771 46 Olomouc lukasrichterek@upolcz Podklad k předmětu KEF/FPPV 2 / 10 Logické
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,