Jazyky a počítač: překážky a možnosti. Eva Hajičová MFF UK Praha
|
|
- Václav Procházka
- před 9 lety
- Počet zobrazení:
Transkript
1 Jazyky a počítač: překážky a možnosti Eva Hajičová MFF UK Praha
2 Historický pohled 1947: Warren Weaver, dekódování 1949: memorandum Translation 1952: první konference o SP, USA 1954: Georgetown Univ., R A, 250 slov, Paul Garvin 1955: začátek výzkumu SP v Evropě i v Rusku
3 Warren Weaver v dopise Norbertovi Wienerovi: When I look at an article in Russian I say: This is really written in English but it has been coded in some strange symbols. I will now proceed to decode it. Březen 1947
4 Historický pohled 1949: memorandum Translation 1947: Warren Weaver, dekódování 1952: první konference o SP, USA 1954: Georgetown Univ., R A, 250 slov, Paul Garvin 1955: začátek výzkumu SP v Evropě i v Rusku
5 Historický pohled (pokr.) 1957: Noam Chomsky: Syntactic Structures 1959: vznik O(AL)TSP na FF UK, Praha 1960: A Č, SAPO 1960: Yoshua Bar-Hillel: FAHQMT not possible 1963: Funkční generativní popis (Petr Sgall) 1965: ALPAC Report 1976: METEO, Montréal
6 SAPO přeložil první českou větu 1957: SAPO, A. Svoboda, VÚMS 1960: The consonants have not by far been investigated to the same extent as the vowels. Souhlásky zdaleka nebyly prozkoumány do stejné míry jako samohlásky.
7 Historický pohled (pokr.) 1957: Noam Chomsky, Syntactic Structures 1959: vznik O(AL)TSP na FF UK, Praha 1960: A Č, SAPO 1960: Yoshua Bar-Hillel: FAHQMT not possible 1963: Funkční generativní popis (Petr Sgall) 1965: ALPAC Report 1976: METEO, Montréal
8 Černá kniha 1965: Automatic Language Processing Advisory Committee Doporučení: Nesledovat utilitární přístup, ale soustředit se na vědecké otázky (computational linguistics), které mohou dát dobrý podklad pro budoucí engineering enterprises (např. SP)
9 Historický pohled (pokr.) 1957: Noam Chomsky, Syntactic Structures 1959: vznik O(AL)TSP na FF UK, Praha 1960: A Č, SAPO 1960: Yoshua Bar-Hillel: FAHQMT not possible 1963: Funkční generativní popis (Petr Sgall) 1965: ALPAC Report 1976: METEO, Montréal
10 Počítačové zpracování PJ význam analýza syntéza vstup výstup
11 Zpracování mluvené řeči 1969: izolované rozpoznávání slov porovnávání vzorových obrazů 1975: souvislá řeč, statistické metody - IBM Tangora, Sphinx 1995: úspěšné komerční aplikace Dragon Naturally Speaking, technologie pro ViaVoice Po roce 2000: TU Liberec, ZČU Plzeň
12 Souvislá mluvená řeč a statistické metody Jelinek F., Bahl L.R., Mercer R.L.: Design of a Linguistic Statistical Decoder for the Recognition of Continuous Speech by Statistical Methods, IEEE Transactions 1975 Baker J.K.: The DRAGON System An Overview. IEEE Transactions, 1975 Jelinek F.: Continuous Speech Recognition by Statistical Methods, Proc. of IEEE, 1976
13 Zpracování mluvené řeči 1969: izolované rozpoznávání slov porovnávání vzorových obrazů 1975: souvislá řeč, statistické metody - IBM Tangora, Sphinx Po roce 2000: TU Liberec, ZČU Plzeň 1995: úspěšné komerční aplikace Dragon Naturally Speaking, technologie pro ViaVoice
14 Potřebujeme lingvistiku? Whenever I fire a linguist our system performance improves Fred Jelinek, 1988 Some of my best friends are linguists Fred Jelinek, Zampolli Award speech, 2004
15 Co je počítačová lingvistika? Martin Kay, schůzka v Rand Corporation 1965: Computational linguistics Mechanolinguistics Automatic language data processing Natural language processing
16 Co je počítačová lingvistika? (2) Computational linguistics is trying to do what linguists do in a computational manner, not trying to process text, by whatever methods, for practical purposes Martin Kay, 2006 Ale vědní obory ( komputační ) mají své aplikace good engineering requires good science
17 Lingvistické aspekty počítačové lingvistiky Formální popis přirozeného jazyka Strukturní lingvistika nabízí dva modely: Frázový (americký deskriptivismus) N. Chomsky, generativní (transformační) gramatika Závislostní ( kontinentální ) v Evropě už od 1836, Becker, Tesnière (PLK) Funkční generativní popis (P. Sgall)
18 Porovnání základních syntaktických koncepcí Dnes zasedá Valné shromáždění Učené společnosti celý den. <Dnes {zasedá [(Valné shromáždění) (Učené společnosti)] (celý den)}>
19 Závislostní struktura věty zasedá dnes shromáždění den Valné společnosti celý Učené
20 Závislostní struktura věty vrcholový strom podmínka projektivity
21 Pražská škola: funkční pohled Aktuální členění věty je relevantní pro význam věty: Česky se mluví na Moravě. Na Moravě se mluví česky. O víkendech pracuji na své dizertaci. Na své dizertaci pracuji o víkendech. Dobrá zpráva: Češi udělali revoluci. Špatná zpráva: Revoluci udělali Češi.
22 Hloubková (podkladová) struktura věty Podobnosti mezi jazyky v hloubkové stavbě nápadnější i důležitější než jejich odlišnosti studium hloubkové struktury N. Chomsky: language acquisition Principy vrozené, parametry nastavené podle okolí
23 Jádro a periferie Jádro: projektivní strom s jedním vrcholem Predikát a jeho argumenty Blízko k lineárnímu řetězu Struktura pro člověka zřejmě přirozená
24 Jádro a periférie (2) Periférie složitá, velká oblast Jednotlivé vrstvy periférie např. od různých vzorů ve skloňování apod. až po jednotlivé výjimky jít, jdu, šel víceslovná pojmenování (vysoká škola) slovosledné varianty i porušení projektivity v povrchové podobě věty
25 Víceznačnost jazyka (a) homonymie (jeden výrazový prostředek odpovídá více významům, funkcím) (b) vágnost (jeden význam, ale vágní) (a) Nemocnice obviňuje ministerstvo z toho, že (b) Teď se už můžeme radovat. (v tomto okamžiku?, v naší době?)
26 Příklady homonymie Nemocnice obviňuje ministerstvo, že (i) nedostala včas příslušné finance. (ii) čerpají prostředky nehospodárně. kdo koho obviňuje? Pravopis: Slepice honily holuby. Slepice honili holubi. kdo koho honil?
27 Příklady homonymie komentoval spisovatel Arnošt Lustig skutečnost, že mu Karel Gott odmítl schválit text už hotového knižního rozhovoru a navrhl, aby celou knihu napsali od začátku. komentoval spisovatel Arnošt Lustig skutečnost, že mu Karel Gott odmítl schválit text už hotového knižního rozhovoru, a navrhl, aby celou knihu napsali od začátku.
28 Víceznačnost v mluvené řeči
29 Víceznačnost v mluvené řeči Student: I didn t sleep all week, but I finished the paper for that conference in Italy Prof. Smith: HUH??? What conference? Student: UM I-I thought you said if I finished these texts early you would pay for fees, passage and room in Pisa for the meeting Prof. Smith: Uh, no I said I d pay for a cheese, sausage and mushroom pizza for eating.
30 Možnosti Velké naděje na počátku (tisk!) 2001: Vesmírná Odysea, HAL: I m sorry, Dave, I m afraid I can t do that. Vědci, lingvisté rezervovaní Hledání metod: metody založené na pravidlech nevedly rychle k cíli statistické metody
31 Statistické metody jako východisko Warren Weaver v Memorandu 1949: ruský text vidí jako zakódovaný anglický text, překlad jako vyluštění kódu Claude Shannon (1948) engineering perspective : kritickou charakteristikou sdělení je pravděpodobnost, s jakou je sdělení vybráno z různých množin alternativ, nikoliv vlastní obsah sdělení
32 Aplikace v automatickém rozpoznávání souvislé řeči Najít posloupnost slov w 1,n, která maximalizuje součin P(a w 1,n ). P(w 1,n ) P(a w 1,n ) = pravděpodobnost toho, že akustický signál je a, jestliže tou posloupností je w 1,n (akustický model) P(w 1,n ) = pravděpodobnost posloupnosti w 1,n (jazykový model)
33 Pro a proti: Saffran et al., Science 1996: osmiměsíční dítě je schopno naučit se rozčleňovat plynulý tok řeči na slovní segmenty ACL 1990: 39 přednášek o parsingu, z toho 1 statistický ACL 2003: 62 ku 48 Problém nedostatečných dat (sparse data) Zkušenost lingvistů: přirozený jazyk je komplexní systém a realizace v textech nedává postačující informaci, abychom textům rozuměli
34 Názorový vývoj: Od bigramů a trigramů ke struktuře věty, dokonce i k hloubkové struktuře Lingvistická intuice spojená se schopností extrahovat informaci z textů určí strukturu modelů a jejich parametrizaci Spolehnutí na radu lingvistů při vytváření jazykových zdrojů
35 Vytváření jazykových korpusů 1967: Brown Corpus, Henry Kučera 1970: Lancaster-Oslo-Bergen Corpus 1982: morfologické značkování (Lancaster) : treebank (syntaktické struktury), Lancaster 1992: UPenn treebank : British National Corpus
36 Vytváření korpusu češtiny Od 2. pol. 80. let: Počítačový fond češtiny 1994: založen Ústav Českého národního korpusu (FF UK, Fr. Čermák) 1997: projekt Prague Dependency Treebank 2000: zveřejněn SYN2000 (100 mil.slov) Dnes: k dispozici PDT 2.0 (3 úrovně, dokumentů, vět, (výskytů) slov) v bance ČNK k dispozici texty o 300 mil. slov Pražský mluvený korpus, Brněnský mluvený korpus aj.
37 Příklad na závěr: Multilingual Access to Large Spoken Archives (MALACH) od r Řešitelé projektu: IBM Thomas J. Watson Research Center University of Maryland Johns Hopkins University, Baltimore, USA Karlova univerzita v Praze (ÚFAL MFF UK) Západočeská univerzita v Plzni
38 Základ projektu: Shoa Visual History Foundation (dnes: Univ. of South California Shoa Foundation Institute for Visual History) Kulturní dědictví, Steven Spielberg hodin digitalizovaných interviews 32 jazyků mluvčích (přeživších, zachránců, svědků) Česko 566, Slovensko 656, USA , Israel 8.504, Ukrajina 3.433, Polsko 1.438,
39 Cíl projektu: (a) automatické rozpoznávání řeči (b) počítačem podporovaný překlad (tezaurus) (c) prostředky pro zpracování přirozeného jazyka k automatické tvorbě metadat (d) podpora pro účinnou katalogizaci (e) podpora pro vyhledávání a využití informace
40 Dobrý příklad spojení vědeckého výzkumu s konkrétními úkoly! Doklad, že V. Jamek (Vesmír, únor 2006) nemá pravdu, když píše, že: názorovou absencí, alibismem a hodnotovou rozbředlostí se vyznačují vědy, které mají člověka a společnost přímo v popis práce, obory společenské a humanitní. Lingvistika (nejen počítačová) si je vědoma své odpovědnosti za budoucnost země a lidstva
Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105
Korpusová lingvistika 2 Mgr. Dana Hlaváčková, Ph.D. CJBB105 Vývoj korpusové lingvistiky raná korpusová lingvistika, počítačová lexikografie, frekvenční studie (90. léta 19. st. 50. léta 20. st.) předěl
Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.
Korpusová lingvistika a počítačová Od 60. let 20. st. Raná korpusová lingvistika (konec 19. st 50. léta 20. st., Early corpus linguistics) strukturalistická tradice, americký deskriptivismus, metody založené
Korpusová lingvistika a počítačové zpracování přirozeného jazyka
Korpusová lingvistika a počítačové zpracování přirozeného jazyka Vladimír Petkevič & Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze Korpusový seminář
Strukturovaný životopis
Strukturovaný životopis Mgr. Magdaléna Rysová Osobní informace E-mail: magdalena.rysova@post.cz WWW: https://ufal.mff.cuni.cz/magdalena-rysova Vzdělání od 2012 FF UK v Praze: doktorské studium, obor Český
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
PSNÍ Jazyk Úroveň utor Kód materiálu nglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-psa-20 Z á k l a d o v ý t e x t : ear Thomas, I 1 like to apologize for what I did yesterday and explain why
CSCI 599 MACHINE TRANSLATION
CSCI 599 MACHINE TRANSLATION 11-1-11 11:00 1 INSTRUCTORS David Chiang Liang Huang Kevin Knight 2 LANGUAGES ON THE WEB 3 LANGUAGES ON TWITTER 4 LANGUAGES IN LA 5 WHY DO WE NEED MT? 6 WHY DO WE NEED MT?
NLP & strojové učení
NLP & strojové učení Miloslav Konopík 2. dubna 2013 1 Úvodní informace 2 Jak na to? Miloslav Konopík () NLP & strojové učení 2. dubna 2013 1 / 13 Co je to NLP? NLP = Natural Language Processing (zpracování
On the Structure of Constituent Negation in Czech
On the Structure of Constituent Negation in Czech Kateřina Veselovská veselovska@ufal.mff.cuni.cz Institute of Formal and Applied Linguistics Faculty of Mathematics and Physics Charles University in Prague
Budějovice Název materiálu: Reported Speech. Datum (období) vytvoření: Srpen 2013. Autor materiálu: PhDr. Dalibor Vácha PhD. Zařazení materiálu:
Projekt: Příjemce: Budějovice Název materiálu: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova
Indexace audiovizuálních archivů s využitím metod automatického rozpoznávání řeči a obrazu
Indexace audiovizuálních archivů s využitím metod automatického rozpoznávání řeči a obrazu Jan Švec, Pavel Ircing NTIS - Nové technologie pro informační společnost Katedra kybernetiky Fakulta aplikovaných
Životopis Duben 2008
Jan Hajič Životopis Duben 2008 Osobní údaje: Narozen 4.11.1960 v Praze, r.č. 601104/0981 Bydliště: Nosická 12/2389, 100 00 Praha 10 Rodinný stav: ženatý, 2 děti Kontakt: hajic@ufal.mff.cuni.cz, tel. 607
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Mgr. Milena Kašová aj5-mas-kas-pos-18 Z á k l a d o v ý t e x t : Mark: Is this your photo album, Kate? Kate: Yes, it is. Mark: Can I have
Koncepce rozvoje Ústavu teoretické a komputační lingvistiky FF UK na období Úvod
Koncepce rozvoje Ústavu teoretické a komputační lingvistiky FF UK na období 1. 2. 2016 31. 1. 2019 1. Úvod Ústav teoretické a komputační lingvistiky FF UK (dále ÚTKL) byl založen roku 1990 prof. PhDr.
Anglický jazyk. Souslednost časů. Anglický jazyk. Vytvořil: Eva Burianová. www.ssgbrno.cz. Souslednost. DUM číslo: 9. Souslednost časů.
www.ssgbrno.cz Vytvořil: Eva Burianová Souslednost Název tohoto časů DŮM Souslednost Strana: 1 Škola Ročník Název projektu Číslo projektu Číslo a název šablony Autor Tematická oblast Název DUM 3. - 4.
TVORBA JAZYKOVÉHO MODELU ZALOŽENÉHO NA TŘÍDÁCH
TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky a mezioborových inženýrských studií TVORBA JAZYKOVÉHO MODELU ZALOŽENÉHO NA TŘÍDÁCH Autoreferát dizertační práce Jindra Drábková Liberec 2005 Tvorba jazykového
PLIN041 Vývoj počítačové lingvistiky Algebraická lingvistika. Mgr. Dana Hlaváčková, Ph.D. od 2. pol. 50. let 20. st.
PLIN041 Vývoj počítačové lingvistiky Algebraická lingvistika Mgr. Dana Hlaváčková, Ph.D. od 2. pol. 50. let 20. st. Algebraická lingvistika matematika algebra logika formální logika logická analýza jazyka
Jazyky a jazykové technologie v České republice. Tomáš Svoboda Jan Hajič
Jazyky a jazykové technologie v České republice Tomáš Svoboda Jan Hajič 1 Kolik jazyků máme v ČR? Jeden úřední jazyk (čeština) Skutečnost je složitější Turistika Obchod a mezinárodní komerční aktivity
VY_32_INOVACE_06_Předpřítomný čas_03. Škola: Základní škola Slušovice, okres Zlín, příspěvková organizace
VY_32_INOVACE_06_Předpřítomný čas_03 Autor: Růžena Krupičková Škola: Základní škola Slušovice, okres Zlín, příspěvková organizace Název projektu: Zkvalitnění ICT ve slušovské škole Číslo projektu: CZ.1.07/1.4.00/21.2400
P(w i w 1 w 2...w i 1 ) = P(w 1...w i ) P(w 1...w i ) = P(w 1 ) P(w 2 w 1 ) P(w 3 w 1 w 2 )... P(w i w 1...w i 1 ) slova w i
n-gramy a textové korpusy n-gramy Pavel Rychlý, Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Úkol: Je zadáno n slov textu, jaké slovo následuje s největší pravděpodobností? Obsah:
Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT
Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM Číslo projektu: CZ.1.07/1.5.00/34.0536 Název projektu školy: Výuka s ICT na SŠ obchodní České Budějovice Šablona
Projekt Malach dokončen. Archiv nahrávek zpřístupní knihovna MFF UK
Projekt Malach dokončen. Archiv nahrávek zpřístupní knihovna MFF UK Projekt Malach dokončen. Archiv nahrávek zpřístupní knihovna MFF UK Název mezinárodního projektu Malach vznikl zkrácením spojení Multilingual
Faktorované překladové modely. Základní informace
Základní informace statistická metoda překladu statistická metoda překladu založena na frázích (nikoliv slovo slovo) statistická metoda překladu založena na frázích (nikoliv slovo slovo) doplňková informace
Automatická post-editace výstupů frázového strojového překladu (Depfix)
Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj (WMT 2010):
PSANÍ. I am looking 4 to seeing you and please let me know if you are going to come.
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-psa-12 Z á k l a d o v ý t e x t : 1 Alex I am writing to you to let you know that I am leaving to Australia
PLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno. Mgr. Dana Hlaváčková, Ph.D.
PLIN041 Vývoj počítačové lingvistiky Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno Mgr. Dana Hlaváčková, Ph.D. Korpusová lingvistika v ČR lexikografické počátky 1988 Iniciativní skupina pro
ve strojovém překladu
Jaká data se používají ve strojovém překladu Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/39 Osnova Typy dat ve strojovém
EU peníze středním školám digitální učební materiál
EU peníze středním školám digitální učební materiál Číslo projektu: Číslo a název šablony klíčové aktivity: Tematická oblast, název DUMu: Autor: CZ.1.07/1.5.00/34.0515 III/2 Inovace a zkvalitnění výuky
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Kamila Hejlíková aj5-usk-hej-pos-03.doc Z á k l a d o v ý t e x t : Mum is coming home and she is talking with her son Jack: Mum: Hello,
POSLECH. Anglický jazyk 9. třída Mgr. Martin Zicháček. Jazyk Úroveň Autor Kód materiálu. Z á k l a d o v ý t e x t :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-pos-20 Z á k l a d o v ý t e x t : Caren: High Wings, Caren speaking, how can I help you? John: Hello,
Rekonstrukce standardizovaného textu z mluvené řeči
Rekonstrukce standardizovaného textu z mluvené řeči Marie Mikulová, Zdeňka Urešová Příspěvek shrnuje dosavadní poznatky získané při budování Pražského závislostního korpusu mluvené češtiny (Prague Dependency
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Anglický jazyk
POSLECH. Kate and Jim are friends. It's Thursday afternoon and they are talking about their free time activities.
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Markéta Zakouřilová aj5-jen-zak-pos-03 Z á k l a d o v ý t e x t : Kate and Jim are friends. It's Thursday afternoon and they are talking
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-psa-19 Z á k l a d o v ý t e x t : Hi Kate, I am sending greetings from London. We got here yesterday. Our
POSLECH. Cinema or TV tonight (a dialogue between Susan and David about their plans for tonight)
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Zora Smolková aj9-jes-smo-pos-01 Z á k l a d o v ý t e x t : Cinema or TV tonight (a dialogue between Susan and David about their plans
Výukový materiál zpracovaný v rámci projektu EU peníze do škol. illness, a text
Výukový materiál zpracovaný v rámci projektu EU peníze do škol ZŠ Litoměřice, Ladova Ladova 5 412 01 Litoměřice www.zsladovaltm.cz vedeni@zsladovaltm.cz Pořadové číslo projektu: CZ.1.07/1.4.00/21.0948
KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská. 13. 2. 2013 Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!
KORPUSOVÝ WORKSHOP VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT! Václav Cvrček, Lucie Chlumská 13. 2. 2013 Univerzita Karlova v Praze O (Ú)ČNK Ústav Českého národního korpusu, založen v roce
NLP zpracování přirozeného jazyka
NLP zpracování přirozeného jazyka Miloslav Konopík 14. května 2013 1 Úvod 2 Motivace 3 Příklady úloh 4 Kouzlo velkých dat 5 Výpočet Miloslav Konopík ( NLP zpracování přirozeného jazyka 14. května 2013
Zásadní gramatické struktury (pro SOU) Michal Kadlec, Dis
Zásadní gramatické struktury (pro SOU) Michal Kadlec, Dis PŘEDPŘÍTOMNÝ ČAS PRŮBĚHOVÝ VY_32_INOVACE_AK_2_12 OPVK 1.5 EU peníze středním školám CZ.1.07/1.500/34.0116 Modernizace výuky na učilišti Název školy
Depfix: Jak dělat strojový překlad lépe než Google Translate
Rudolf Rosa rur@nikdeeu http://ufalmffcunicz/rudolf-rosa Depfix: Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované
Automatická post-editace výstupů frázového strojového překladu (Depfix)
Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj: All the winners
Common Language Resources and Their Applications
Common Language Resources and Their Applications http://clara.b.uib.no/ Markéta Lopatková Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze formální rámec
VŠEOBECNÁ TÉMATA PRO SOU Mgr. Dita Hejlová
VŠEOBECNÁ TÉMATA PRO SOU Mgr. Dita Hejlová VZDĚLÁVÁNÍ V ČR VY_32_INOVACE_AH_3_03 OPVK 1.5 EU peníze středním školám CZ.1.07/1.500/34.0116 Modernizace výuky na učilišti Název školy Název šablony Předmět
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Hana Vavřenová aj5-rie-vav-psa-03 Z á k l a d o v ý t e x t : M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u : Tematická
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Mgr. Milena Kašová aj5-mas-kas-pos-01 Z á k l a d o v ý t e x t : Carl is for the first time in a new school. The teacher is asking Carl.
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-pos-01 Z á k l a d o v ý t e x t : After a Christmas holiday two friends are chatting at a school hall
Aplikace matematiky. Dana Lauerová A note to the theory of periodic solutions of a parabolic equation
Aplikace matematiky Dana Lauerová A note to the theory of periodic solutions of a parabolic equation Aplikace matematiky, Vol. 25 (1980), No. 6, 457--460 Persistent URL: http://dml.cz/dmlcz/103885 Terms
Předmět:: Anglický jazyk
7 rozumí jednoduchým pokynům a otázkám učitele, které jsou sdělovány pomalu a s pečlivou výslovností 10 se zapojí do jednoduchých rozhovorů 7 rozumí jednoduchým pokynům a otázkám učitele, které jsou sdělovány
The Czech education system, school
The Czech education system, school Pracovní list Číslo projektu Číslo materiálu Autor Tematický celek CZ.1.07/1.5.00/34.0266 VY_32_INOVACE_ZeE_AJ_4OA,E,L_10 Mgr. Eva Zemanová Anglický jazyk využívání on-line
Umělá inteligence pro zpracování obrazu a zvuku
Umělá inteligence pro zpracování obrazu a zvuku Jan Švec honzas@ntis.zcu.cz Kontakt: Jan Švec honzas@ntis.zcu.cz jan.svec@speechtech.cz www.linkedin.com/in/jansvec Katedra kybernetiky ZČU v Plzni Katedra
Korpus pro automatické rozpoznání českých slov v anglickém mluveném projevu
Korpus pro automatické rozpoznání českých slov v anglickém mluveném projevu Ondřej Cífka, Ondřej Bojar Ústav formální a aplikované lingvistiky, MFF UK Korpusová lingvistika Praha, 17. září 2016 1 / 18
Just write down your most recent and important education. Remember that sometimes less is more some people may be considered overqualified.
CURRICULUM VITAE - EDUCATION Jindřich Bláha Výukový materiál zpracován v rámci projektu EU peníze školám Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Bc. Jindřich Bláha. Dostupné z Metodického
Primární modální slovesa CAN COULD (modál) I could play the piano. You could play the piano. He/She could play the piano. We could play the piano.
past modals Primární modální slovesa CAN COULD (modál) I could play the piano. You could play the piano. He/She could play the piano. We could play the piano. You could play the piano. They could play
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Kamila Hejlíková aj5-usk-hej-pos-02 Z á k l a d o v ý t e x t : The Browns are on their holiday in Italy. They arrived to the Four Gardens
vydáno 1. června 2015 Součásti SZZK podle výběru studenta se koná na jednom, nebo na druhém oboru
OBECNÁ LINGVISTIKA (NAVAZUJÍCÍ MAGISTERSKÉ STUDIUM) STÁTNÍ ZÁVĚREČNÉ ZKOUŠKY vydáno 1. června 2015 Součásti SZZK (I) Obhajoba diplomové práce podle výběru studenta se koná na jednom, nebo na druhém oboru
Uvod Modely n-tic Vyhodnocov an ı Vyhlazov an ı a stahov an ı Rozˇ s ıˇ ren ı model u n-tic Jazykov e modelov an ı Pavel Smrˇ z 27.
Jazykové modelování Pavel Smrž 27. listopadu 2006 Osnova 1 Úvod motivace, základní pojmy 2 Modely n-tic 3 Způsob vyhodnocování 4 Vyhlazování a stahování 5 Rozšíření modelů n-tic 6 Lingvisticky motivované
IA161 Pokročilé techniky zpracování přirozeného jazyka
IA161 Pokročilé techniky zpracování přirozeného jazyka Strojový překlad Vít Baisa Překlad angličtina čeština Moses is an implementation of the statistical (or data-driven) approach to machine translation
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u : My family, my hobbies Present simple and continuous, Wh- questions
PSNÍ Jazyk Úroveň utor Kód materiálu nglický jazyk 5. třída Eva Prokšová j5-doc-pro-psa-01 Z á k l a d o v ý t e x t : Dear Johny, My name s Pavel Novák and I m twelve years old. I m from Prague which
Výukový materiál zpracovaný v rámci projektu EU peníze do škol. Test
Výukový materiál zpracovaný v rámci projektu EU peníze do škol ZŠ Litoměřice, Ladova Ladova 5 412 01 Litoměřice www.zsladovaltm.cz vedeni@zsladovaltm.cz Pořadové číslo projektu: CZ.1.07/1.4.00/21.0948
Going to aneb Pl anuji, ˇ ze seknu s pl anov an ım. Luk aˇs R uˇ ziˇ cka 2013 Luk aˇ s R uˇ ziˇ cka Going to
aneb Plánuji, že seknu s plánováním. 2013 Vyjadřování budoucnosti Angličtina nemá žádný gramatický budoucí čas, tak jak ho známe z jiných jazyků. Pomáhá si tedy různými gramatickými konstrukcemi, které
n-gramy Jazykové modely a textové korpusy n-gramy pokrač. Markovovy modely Obsah: se dostanou na trh... Jazykové modely Co to je korpus?
n-gramy a textové korpusy n-gramy Pavel Rychlý, Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Úkol: Je zadáno n slov textu, jaké slovo následuje s největší pravděpodobností? Obsah:
Informace o písemných přijímacích zkouškách. Doktorské studijní programy Matematika
Informace o písemných přijímacích zkouškách (úplné zadání zkušebních otázek či příkladů, které jsou součástí přijímací zkoušky nebo její části, a u otázek s výběrem odpovědi správné řešení) Doktorské studijní
Obsah: Organizace předmětu IB030. Situace na FI MU
Úvod do počítačové lingvistiky Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Obsah: Organizace předmětu IB030 Situace na FI MU Úvod do počítačové lingvistiky 1/11 1 / 20 Organizace
Zásadní gramatické struktury (pro SOU) Michal Kadlec, Dis
Zásadní gramatické struktury (pro SOU) Michal Kadlec, Dis PŘEDPŘÍTOMNÝ ČAS PROSTÝ VY_32_INOVACE_AK_2_11 OPVK 1.5 EU peníze středním školám CZ.1.07/1.500/34.0116 Modernizace výuky na učilišti Název školy
Náhradník Náhradník 5.A
5. (Testovací klíč: XVUFOKXS) Počet správně zodpovězených otázek Počet nesprávně zodpovězených otázek 0 23 Poslech Čtení s porozuměním Slovní zásoba Gramatika Konverzace 04 02 08 07 02 Obecná škola Otázka
VY_22_INOVACE_CJ_III/2.21
Kód DUM : Škola: Číslo projektu: Název projektu: Název šablony: Název materiálu: Autor materiálu: VY_22_INOVACE_CJ_III/2.21 Základní škola a Mateřská škola Dobronín, příspěvková organizace, Polenská 162
DUM DIGITÁLNÍ UČEBNÍ MATERIÁL ANGLIČTINA. Mgr. Kateřina Kasanová
DUM DIGITÁLNÍ UČEBNÍ MATERIÁL ANGLIČTINA Mgr. Kateřina Kasanová PRO VYJÁDŘENÍ PRAVDĚPODOBNOSTI SEKUNDÁRNÍ MODÁLNÍ SLOVESA základní informace must be must have been can t be can t have been may, might,
http://www.zlinskedumy.cz
Číslo projektu Číslo a název šablony klíčové aktivity Tematická oblast Autor CZ.1.07/1.5.00/34.0514 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Výklad a cvičení z větné stavby, vy_32_inovace_ma_33_01
Mzdy na ÚFALu
Mzdy na ÚFALu 2009 4.5.2009 1 Mzdové tabulky UK Univerzitní mzdové tabulky (předpis UK) Nespadají po státní systém (odměňování státní správy) Třída ~ tarifní rozpětí, plus osobní ohodnocení Akademické
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Anglický jazyk
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-pos-08 Z á k l a d o v ý t e x t : Helen: Hey Mike. What a surprise. Where are you going? To the airport?
Zachycení (nejen) koordinací v závislostních stromech
Zachycení (nejen) koordinací v závislostních stromech Markéta Lopatková ÚFAL MFF UK atural language syntax: Treebanks text corpora, esp. treebanks tens of languages stress on morphology, syntax manual
11/ Podmínkové věty. ( 1st Conditional) VY_32_INOVACE_AJ_UMA11,Podmínkové věty (1st Conditional).notebook. January 28, 2014
Úroveň jazyka Pre-Intermediate 11/ Podmínkové věty ( 1st Conditional) Citace a zdroje Zpracovala: Mgr.Alena Závorová 1 Podmínkové věty typu 1 ( First Conditional ) Vedlejší věty podmínkové vyjadřují podmínku,
Malach: zpracování audiovizuálního archívu svědectví přeživších holocaustu
Malach: zpracování audiovizuálního archívu svědectví přeživších holocaustu Pavel Pecina pecina@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky, MFF UK NMI 2015, Praha Vše začalo v roce 1993 filmem
Výukový materiál zpracovaný v rámci operačního programu Vzdělávání pro konkurenceschopnost
Výukový materiál zpracovaný v rámci operačního programu Vzdělávání pro konkurenceschopnost Registrační číslo: CZ.1.07/1. 5.00/34.0084 Šablona: II/2 Inovace a zkvalitnění výuky cizích jazyků na středních
PSANÍ. My room is a mess. Anglický jazyk. Hana Vavřenová
PSNÍ Jazyk Úroveň utor Kód materiálu nglický jazyk 5. třída Hana Vavřenová aj5-rie-vav-psa-04 Z á k l a d o v ý t e x t : My room is a mess M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e
Řešitelský kolektiv Finanční požadavky Finanční výhled na další roky Rozšiřující informace Přílohy. Role Celé jméno Typ odměny
Detail projektu Řešitelský kolektiv Finanční požadavky Finanční výhled na další roky Rozšiřující informace Přílohy Základní informace o projektu č. 1572314 Český název projektu: Modelování závislostní
20/ Řeč přímá a nepřímá
Úroveň jazyka Pre-Intermediate ( 1. 2. ročník ANJ jako první jazyk, středně pokročilí studen&) 2.sada (nebo 3. - 4. ročník - ANJ jako druhý jazyk, středně pokročilí studen&) 20/ Řeč přímá a nepřímá Citace
Číslo projektu: CZ.1.07/1.5.00/34.0036 Název projektu: Inovace a individualizace výuky
Číslo projektu: CZ.1.07/1.5.00/34.0036 Název projektu: Inovace a individualizace výuky Autor: Mgr. Libuše Matulová Název materiálu: Education Označení materiálu: VY_32_INOVACE_MAT27 Datum vytvoření: 10.10.2013
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost. Projekt MŠMT ČR Číslo projektu Název projektu školy Klíčová aktivita III/2 EU PENÍZE ŠKOLÁM CZ.1.07/1.4.00/21.2146
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Markéta Zakouřilová aj9-jen-zak-psa-02 In the park (R reporter, B Bill) R: _1, may I ask you several questions? B: Yes, of course. R: What
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-pos-07 Z á k l a d o v ý t e x t : Margaret: Hi Eric. Eric: Oh, hi Margaret. How are you doing? Margaret:
kolektiv Anglictina.com Angličtina pro samouky
kolektiv Anglictina.com Angličtina pro samouky a věčné začátečníky Computer Press, a.s. Brno 2009 Angličtina pro samouky a věčné začátečníky KOLEKTIV AUTORŮ ANGLIČTINA.COM Computer Press, a. s., 2009.
Hodnocení výukového programu tlumočnictví znakového jazyka na HiOA. Metodika připravovaného výukového programu tlumočnictví znakového jazyka na MU
Hodnocení výukového programu tlumočnictví znakového jazyka na HiOA a Metodika připravovaného výukového programu tlumočnictví znakového jazyka na MU 1. Popis a zhodnocení norského studijního oboru Tlumočnictví
Compression of a Dictionary
Compression of a Dictionary Jan Lánský, Michal Žemlička zizelevak@matfyz.cz michal.zemlicka@mff.cuni.cz Dept. of Software Engineering Faculty of Mathematics and Physics Charles University Synopsis Introduction
Social Media a firemní komunikace
Social Media a firemní komunikace TYINTERNETY / FALANXIA YOUR WORLD ENGAGED UČTE SE OD STARTUPŮ ANALYSIS -> PARALYSIS POUŽIJTE TO, CO ZNÁ KAŽDÝ POUŽIJTE TO, CO ZNÁ KAŽDÝ POUŽIJTE TO, CO ZNÁ KAŽDÝ POUŽIJTE
Číslo materiálu: VY 32 INOVACE 29/18. Číslo projektu: CZ.1.07/1.4.00/
Číslo materiálu: Název materiálu: Ironic Číslo projektu: CZ.1.07/1.4.00/21.1486 Zpracoval: Mgr. Petra Březinová IRONIC 1. Listen to the song Ironic from the singer Alanis Morissette. For the first time
VY_12_INOVACE_02.14 1/9 1.2.02.14 Vyprávíme a překládáme příběh
1/9 1.2.02.14 Materiál je určen pro práci žáků 4. 5. ročníku v hodinách informatiky. Navazuje na učivo českého a anglického jazyka. 1. část Žáci dostávají v elektronické podobě první pracovní list obrázky
Archiv vizuální historie Institutu USC Shoah Foundation a možnosti jeho využití
Archiv vizuální historie Institutu USC Shoah Foundation a možnosti jeho využití INFORUM 2011: 17. konference o profesionálních informačních zdrojích Praha, 25. května 2011 Mgr. Jakub Mlynář (CVH Malach,
Střední škola obchodní, České Budějovice, Husova 9, VY_INOVACE_ANJ_741. Škola: Střední škola obchodní, České Budějovice, Husova 9
Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM Číslo projektu: CZ.1.07/1.5.00/34.0536 Název projektu školy: Výuka s ICT na SŠ obchodní České Budějovice Šablona
Chit Chat 2 - Unit 7. Lekce: STRANA 34. www.jazyky-bez-barier.cz - KNIHOVNA. Cvičení: SLOVÍČKA naučit. Cvičení: SLOVÍČKA rozumět
www.jazyky-bez-barier.cz - KNIHOVNA NÁHLED souboru / titulu Chit Chat - Unit 7 (ch_unit7.jbb) Chit Chat - Unit 7 Lekce: STRANA Cvičení: SLOVÍČKA naučit English angličtina Maths matematika It s nine o clock.
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost. Projekt MŠMT ČR Číslo projektu Název projektu školy Klíčová aktivita III/2 EU PENÍZE ŠKOLÁM CZ.1.07/1.4.00/21.2146
WELCOME TO THE CZECH REPUBLIC, SUMMER JOB
WELCOME TO THE CZECH REPUBLIC, SUMMER JOB writing skills Určeno studentům úrovně B1 / B2 Autor: Taťána Konečná Datum vytvoření: duben 2012 Ročník: 2. 4. ročník středních škol s maturitní zkouškou Klíčová
Výstupy z RVP Učivo Ročník Průřezová témata Termín Komunikační a slohová výchova 1. plynule čte s porozuměním texty přiměřeného rozsahu a náročnosti
Komunikační a slohová výchova plynule čte s porozuměním texty přiměřeného rozsahu a náročnosti 2. porozumí písemným nebo mluveným pokynům přiměřené složitosti 3. respektuje základní komunikační pravidla
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Anglický jazyk
Zásadní gramatické struktury (pro SOU) Michal Kadlec, Dis
Zásadní gramatické struktury (pro SOU) Michal Kadlec, Dis PŘÍTOMNÝ ČAS PRŮBĚHOVÝ VY_32_INOVACE_AK_2_04 OPVK 1.5 EU peníze středním školám CZ.1.07/1.500/34.0116 Modernizace výuky na učilišti Název školy
Chit Chat 2 - Lekce 1
www.jazyky-bez-barier.cz - KNIHOVNA NÁHLED souboru / titulu Chit Chat - Lekce (ch_lekce.jbb) Chit Chat - Lekce Lekce: STRANA Cvičení: SLOVÍČKA naučit I can / can t. Já umím / neumím. ski lyžovat skate
Revision P4 U8 VY_32_INOVACE_79
Revision P4 U8 VY_32_INOVACE_79 Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor: Anglický jazyk Ročník: 9. 1. It s possible that I will go to university. I might go to university. Perhaps
Info schůzka. 16-Jan-16 Open Day - Dept. of English 1
Info schůzka www.anglistika.upol.cz 16-Jan-16 Open Day - Dept. of English 1 Program Dne otevřených dveří na KAA průběžně: Letáčky a brožurky k rozebrání přízemí vpravo, místnost 1.59 (10.00-10.45: informační
Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,
Větná polarita v češtině Kateřina Veselovská Žďárek Hořovice, 27. 11. 2009 1 Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání