Workshop o paralelním korpusu InterCorp
|
|
- Miloslava Magdalena Němcová
- před 6 lety
- Počet zobrazení:
Transkript
1
2 Workshop o paralelním korpusu InterCorp Praha, Olga Richterová, ÚČNK
3 Český národní korpus (LM ; ) Ministerstvo školství, mládeže a tělovýchovy Projekty velkých infrastruktur pro VaVaI
4 10:00 11:00 PŘEHLED PROGRAMU Typy výzkumných otázek Typy dotazů, regulární výrazy Statistiky (frekvenční distribuce) 11:15 12:45 Pokročilé dotazy (CQL) Vytváření subkorpusů, podmínky within Kolokace, (třídění) 12:45 Oběd 14:15 Odpolední část programu
5 Co ne/stihneme Ukážeme si témata / cesty / tipy a triky Zodpovíme vaše dotazy Nestihneme všechna probíraná témata důkladně procvičit Tato prezentace bude posléze k dispozici V horizontu několika týdnů bude zpřístupněno nové webové rozhraní a posléze nový webový manuál pro práci s korpusy!
6 Pro a proti korpusového výzkumu Vzorek jazyka Data bez interpretace? Výhody korpusu oproti webu? reprezentativní vytvořený z pečlivě vybraných textů neměnný (referenční) po zveřejnění se nemění standardizovaný anotovaný opatřený dalšími informacemi
7 TYPY OTÁZEK
8 Typy výzkumných otázek Jaký jazyk nás zajímá? mluvený, psaný? publicistiky, beletrie nebo odborné literatury? překladový, původní? současný, historický? Výběr korpusu
9 Typy výzkumných otázek Jaký jev chceme hledat? konkrétní tvar odvozeniny od základu.*love.* slovo rýmující se s mírnyx dírnyx ([word=".*[iy](x ks)"]) všechny tvary jednoho slova ustálené slovní spojení/kolokaci další informace (z tagů: slovní druh, pád, čas, ) možnost výzkumu mnoha rovin jazyka Výběr dotazu
10 Co nám v současnosti umožňují zdrojová data? Jaký jazyk InterCorp umožňuje zkoumat? psaný, z století publicistický bez znalosti výchozího textu jazyk beletrie jazyk odborný právnické texty překladový / jazyk originálů Jevy podle zpracování konkrétního korpusu
11 TYPY DOTAZŮ
12 Začínáme vyhledávat
13 Začínáme vyhledávat
14 Typy dotazů se liší podle korpusu
15 Ne každý je lemmatizovaný
16 Přidávání paralelních korpusů
17 Přidávání dalších paralelních korpusů
18 Paralelní korpus zadání dotazu
19 Paralelní výsledky typ dotazu: podřetězec
20 Závislost typu dotazu na korpusu V lemmatizovaných korpusech je možné hledat konkrétní, použitý slovní tvar (word) např. kočce, běž, gelaufen, headings základní slovníkový tvar (lemma) např. kočka, běžet, laufen, heading V označkovaných (otagovaných) korpusech lze najít i morfologickou značku (tag) V anotovaných korpusech lze zadat i další podmínky
21 Typy dotazů typ dotazu s / bez RE (regulárních výrazů) počet slov další základní bez více zadáme-li tvar lemmatu, vyhledá celé paradigma lemma s jen 1 lze specifikovat sl. druh (stát jako sloveso) fráze s více konkrétní slovní tvary slovní tvar s jen 1 lze specifikovat sl. druh (při jako podst. jm. od pře)
22 Typy dotazů dokončení typ dotazu s / bez RE (regulárních výrazů) počet slov další podřetězec s 1 řetězec vyhledá např. mrsk všechny odvozeniny slov mrskat, mrsknout, smrsknout, Zámrsk, i překlepy typu mrskev CQL s umožňuje nejpřesnější dotazování a kombinaci různých kritérií více umožní zadat podmínky a dotázat se na libovolný počet pozic
23 Co jsou to regulární výrazy
24 Regulární výrazy: zástupné symboly a možnosti opakování Mohou se užívat ve všech typech dotazů kromě základního tečka (.) představuje jeden libovolný znak, interval ({n, k}) n až k opakování předchozího znaku nebo většího celku, hvězdička (*) libovolný počet (0 a více) opakování předchozího znaku nebo celku, tj. {0,} plus (+) 1 nebo více opakování předchozího znaku nebo celku, tj. {1,}
25 Regulární výrazy: možnosti opakování a logické operátory otazník (?) žádný nebo jeden výskyt předchozího znaku nebo celku, tj. {0,1} seznam ([]) alternativa, výběr jednoho libovolného znaku z těch, které jsou uvedeny uvnitř závorek svislá čára ( ) také alternativa, ne ovšem mezi jednotlivými znaky, ale celými řetězci tvořícími jednotku kulaté závorky libovolnou část výrazu je možné seskupit do kulatých závorek, vytvořit tak jistý celek a ovlivnit tím prioritu jeho vyhodnocování
26 Regulární výrazy a dotazovací jazyk Více informací k regulárním výrazům: Více informací k dotazovacímu jazyku (anglicky)
27 Vnitřní struktura korpusu Zjednodušené uspořádání dat v lemmatizovaném a tagovaném korpusu: slovní tvar (word) lemma tag (zkrácený) Když když J.* školení školení N..S4.* skončilo skončit V.*,, Z.* <s/>
28 Základní dotazy v novém rozhraní korpus SYN2010 Základní dotaz: vyhledejte prašivý pes a černá kočka. V čem se liší výsledky? Lemma: vyhledejte (tři tečky).+nést ra(ta)+ ps*t Slovní tvar: vyhledejte (tři tečky) při (a specifikujte slovní druh jako podstatné jméno)
29 Změna vybraného korpusu
30 Základní dotazy: nelemmatizovaný korpus Vyhledejte v korpusu ORAL2008 v typu dotazu Základní a?[nj]o v typu dotazu Slovní tvar a?[nj]o tuhle.+.*(dle hle)nc.*.*[dh]lenc.*
31 Shrnutí typů dotazů Existují různé typy dotazů, které většinou umožňují využívat zástupné symboly (tzv. regulární výrazy) Regulární výrazy nabízejí mnohem širší vyhledávací možnosti než pouhé řetězce písmen Nejpřesnější pokládání dotazů umožňuje dotazovací jazyk CQL
32 STATISTIKY / Frekvenční distribuce
33 Frekvenční distribuce ORAL2008
34 Frekvenční distribuce I Distribuce lemmat a zdrojový jazyk InterCorp EN: [lemma= s?he ] lemma absolutní frekvence podíl he ,7 % she ,3 % celkem % InterCorp EN: [lemma= s?he ], srclang= en lemma absolutní frekvence podíl he ,8% she ,2 % celkem %
35 Frekvenční distribuce II Porovnání s angličtinou SYN (CS): [lemma="ona?"] InterCorp CS: [lemma="ona?"] Nelze, v češtině ona lemmatizováno jako on Nebo přece...? Ukážeme si později. Je tomu stejně i u přivlastňovacích zájmen? Zkusme se zeptat na [lemma= je(ho jí) ]
36 Frekvenční distribuce III Projevuje se v distribuci přivlastňovacích zájmen v CS a EN typologický rozdíl mezi jazyky? Rozhodně je vidět rozdíl v tagování! lemma korpus abs. frekvence relat. frekvence his (DPS, PNP, UNC) (PP$) originál: his her (DPC, UNC, VVG) (PP$, PP) BNC InterCorp InterCorp EN BNC InterCorp jeho SYN její SYN
37 Pozor na skladbu korpusů Rozdíl mezi jazyky X rozdíl mezi text. typy/žánry? BNC a InterCorp jsou sestavené jinak! Nejvyšší frekvence v BNC: Imaginative: 7906 i.p.m.
38 Rozdílná distribuce v textových typech
39 POKROČILÉ DOTAZY
40 Dotazovací jazyk a uplatnění více podmínek na tutéž pozici (slovo) CQL (corpus query language): [atribut="hodnota"] logické operátory: & (zároveň), (nebo),! (negace) SYN2010: [lemma="on" & tag="p.f.*"] (tj. lemma "ona") i.p.m., nelze v InterCorp (CS) Intercorp (EN) homonymní tvary (states: tag N.* V.*) [word="states"&tag!="n.*"] výskytů, frekv. distrib. typy textu: seřadit dle i.p.m. EuroParl 42 i.p.m. (výskytů na milion) publicistika zprávy 34 i.p.m. próza 2 i.p.m.
41 Dotazovací jazyk a prázdná pozice [lemma="have"][][lemma="get"]
42 Dotazovací jazyk a prázdná pozice CQL a tokenizace Cokoli Určená pozice Určená pozice Určená pozice Dotaz [lemma="have"] [] [lemma="get"] Realizace we have n't got Realizace She had to get Realizace Republic has now got
43 Dotazovací jazyk a operátor rozsahu Tento dotaz: [lemma="have"][][lemma="get"] se rovná: [lemma="have"][]{1}[lemma="get"] Zkusme najít věty tázací: [lemma="have"][]{1,2}[lemma="get"][]+[word="\?"] omezí se vyhledávání na 1 větu?
44 Dotazovací jazyk
45 PODMÍNKY A SUBKORPUSY
46 Podmínky: v rámci jedné věty [lemma="have"][]{1,2}[lemma="get"][]+[word="\?"] within <s/>
47 Vyhledávání dle větné pozice Adverbiale na počátku věty v angličtině Chceme najít krátká příslovečná určení a jiná uvození v iniciální pozici anglických vět, oddělená čárkou (a vyloučit slovesné tvary): <s> [word!="v."]{1,2}[word="\,"] Stejně tak můžeme vyhledávat např. podstatná jména předcházející konci věty: [tag="n.*"] [] <s/>
48 Frekvenční distribuce a podmínky hledání interjekcí v jazyce konkrétního autora: [tag="i.*"] within <div author="milne.*" /> Jak zjistíme tag anglických interjekcí? nějakou zadáme a Frekv. distr > značky hey UH, NP, bump NN, VB, NP, VBP podobně: osobní zájmena v jazyce V. Woolf [lemma="s?he"] within <div author="woolf.*" /> pozor: i.p.m. (80 výskytů) vztaženo k celému korpusu!
49 Vytváření subkorpusů Subkorpus Vytvořit nový Vlastní within podmínka within <div author="woolf.*" /> tokenů Hledat v: Dostupné subkorpusy lemma she i.p.m. lemma he i.p.m.
50 Rozdíly: SYN( ) a InterCorp SYN: není-li u atributu srclang, (source language, zdrojový jazyk), uvedena žádná hodnota, jedná se o češtinu. Subkorpus obsahující pouze původně české, nepřekladové texty? SYN( ): within <srclang=""/> InterCorp: within <srclang="cs"/>
51 Další rozdíly: SYN( ) a InterCorp strukturní atributy: doc opus div autor author velká/malá písmena u zdroj. jazyka a jejich počet... en ENG
52 SYN, InterCorp a jazyk překladů SYN: po vytvoření subkorpusu s podmínkou zdrojového jazyka češtiny: [tag="i.*"]within <opus srclang="" /> můžeme porovnat např. s citoslovci v jazyce překladu: [tag="i.*"]within <opus srclang!="" /> Podobně v InterCorpu musíme dbát na směr překladu: u řady textů však neznáme zdrojový jazyk!
53 Tip: pozor na tagování Z rakouské němčiny přejatý výraz pro rychle: [lemma= kách ] (SYN2010, SYN) nalezneme např.: Ti druzí umřeli moc kách. Ale také nalezneme kách jako koncovku: Určete, ve které (ých) zkumavce (kách) vznikla sraženina! Proto nás zajímá kách jako adjektivum / adverbium: [tag="[ad].*"&word="kách"] tytéž výsledky
54 KOLOKACE
55 Kolokace důležitost parametrizace a volby konkrétní míry přímý p/n filtr 1. [lemma="nechat"], kolokace v pravém okolí (1-3 pozice) rozdíly v uspořádání podle: MI: části frazémů a málo frekventované infinitivy T-score: gramatická slova logdice: něco mezi oběma extrémy 2. odlišný kontext: statečný vs. odvážný
56 Děkujeme za pozornost!
1. Přehled cizojazyčných a vícejazyčných korpusů
1. Přehled cizojazyčných a vícejazyčných korpusů typy korpusů a možnosti jejich využití 2. Nová verze korpusu InterCorp (prosinec 2014) nové jazyky a texty lemmatizace a značkování 3. Webové korpusy srovnatelné
KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská. 13. 2. 2013 Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!
KORPUSOVÝ WORKSHOP VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT! Václav Cvrček, Lucie Chlumská 13. 2. 2013 Univerzita Karlova v Praze O (Ú)ČNK Ústav Českého národního korpusu, založen v roce
Jak lze v korpusech hledat doklady pro výzkum morfologie?
Seminář cjbb75 1. 4. 2015 Jak lze v korpusech hledat doklady pro výzkum morfologie? Vyhledávání podle morfologické značky problém spolehlivosti desambiguace Vyhledejte v korpusu SYN2010 všechny vokativy
2. Korpusový portál a volně dostupné nástroje
1. Něco málo o jazykových korpusech co to je a jak se to používá 2. Korpusový portál a volně dostupné nástroje webový portál www.korpus.cz 3. Korpusový nástroj SyD porovnání dvou a více slov z hlediska
STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA. Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého
STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého Počet kreditů: 1 Typ předmětu: volitelný Způsob zakončení: zápočet Garant
WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY
WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY Datum konání: 11. dubna 2014 Místo konání: Filozofická fakulta Masarykovy univerzity (učebna G13) Název přednášky: Přednášející: Webové korpusy Aranea
P(w i w 1 w 2...w i 1 ) = P(w 1...w i ) P(w 1...w i ) = P(w 1 ) P(w 2 w 1 ) P(w 3 w 1 w 2 )... P(w i w 1...w i 1 ) slova w i
n-gramy a textové korpusy n-gramy Pavel Rychlý, Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Úkol: Je zadáno n slov textu, jaké slovo následuje s největší pravděpodobností? Obsah:
n-gramy Jazykové modely a textové korpusy n-gramy pokrač. Markovovy modely Obsah: se dostanou na trh... Jazykové modely Co to je korpus?
n-gramy a textové korpusy n-gramy Pavel Rychlý, Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Úkol: Je zadáno n slov textu, jaké slovo následuje s největší pravděpodobností? Obsah:
ve strojovém překladu
Jaká data se používají ve strojovém překladu Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/39 Osnova Typy dat ve strojovém
Dotazy v CQL (pro Sketch Engine)
Masarykova univerzita Filozofická fakulta Dotazy v CQL (pro Sketch Engine) PLIN021: Sémantická analýza v praxi Daniela Chalupníková Nikol Volková 2013 Obsah Úvod... 3 I. Co je to CQL... 4 II. Pojmy...
Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti
Prima jednoduše mluví o sobě Slovní zásoba: elementární slovní 1 B/ 26, 27, 29, 30 tvoří jednoduché otázky a aktivně je používá zásoba pro zvolené tematické okruhy odpovídá na jednoduché otázky obsahující
Popis morfologických značek poziční systém
Popis morfologických značek poziční systém Jan Hajič Ústav formální a aplikované lingvistiky MFF UK Morfologická analýza a syntéza Morfologické značky jsou součástí výsledku (výstupem) morfologické analýzy,
Nástroj pro monitorování a analýzu českého internetu a sociálních médií
Nástroj pro monitorování a analýzu českého internetu a sociálních médií SOCIAL INSIDER VLASTNOSTI Zachycuje data z Facebooku, Twitteru, Youtube, Google+, stejně jako z tisíců českých a slovenských blogů
1. Manuál ke Sketch Engine
1. Manuál ke Sketch Engine Sketch Engine je internetový počítačový program, který nalezneme na webových stránkách https://www.sketchengine.co.uk. Jedná se o korpusový manažer, tedy software určený k hlubší
Počítač, dataprojektor, interaktivní tabule, audio a video technika, plány měst, mapy, slovníky
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Francouzský jazyk (FRJ) Výstupy odpovídající úrovni A1 podle SERRJ Kvarta 4 hodiny týdně Počítač, dataprojektor, interaktivní tabule, audio a video technika,
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u : My family, my hobbies Present simple and continuous, Wh- questions
PSNÍ Jazyk Úroveň utor Kód materiálu nglický jazyk 5. třída Eva Prokšová j5-doc-pro-psa-01 Z á k l a d o v ý t e x t : Dear Johny, My name s Pavel Novák and I m twelve years old. I m from Prague which
Připravované právní předpisy EU
Připravované právní předpisy EU Jak používat pokročilé vyhledávání v databázi EUR-Lex Začínáme Běžte na internetové stránky EUR-Lex: http://eur-lex.europa.eu/homepage.html?locale=cs. Ve vodorovné nabídce
FUNKCE 3. Autor: Mgr. Dana Kaprálová. Datum (období) tvorby: září, říjen 2013. Ročník: sedmý. Vzdělávací oblast: Informatika a výpočetní technika
FUNKCE 3 Autor: Mgr. Dana Kaprálová Datum (období) tvorby: září, říjen 2013 Ročník: sedmý Vzdělávací oblast: Informatika a výpočetní technika 1 Anotace: Žáci se seznámí se základní obsluhou tabulkového
Jazyk a jazyková komunikace 2. ročník a sexta
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Tvarosloví Český jazyk (CEJ) Jazyk a jazyková komunikace 2. ročník a sexta 2 hodiny týdně (viz poznámky) S jistotou určí slovní druh a pojmenuje jej cizím termínem
E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO
Seznam výukových materiálů III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Tematická oblast: Předmět: Vytvořil: Rozvoj řečových dovedností Ruský jazyk Helena Malášková 01 O spánku a váze - prezentace
Faktorované překladové modely. Základní informace
Základní informace statistická metoda překladu statistická metoda překladu založena na frázích (nikoliv slovo slovo) statistická metoda překladu založena na frázích (nikoliv slovo slovo) doplňková informace
Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,
Větná polarita v češtině Kateřina Veselovská Žďárek Hořovice, 27. 11. 2009 1 Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání
Microsoft Office. Excel vyhledávací funkce
Microsoft Office Excel vyhledávací funkce Karel Dvořák 2011 Vyhledávání v tabulkách Vzhledem ke skutečnosti, že Excel je na mnoha pracovištích používán i jako nástroj pro správu jednoduchých databází,
Úvod do databázových systémů
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Úvod do databázových systémů Cvičení 3 Ing. Petr Lukáš petr.lukas@vsb.cz Ostrava, 2014 Opakování 4 fáze vytváření
Specifikace požadavků pro školní část přijímací zkoušky (anglický jazyk) Šestiletý obor vzdělávání
Specifikace požadavků pro školní část přijímací zkoušky (anglický jazyk) Šestiletý obor vzdělávání rozumí informacím v jednoduchých poslechových textech, jsou-li pronášeny pomalu a zřetelně, rozumí obsahu
Specializovaný korpus BANÁT a jeho využití
Specializovaný korpus BANÁT a jeho využití Klára Dvořáková, Zuzana Komrsková a Karolína Vyskočilová klara.dvorakova@ujc.cas.cz zuzana.komrskova@ff.cuni.cz karolina.vyskocilova@ff.cuni.cz Korpusová lingvistika
Předmět: ANGLICKÝ JAZYK Ročník: 6.
Předmět: ANGLICKÝ JAZYK Ročník: 6. Výstupy z RVP Školní výstupy Učivo Mezipředm. vazby, PT Poslech s porozuměním - rozumí informacím v jednoduchých poslechových textech, jsou-li pronášeny pomalu a zřetelně
Základní škola, Ostrava Poruba, Bulharská 1532, příspěvková organizace
Anglický jazyk 3. ročník (tab.1) Vyslovuje a čte foneticky správně v přiměřeném rozsahu slovní zásoby - hláskuje jméno, jednoduchá slova, - rozeznává anglická jména v rodě ženském a mužském - orientuje
Depfix: Jak dělat strojový překlad lépe než Google Translate
Rudolf Rosa rur@nikdeeu http://ufalmffcunicz/rudolf-rosa Depfix: Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované
ROMÁNSKÉ JAZYKY A ČEŠTINA VE SVĚTLE PARALELNÍCH KORPUSŮ
ROMÁNSKÉ JAZYKY A ČEŠTINA VE SVĚTLE PARALELNÍCH KORPUSŮ obálka PETR ČERMÁK OLGA NÁDVORNÍKOVÁ ET ALII KAROLINUM Románské jazyky a čeština ve světle paralelních korpusů Petr Čermák, Olga Nádvorníková et
Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA
Žák porovnává významy slov, zvláště slova podobného nebo stejného významu a slova vícevýznamová O jazyce Opakování učiva 3. ročníku Národní jazyk Naše vlast a národní jazyk Nauka o slově Slova a pojmy,
Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: literární výchova - ročník: KVARTA
Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: literární výchova - ročník: KVARTA Téma Učivo Výstupy Kódy Dle RVP Školní (ročníkové) PT KK Moderna Prokletí básníci,
Dataprojektor, kodifikační příručky
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Český jazyk (CEJ) Jazyková výchova Prima 2 hodiny týdně Dataprojektor, kodifikační příručky Slovní druhy Objasní motivaci pojmenování slovních druhů Vysvětlí
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Hana Stryalová Aj5-kap-str-psa-05 Z á k l a d o v ý t e x t : Dear Judy, My name s Caroline and I m from Leeds. I m 11 years old. I ve got
Úvod do filtrace, Quick filtr
Příručka uživatele systému Památkový katalog Úvod do filtrace, Quick filtr verze 1.x.x Autorská práva Copyright 2015 MUSOFT.CZ, s.r.o.. Všechna práva vyhrazena. Tato příručka je chráněna autorskými právy
EBSCO. http://search.ebscohost.com. Poklikneme na možnost EBSCOhost Web. Vybereme (poklepeme, zaškrtneme) databázi, s kterou chceme pracovat.
EBSCO http://search.ebscohost.com Poklikneme na možnost EBSCOhost Web Vybereme (poklepeme, zaškrtneme) databázi, s kterou chceme pracovat. Vyhledávací techniky Rejstříky Pomůckou pro vyhledávání jsou rejstříky,
Petr Nevrlý <petr.nevrly@firma.seznam.cz>
Fulltextové vyhledávání Petr Nevrlý Obsah přednášky Cíl vyhledávání Architektura Vyhledávání Robot Údaje z provozu Cíl fulltextového vyhledávání Poskytnutí odpovědi na dotaz
Úvod do databázových systémů
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Database Research Group Úvod do databázových systémů Cvičení 3 Ing. Petr Lukáš petr.lukas@vsb.cz
Budějovice Název materiálu: Reported Speech. Datum (období) vytvoření: Srpen 2013. Autor materiálu: PhDr. Dalibor Vácha PhD. Zařazení materiálu:
Projekt: Příjemce: Budějovice Název materiálu: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova
Jak vyhledávat. Vyhledávače KAPITOLA 3
KAPITOLA 3 Jak vyhledávat Už víme, jak zacházet s programem Microsoft Internet Explorer, a můžeme se pustit do surfování. Ostatně, stejně jsme to při seznamování s funkcemi programu chtíce nechtíce dělali.
Minulý čas prostý. Past simple. Výhradní výukový materiál portálu onlinejazyky.cz
Minulý čas prostý Past simple Výhradní výukový materiál portálu onlinejazyky.cz Use Použití Minulý čas prostý používáme, hovoříme-li o činnostech, událostech či stavech, které začaly a také skončily v
Němčina druhý jazyk
5.1.3 5.1.3 Němčina druhý jazyk DALŠÍ CIZÍ JAZYK - NĚMECKÝ JAZYK 7. ročník 5.1.3/01 RECEPTIVNÍ ŘEČOVÉ DOVEDNOSTI rozumí významu výuky cizích jazyků v současnosti MKV 25., GM 16. rozumí otázkám a pokynů,
Předmět: ANGLICKÝ JAZYK Ročník: 1.
Ročník: 1. ŘEČOVÉ DOVEDNOSTI výslovností, a reaguje na ně verbálně i neverbálně - zopakuje a použije slova a slovní spojení, se kterými se v průběhu výuky setkal - rozumí obsahu jednoduchého krátkého mluveného
Školní vzdělávací program Základní školy a mateřské školy Sdružení
Vyučovací předmět: Český jazyk a literatura 3. ročník Měsíc Téma Učivo Očekávaný výstup září říjen OPAKOVÁNÍ Z 2. roč. VĚTA JEDNODUCHÝ PŘÍBĚH OPAKOVÁNÍ Z 2. ročníku PÁROVÉ SOUHLÁSKY ABECEDA JEDNODUCHÝ
Základní škola Náchod Plhov: ŠVP Klíče k životu
VZDĚLÁVACÍ OBLAST: VZDĚLÁVACÍ OBOR: PŘEDMĚT: JAZYK A JAZYKOVÁ KOMUNIKACE DALŠÍ CIZÍ JAZYK NĚMECKÝ JAZYK Bydlení Pojmenuje místnosti a zařízení pokoje a neznámou slovní zásobu vyhledá ve slovníku. Složené
K možnostem počítačového zpracování literárního textu
K možnostem počítačového zpracování literárního textu Petr Pořízka Jednu z možností, jak dnes efektivně analyzovat literární text s použitím počítačů, nabízí korpusová lingvistika obor, jehož hlavním předmětem
Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova
Vyučovací předmět: Český jazyk a literatura Ročník: 6. Vzdělávací obsah Očekávané výstupy z RVP ZV Školní výstupy Učivo Přesahy a vazby, průřezová témata rozlišuje spisovný jazyk, nářečí a obecnou češtinu
DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ
DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ Číslo projektu Číslo a název šablony klíčové aktivity Tématická oblast CZ.1.07/1.5.00/34.0963 II/2 Inovace a zkvalitnění výuky směřující k rozvoji čtenářské a informační
Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA
září Žák porovnává významy slov, zvláště slova podobného nebo stejného významu a slova vícevýznamová. Žák dokáže rozlišit mluvnické kategorie podstatných jmen (pád, číslo, rod), rozliší větu jednoduchou
VYHLEDÁVÁNÍ V DATABÁZI WEB OF SCIENCE. Helena Landová Akademická knihovna JU
VYHLEDÁVÁNÍ V DATABÁZI WEB OF SCIENCE Helena Landová Akademická knihovna JU Co je Web of Science? Web of Science (WOS) je součást platformy ISI Web of Knowledge (WOK) firmy Thomson Reuters WOS je multioborová
Nápověda k pokročilému vyhledávání
Nápověda k pokročilému vyhledávání Nový rešeršní systém zpřístupněný Úřadem jako systém s rozšířeným vyhledáváním obsahuje proti původnímu sytému mnohem více vyhledávacích možností. Nicméně základní možnosti
Český jazyk ve 4. ročníku
Český jazyk ve 4. ročníku září Jazyková Čte s porozuměním přiměřeně náročné texty potichu i nahlas. učebnice strana 3 7 Procvičuje praktické naslouchání při komunikaci s další osobou. pracovní sešit strana
Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA
Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA Téma Učivo Výstupy Kódy Dle RVP Školní (ročníkové) PT KK Podstatná jména: - konkrétní
IV. Gramatika A. Tvarosloví 1. Slovní druhy
IV. Gramatika A. Tvarosloví 1. Slovní druhy Slovní druhy jsou soubory slov vymezené podle hledisek významového, tvaroslovného a skladebního. V podstatě se shodují s kategoriemi, s jejichž pomocí starořecký
M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
Č T E N Í Jazyk Úroveň utor Kód materiálu nglický jazyk 5. třída Ludmila Jožáková aj5-kap-joz-cte-05 Z á k l a d o v ý t e x t ( 1 5 0 2 5 0 s l o v ) : Přečtěte si následující text a odpovězte na otázky.
Anglický jazyk - 1. a 2. ročník (tab. 2) Očekávané výstupy z RVP Učivo Přesahy a vazby Vyslovuje foneticky správně anglickou abeceda
Anglický jazyk - 1. a 2. ročník (tab. 2) Vyslovuje foneticky správně anglickou abeceda Osobnostní a sociální výchova abecedu - seznamuje se s rozdíly v české abecedě a anglické Rozvoj schopností poznávání
Učebnice, cvičebnice, CD-Rom, audio CD a DVD, počítačová učebna, dataprojektor, mapy anglicky mluvících zemí, slovník, interaktivní tabule
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Anglický jazyk (ANJ) Výstupy odpovídající úrovni A2 podle SERRJ Kvarta 4 hodiny týdně Učebnice, cvičebnice, CD-Rom, audio CD a DVD, počítačová učebna, dataprojektor,
1. Pro přihlášení k odběru novinek klikněte na tlačítko Registrace nového uživatele.
1. Vstup do aplikace Na adrese: http://prace.statnisprava.cz 2. První stránka aplikace 1. Pro přihlášení k odběru novinek klikněte na tlačítko Registrace nového uživatele. 2. Poté budete přesměrováni na
Digitální knihovny některých zemí
Digitální knihovny některých zemí PhDr. Martina Machátová Moravská zemská knihovna v Brně Tel.: 541 646 170 E-mail: machat@mzk.cz Poslední aktualizace: 13. prosince 2018 Deutsche digitale Bibliothek https://www.deutsche-digitalebibliothek.de/?lang=en
NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA
ČÍSLO SADY III/2 AUTOR/KA Radka Zborníková ČJL - Tvarosloví Slovní druhy číselné označení DUM NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA FORMÁT (pdf,, ) 1. Slovní druhy - přehled, opakování učiva
1 Úvod 2 1.1 Charakteristika programu... 2 1.2 Vstupní podmínky... 2. 2 Rozhraní 3 2.1 Uživatelské rozhraní... 3
Šotek - předběžná analýza Zápočtový projekt, IB013 Logické programování Jiří Mauritz, Tomáš Effenberger 12. dubna 2013 Obsah 1 Úvod 2 1.1 Charakteristika programu............................... 2 1.2 Vstupní
Anglický jazyk. 5. ročník. Poslech s porozuměním
list 1 / 10 Aj časová dotace: 3 hod / týden Anglický jazyk 5. ročník Poslech s porozuměním tematické okruhy: informace o sobě a druhých pozdravy, přivítání, rozloučení (využití Dash & Dot) představí sebe
Algoritmizace a programování
Algoritmizace a programování Výrazy Operátory Výrazy Verze pro akademický rok 2012/2013 1 Operace, operátory Unární jeden operand, operátor se zapisuje ve většině případů před operand, v některých případech
Vzdělávací obsah vyučovacího předmětu
Vzdělávací obsah vyučovacího předmětu Český jazyk a literatura 8. ročník Zpracovala: Mgr. Marie Čámská Jazyková výchova spisovně vyslovuje běžně užívaná cizí slova umí spisovně vyslovit běžná cizí slova
Tovek: Dotazovací jazyk
Tovek: Dotazovací jazyk verze 6.1 a vyšší Tovek Server, Tovek Tools Copyright TOVEK, spol. s r.o. www.tovek.cz Tovek Dotazovací jazyk verze 6.1 a vyšší Copyright Copyright 1996-2011 TOVEK, spol. s r.o.
Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce
1 JAZYK A JAZYKOVÁ KOMUNIKACE UČEBNÍ OSNOVY 1. 2 Cvičení z českého jazyka Cvičení z českého jazyka 7. ročník 1 hodina 8. ročník 1 hodina 9. ročník 1 hodina Charakteristika Žáci si tento předmět vybírají
E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO
Seznam výukových materiálů III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Tematická oblast: Předmět: Vytvořil: Současný český jazyk upevňování a procvičování obtížných gramatických jevů Český jazyk
Vilém Sklenák Inforum2009,
Sémantické vyhledávání je blíže? Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2009, 27. 5. 2009 Vilém Sklenák
Český jazyk a literatura - jazyková výchova
Využívá znalostí získaných v předešlých ročnících. OPAKOVÁNÍ OPAKOVÁNÍ Vysvětlí pojmy: sl.nadřazené, podřazené a slova souřadná.uvede příklady. Rozpozná sl. jednoznač.a mnohoznačná. V textu vyhledá synonyma,
PSANÍ. Anglický jazyk 5. třída Hana Stryalová
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Hana Stryalová Aj5-kap-str-psa-06 Z á k l a d o v ý t e x t : Dear Jessica! I am in Spain now. I am here with a Spanish girl. Her name is
HELP Rešerše průmyslových vzorů
HELP Rešerše průmyslových vzorů Zpracoval D. Pičman Nový rešeršní systém zpřístupněný Úřadem jako systém s rozšířeným vyhledáváním obsahuje proti původnímu sytému mnohem více vyhledávacích možností. Nicméně
SADA VY_32_INOVACE_CJ1
SADA VY_32_INOVACE_CJ1 Přehled anotačních tabulek k dvaceti výukovým materiálům vytvořených Mgr. Bronislavou Zezulovou a Mgr. Šárkou Adamcovou. Kontakt na tvůrce těchto DUM: zezulova@szesro.cz a adamcova@szesro.cz
Karel Pala, Vít Suchomel
PA153 Počítačové zpracování přirozeného jazyka 06 Korpusy a korpusové nástroje, značkování Karel Pala, Vít Suchomel Centrum ZPJ, FI MU, Brno 21. října 2013 Karel Pala, Vít Suchomel PA153 Zpracování přirozeného
Nápověda 360 Search. Co je 360 Search? Tipy pro vyhledávání
1 z 5 Nápověda 360 Search Co je 360 Search? 360 Search je metavyhledávač, který slouží k paralelnímu prohledávání všech dostupných informačních zdrojů prostřednictvím jednotného rozhraní. Nástroj 360 Search
Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 5. Průřezová témata Mezipředmětové vztahy.
Ročník: 5. OSV - rozvoj individuálních dovedností pro kooperaci (seberegulace v situaci nesouhlasu, odporu apod., dovednost odstoupit od vlastního nápadu, dovednost navazovat na druhé a rozvíjet vlastní
ČESKÝ JAZYK 3. ROČNÍK
VZDĚLÁVACÍ OBLAST: VZDĚLÁVACÍ OBOR: PŘEDMĚT: JAZYK A JAZYKOVÁ KOMUNIKACE ČESKÝ JAZYK A LITERATURA ČESKÝ JAZYK 3. ROČNÍK Téma, učivo Rozvíjené kompetence, očekávané výstupy Mezipředmětové vztahy Aktualizace
HROMADNÉ ÚPRAVY NAJÍT A NAHRADIT
HROMADNÉ ÚPRAVY NAJÍT A NAHRADIT Funkce Najít a nahradit slouží k rychlému vyhledávání určitých slov a jejich nahrazování jinými slovy. Lze hledat i určité varianty slov a nahrazovat je buď hromadně (všechny
Vyhledávání na portálu Knihovny.cz
Inforum 2017 Vyhledávání na portálu Knihovny.cz Petr Žabička, Václav Rosecký, Petra Žabičková Moravská zemská knihovna v Brně Obsah Co indexuje portál Knihovny.cz Rozšíření o centrální index Hledání v
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz
VĚTNÉ ČLENY. Mgr. Jiří Ondra Procvičení základních pojmů a kategorií z oblasti české skladby. Zdokonalování jazykových vědomostí a dovedností
VĚTNÉ ČLENY Autor Mgr. Jiří Ondra Anotace Opakování základních pojmů a kategorií z oblasti české skladby Očekávaný přínos Procvičení základních pojmů a kategorií z oblasti české skladby Tematická oblast
Jednoduchá sdělení představování, poděkování, pozdrav, omluva Základní výslovnostní návyky
Učební osnovy Ruský jazyk PŘEDMĚT: Ruský jazyk Ročník: 7. třída 1 rozumí jednoduchým pokynům a otázkám učitele, které jsou pronášeny pomalu a s pečlivou výslovností, a reaguje na ně 1p je seznámen se zvukovou
Paralelní korpusy. 0/2 Z, zimní semestr 2006/2007. Alexandr Rosen
Paralelní korpusy 0/2 Z, zimní semestr 2006/2007 Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofická fakulta Univerzity Karlovy v Praze Alexandr Rosen (ÚTKL FF UK ) Paralelní korpusy 1
Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto
Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT Autor Mgr. Petr Štorek,Ph. D.
Očekávané výstupy RVP Školní výstupy Učivo Poznámky (průřezová témata, mezipředmětové vztahy apod.) Řečové dovednosti
Vzdělávací obsah vyučovacího předmětu anglický jazyk pro 1. stupeň: 3. ročník Očekávané výstupy RVP Školní výstupy Učivo Poznámky (průřezová témata, Řečové dovednosti CJ-3-1-01 rozumí jednoduchým pokynům
Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 3.. Průřezová témata Mezipředmětové vztahy.
OSV - rozvoj individuálních dovedností pro kooperaci (seberegulace v situaci nesouhlasu, odporu apod., dovednost odstoupit od vlastního nápadu, dovednost navazovat na druhé a rozvíjet vlastní linku jejich
Anglický jazyk pro 6. ročník
Anglický jazyk pro 6. ročník (Předmět je vyučován 3 hodiny týdně.) Vzdělávací obsah Lekce 1 Očekávané výstupy Z RVP ZV - aktivně se zapojí do jednoduché konverzace, pozdraví a rozloučí se s dospělým i
Analýza staročeské morfologie v Excelu
Analýza staročeské morfologie v Excelu B O R I S L E H E Č K A, B O R I S @ D A L I B O R I S. C Z O D D Ě L E N Í V Ý V O J E J A Z Y K A Ú S T A V P R O J A Z Y K Č E S K Ý A V Č R L I N G V I S T I
Mgr. Petr Čadek, Mgr. Karel Šulc, Bc. Lukáš Javůrek, Hana Solarová
Mgr. Petr Čadek, Mgr. Karel Šulc, Bc. Lukáš Javůrek, Hana Solarová KOGNITIVNÍ LINGVISTIKA Jazyk a jeho užívání jsou jednou z kognitivních aktivit lidské mysli. Kognitivní lingvisté předpokládají, že jazyk
SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony
Číslo a název projektu Číslo a název šablony DUM číslo a název CZ.1.07/1.5.00/34.0378 Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT SSOS_CJL_5.13
LinuxDays 2017 Ondřej Guth GNU grep LD 17 1 / 14
Používáte GNU grep? A víte, jak funguje uvnitř? Ondřej Guth ondrej.guth@fit.cvut.cz LinuxDays 2017 Ondřej Guth GNU grep LD 17 1 / 14 1 Úvod 2 Přehled zpracování vstupu 3 Obyčejný řetězec jako regulární
Espacenet
Espacenet http://www.epo.org/searching/free/espacenet.html Martina Machátová Aktualizace: 17. září 2018 Obsah - 100 milionů patentových dokumentů z 90 zemí světa. - Řada patentů je k dispozici v plném
Jazyková výchova Opakování. Věta, souvětí. Význam slov, hlásková podoba slova. Jednoznačná a mnohoznačná slova
A B C D E F 1 Vzdělávací oblast: Jazyk a jazyková komunikace 2 Vzdělávací obor: Český jazyk a literatura 3 Vyučovací předmět: Český jazyk 4 Ročník: 4. 5 Klíčové kompetence (Dílčí kompetence) 6 Kompetence
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Hana Stryalová Aj5-kap-str-psa-04 Z á k l a d o v ý t e x t : Hi Mathew! We are in France now. We are in Paris today. It is a beautiful city
Výstupy odpovídající úrovni A1 podle SERR. Dataprojektor, počítač, smartphone, pracovní listy, slovníky. Gymnázium Jiřího Ortena, Kutná Hora
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Německý jazyk (NEJ) Výstupy odpovídající úrovni A1 podle SERR Tercie 4 hodiny týdně Dataprojektor, počítač, smartphone, pracovní listy, slovníky Úvod do studia
POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
POSLECH Jazyk Úroveň Autor Kód materiálu Anglický jazyk 9. třída Mgr. Martin Zicháček aj9-kap-zic-pos-01 Z á k l a d o v ý t e x t : After a Christmas holiday two friends are chatting at a school hall
Ročník: 4. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby
Ročník: 4. Časová dotace: 7 hodin týdně Komunikační a slohová Čtení a naslouchání čtení jako zdroj informací aktivní naslouchání s otázkami Žák čte s porozuměním přiměřeně náročné texty potichu i nahlas.
ROZHRANÍ PRO ZPŘÍSTUPNĚNÍ A PREZENTACI ZNALOSTNÍ DATABÁZE INTERPI UŽIVATELSKÁ PŘÍRUČKA
ROZHRANÍ PRO ZPŘÍSTUPNĚNÍ A PREZENTACI ZNALOSTNÍ DATABÁZE INTERPI UŽIVATELSKÁ PŘÍRUČKA INTERPI Interoperabilita v paměťových institucích Program aplikovaného výzkumu a vývoje národní kulturní identity
Juxtapozice z do v Arabštině
Juxtapozice z do v Arabštině Kvantitativní přístup Jiří Milička Ústav srovnávací jazykovědy Jak do začalo? První data pro výzkum byla shromážděna automaticky. Ale když se ukázalo, že téma je zajímavé,
1. lekce. do souboru main.c uložíme následující kód a pomocí F9 ho zkompilujeme a spustíme:
1. lekce 1. Minimální program do souboru main.c uložíme následující kód a pomocí F9 ho zkompilujeme a spustíme: #include #include int main() { printf("hello world!\n"); return 0; 2.
Příručka uživatele systému Museion. Quick filtr
Příručka uživatele systému Museion Quick filtr Autorská práva Copyright 2015 MUSOFT.CZ, s.r.o.. Všechna práva vyhrazena. Tato příručka je chráněna autorskými právy a distribuována na základě licencí, které