Word Sense Disambiguation (1)
|
|
- Oldřich Sedláček
- před 9 lety
- Počet zobrazení:
Transkript
1 SENSEVAL
2 SENSEVAL (1) Mezinárodní organizace zabývající se hodnocením systémů Word Sense Disambiguation (WSD) Organizace a řízení hodnocení a související činnosti Testování kladů a záporů WSD systémů s ohledem na různost slov, různé aspekty jazyka a různost jazyků
3 SENSEVAL (2) Prohlubování našich znalostí o lexikální sémantice a mnohoznačnosti Řízen malou komisí pod dohledem ACL- SIGLEX (zvláštní zájmová skupina LEXiconu a Assotiation for Computational Linguistics).
4 Word Sense Disambiguation (1) Zjednoznačnění významu slova Problém jak stanovit význam určitého slova v jakémkoliv možném kontextu Problém jak formalizovat proces probíhající přirozeně v lidském mozku Nejednoznačnost slovních významů je potenciálním zdrojem chyb ve všech aplikacích zpracování jazyka
5 Word Sense Disambiguation (2) Zažil oživení spolu možností vytvářet velké korpusy Díky SENSEVAL se statistické metody, obzvláště techniky strojového učení ukázaly být velmi efektivní Podobné značkování části promluvy Zahrnuje označení každého slova speciálním tagem z předdefinované množiny s použitím prvků kontextu a dalších informací
6 Word Sense Disambiguation použití (1) Anglické slovo drug ve francouzštině drogue nebo médicament překladový systém musí rozhodnout o jednoznačném významu slova při každém jeho výskytu podobně systémy pro získávání informací mohou chybně vrátit dokumenty týkající se nelegálních narkotik, zatímco dotaz se týkal léků
7 Word Sense Disambiguation použití (2) Systémy pro extrakci informací mohou vrátit špatnou odpověď Systémy pro převod textu na hlas mohou zaměnit významy slova zámek budova i předmět k uzamykání
8 Word Sense Disambiguation (2) V reálných aplikacích bývá WSD většinou plně zabudováno do systému bez možnosti separace Např. v systémech pro získávání informací není WSD prováděno explicitně, ale jako vedlejší produkt přiřazování dokumentu k odpovídajícímu dotazu Úkolem SENSEVAL je ovšem zaměřit se na samostatné obecně použitelné WSD systémy
9 SENSEVAL historie (1) Založena v roce 1997 jako pokračování workshopu SIGLEX-97 - Značkování s lexikální sémantikou: proč, co a jak?, pořádaného na konferenci Aplikace zpracování přirozeného jazyka Senseval-1 (1998) workshop v Herstmonceux Castle v Anglii 2. až 4. září. úkoly pro angličtinu, francouzštinu a italštinu
10 SENSEVAL historie (2) SIGLEX-99 Standardizace lexikálních prostředků University of Mariland, červenec 2009
11 SENSEVAL-2 (1) 2001 podporován organizacemi EURALEX, ELSNET, EPSRC a ELRA ve spojení s ACL až 6. července v Toulouse Hlavním cílem bylo podpořit účast nových jazyků a vyvinout metodologii pro všeslovné vyhodnocování
12 SENSEVAL 2 (2) 3 typy úkolů pro 12 jazyků: all-words : čeština, dánština, angličtina, estonština Lexikálnívzorky: baskydština, angličtina, italština, japonština, korejština, španělština, švédština Překlad: japonština
13 SENSEVAL 2 (3) all-words systémy musí označkovat téměř všechna slova obsažená ve vzorku souvislého textu Lexikálnívzorky nejprve je ze slovníku pečlivě vybrán vzorek slov. Systém poté musí na krátkém fragmentu textu označkovat určité instance zvolených slov. Překlad význam slova je definován vzhledem k odlišnostem v překladu
14 SENSEVAL-2 tabulka odevzdaných projektů
15 SENSEVAL-2 - úkoly Skládají se ze 3 typů dat: významový inventář přiřazení slov k významům s eventuálními dalšími informacemi k vysvětlení definici nebo rozlišení významů korpus manuálně značkovaného textu nebo vzorky textu (rozdělen do volitelného cvičného korpusu a testovacího korpusu) volitelná významová seskupení sloužící k omezení významových odlišností ve výsledku
16 SENSEVAL-2 vyhodnocování (1) Cílem bylo, aby při nestrojovém značkování nastala shoda v alespoň 90% případů Vyhodnocení řízeno centrálně z webu University of Pennsylvania, dodržovalo stejný postup jako v případě SENSEVAL-1 Pro každý úkol byla data rozdělena do třech částí: zkušební, cvičná a testovací data Týmy registrují své systémy, stáhnou data a poté mají 21 dnů na práci s cvičnými daty a 7 dnů na testovací data
17 SENSEVAL-2 - vyhodnocování (2) Každý tým odevzdá odpovědi na web, kde jsou automaticky vyhodnoceny Výsledky SENSEVAL-2 byly zhruba o 14% horší než v SENSEVAL-1 Mnoho systémů byly pouze vylepšené verze stejných systémů, které se účastnily SENSEVAL-1
18 SENSEVAL-2 plány do budoucna Současné nejvýkonnější systémy dosahují svých úspěchů díky kontrolovanému strojovému učení Současný výzkum se zaměřuje na to, jak způsoby výběru pro algoritmy strojového učení ovlivňují výkon na různých typech mnohoznačnosti Na základě toho, jak snadno nebo obtížně jsou slova zjednoznačněna různými metodami, bychom měli být schopni určit různé typy polysémie
19 ACL-02 Workshop (1) Word Sense Disambiguation: Současné úspěchy a směry do budoucnosti Philadelphia, červenec 2002 Analyzovat výsledky SENSEVAL-2, plánování SENSEVAL-3 Hloubková analýza odevzdaných projektů Srovnání různých systémů, technik nad různými jazyky
20 ACL-02 Workshop (2) Srovnání SENSEVAL-1 a SENSEVAL-2 Co způsobuje, že je pro některá slova snazší najít jednoznačný význam než pro jiná? Efektivnost různých korpusů Odlišnosti v inventářích významů požadovaných pro různé aplikace
21 ACL-02 Workshop (3) Zvláštní diskuse věnovaná sémantice předložek Většina z nich je vysoce mnohoznačná Význam je většinou abstraktní Více než u jakékoliv jiné syntaktické kategorie je přesný význam definován kontextem Vítány metody klasifikace předložek a formalizování sémantik
22 SENSEVAL historie (4) Senseval-3 (2004) od března do dubna s navazujícím workshopem v červenci 2004 v Barceloně WSD úkoly pro jazyky baskytština, katalánština, čínština, angličtina, italština, rumunština a španělština obsahoval 14 různých úkolů jak na samotné WSD, tak i na identifikaci sémantických rolí, mnohojazyčné anotace, logické formy, subkategorizační akvizice, atd. více než 55 týmů, přes 160 systémů, 16 úkolů
23 SENSEVAL 2007 Vyhodnocování systémů: Workshop: června v Praze spolu s ACL-2007 Účastníkům budou poskytnuta testovací data Podobné úkoly budou testovány nad stejným formátem dat 18 úkolů
24 SENSEVAL příklady úkolů Klasifikace sémantických vztahů mezi nominály Vícejazyčné čínsko-anglické lexikální vzorky WSD předložek Webové vyhledávání lidí Emoční text Víceúrovňová sémantická anotace katalánštiny a španělštiny Anglické lexikální substituce Vyhodnocení znalostních zdrojů o širokém pokrytí
25 SEMiSUSANNE Sémanticky značkovaný a strukturovaně anotovaný korpus Autor: Chris Powell Vzniklý sloučením korpusů SUSANNE a SemCor Skládá se ze 33 dokumentů společných pro oba korpusy Zachovává strukturu SUSANNE, tj. jedno slovo na řádek Využívá významy WordNet 1.6
26 SUSANNE SUSANNE = Surface and underlying structural analysis of natural English reprezentativní průřez psanou americkou angličtinou Založeno na podmnožině Brown korpusu čítající přes milion slov Pokračující projekt CHRISTINE rozšířeno i o mluvenou angličtinu ( umm, err ) reprezentativní vzorky dnešní mluvené britské angličtiny Nejnovější rozšíření LUCY psaná angličtina moderní Británie teenageři, 9-12 leté děti, méně zkušení pisatelé
27 SEMiSUSANNE - struktura Podobná struktuře SUSANNE Osm polí na každé slovo šest z původního korpusu pole indukující samostatné/složené slovo pole pro kódování významu získaného ze SemCor
28 SEMiSUSANNE významové tagy (1) Významové pole je složeno ze 2 částí: znak z množiny {n,v,j,r} podstatné jméno, sloveso, přídavné jméno, příslovce nebo část promluvy číselná posloupnost lokalizující element v rámci WordNet databáze Např. kódování významu slova irregularity : A01: NN2 irregularities irregularity.np:s] 0 n475542
29 SEMiSUSANNE významové tagy (2) Použité kódování má zajistit rychlý přístup k databázi s použitím WordNet API řeší problém synonym při porovnávání významů s použitím formálních významových klíčů WordNetu
30 SEMiSUSANNE kódování složených slov Význam složeniny je přiřazen každé ze složek Opakován na každém odpovídajícím řádku
31 SEMiSUSANNE kódování samostatných slov V poli indikující, zda jde o složené slovo je vždy 0 A01: VVDv said say [Vd.Vd] 0 v682542
32 SEMiSUSANNE funkční slova Slova jimž není přiřazen konkrétní význam A01: AT The the [O[S[Nns:s. - -
33 DSO korpus (1) 191 lemat, instancí Inventář: WordNet 1.5 Zdroje textů: Brown Corpus, Wall Street Journal Autoři: Hwee Tou Ng a Hian Beng Lee
34 DSO korpus (2) Významově značkované výskyty 121 podstatných jmen a 70 sloves Nejfrekventovanější nebo víceznačná anglická slova vět převzatých z korpusu Brown a z Wall Street Journal Definice významu jednotlivých výskytů z WordNet 1.5
35 DSO korpus (3) Obsahuje kompletní výčet definic významů z WordNet 1.5 Formát věty s významovým tagem pro slovo action : ca01.db #020 `` These >> actions 8 << should serve to protect in fact and in effect the court 's wards from undue costs and its appointed and elected servants from unmeritorious criticisms, '' the jury said.
36 DSO definice významu z WordNet1.5 Sense 8 legal action, action, case, lawsuit, suit -- (a judicial proceeding brought by one party against another; "no criminal cases were heard while the judge was ill") => proceeding, legal proceeding, judicial proceeding, proceedings -- (the institution of a legal action) => due process, due process of law -- (the administration of justice according to established rules and principles) => group action -- (action taken by a group of people) => act, human action, human activity -- (something that people do or cause to happen)
37 DSO (4) Všechny značkované výskyty daného podstatného jména nebo slovesa jsou uloženy společně v jednom souboru Každá věta na jednom řádku, definice významu uloženy ve dvou souborech
38 Interest korpus (1) 1 lemma, 2369 instancí Inventář: LDCOE Zdroje textů: Wall Street Journal, Rebecca Bruce and Jan Wiebe Datový soubor složen z vět obsahující pouze slovo interest nebo interests Automaticky vyňato z korpusu Penn Treebank Wall Street Journal Každá věta v souboru obsahuje jeden významově značkovaný výskyt slova interest ( interests )
39 Interest korpus (2) Významové značky odpovídají šesti významům slova "interest" definovaných v elektronické verzi první edice Longman's Dictionary of Contemporary English Významové značky přidány za slovo Např. interest_6/nn význam číslo 6 Každá věta v souboru je vymezena řádkem obsahující symboly $$ Celkem 2369 vět
40 SemCor lemmat, instancí Inventář: WordNet 1.6, 1.7, 1.7.1, 2.0 Zdroje textů: 80% korpus Brown, 20% novela The Red Badge of Courage
41 Hector slovník Výzkumný projekt Oxford University Press a DEC cca 300 lemmat, instancí Inventář: Hector Zdroj textu: A 20M-word pilot pro British National Corpus
42 Open Mind Word Expert 230 lemmat, instancí včetně duplikátů, počet každým dnem roste On-line zdroj, uživatelé ho mohou sami kdykoliv rozšiřovat Inventář: WordNet 1.7 Zdroje textů: Penn treebank, LA Times, aj.
43 HKUST-Chinese vět Inventář: Hownet Zdroj textu: Sinica corpus
44 Švédský korpus značkovaných instancí Inventář: Gothenburg lexical database Zdroj textu: The SUC Corpus
45 Popisky obrázků lemmat, instancí Inventář: WordNet 1.5 Zdroj textů: Popisky obrázků z obrázkové kolekce
46 Line, hard, serve 3 slova, více jak instancí více než 4000 instancí podstatného jména line značkováno 6 významy wordnetu více než 4000 instancí přídavného jména hard značkováno 3 významy wordnetu více než 4000 instancí slovesa serve značkováno 4 významy wordnetu Inventář: WordNet 1.5 Zdroje textů: Wall Street Journal, American Printing House for the Blind, San Jose Mercury, Leacock, Towell
47 Odkazy Homepage: Výsledky SENSEVAL-2: CHIVE/RESULTS/senseval-summary.html - unassignable ts/all_graphs_files/sheet001.htm
Sémantický web a extrakce
Sémantický web a extrakce informací Martin Kavalec kavalec@vse.cz Katedra informačního a znalostního inženýrství FIS VŠE Seminář KEG, 11. 11. 2004 p.1 Přehled témat Vize sémantického webu Extrakce informací
Anotace žákovského korpusu. Alena Poncarová Žďárek, Listopad 2011
Anotace žákovského korpusu Alena Poncarová Žďárek, Listopad 2011 Obsah příspěvku Žákovský korpus CzeSL Akviziční korpusy Anotace korpusu CzeSL přepisy anotace Evaluace 2 Žákovský korpus CzeSL projekt AKCES
Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.
Korpusová lingvistika a počítačová Od 60. let 20. st. Raná korpusová lingvistika (konec 19. st 50. léta 20. st., Early corpus linguistics) strukturalistická tradice, americký deskriptivismus, metody založené
Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105
Korpusová lingvistika 2 Mgr. Dana Hlaváčková, Ph.D. CJBB105 Vývoj korpusové lingvistiky raná korpusová lingvistika, počítačová lexikografie, frekvenční studie (90. léta 19. st. 50. léta 20. st.) předěl
Japonsko-jazyčné online slovníky
Japonsko-jazyčné online slovníky EDICT a JMDict Významné zdroje pro online slovníky Projekt Jamese Williama Breena Bývalý profesor v oboru telekomunikací na Monash University v Austrálii Podíl na několika
Ontologie. Otakar Trunda
Ontologie Otakar Trunda Definice Mnoho různých definic: Formální specifikace sdílené konceptualizace Hierarchicky strukturovaná množina termínů popisujících určitou věcnou oblast Strukturovaná slovní zásoba
Faktorované překladové modely. Základní informace
Základní informace statistická metoda překladu statistická metoda překladu založena na frázích (nikoliv slovo slovo) statistická metoda překladu založena na frázích (nikoliv slovo slovo) doplňková informace
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz
Právní datasety. co, proč, kdo a komu. Jakub HARAŠTA. Ústav práva a technologií, Právnická fakulta MU
Právní datasety co, proč, kdo a komu Jakub HARAŠTA Ústav práva a technologií, Právnická fakulta MU Podpořeno Grantovou agenturou České republiky projekt GA17-20645S Obsah Úvod Právní datasety Rozhodovací
Filozofická fakulta. Compiled Jan 21, :48:06 PM by Document Globe 1
Filozofická fakulta Na této stránce najdete kompletní nabídku Filozofické fakulty Univerzity Karlovy. Pokud máte zájem o kompletní nabídku, navštivte hlavní stránku. Přehled vědeckých týmů Centrum pro
EXTRAKT z mezinárodní normy
EXTRAKT z mezinárodní normy Extrakt nenahrazuje samotnou technickou normu, je pouze informativním ICS 03.220.01; 35.240.60 materiálem o normě. Inteligentní dopravní systémy Požadavky na ITS centrální datové
PŘÍLOHA C Požadavky na Dokumentaci
PŘÍLOHA C Požadavky na Dokumentaci Příloha C Požadavky na Dokumentaci Stránka 1 z 5 1. Obecné požadavky Dodavatel dokumentaci zpracuje a bude dokumentaci v celém rozsahu průběžně aktualizovat při každé
Korpusová lingvistika a počítačové zpracování přirozeného jazyka
Korpusová lingvistika a počítačové zpracování přirozeného jazyka Vladimír Petkevič & Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze Korpusový seminář
1. Přehled cizojazyčných a vícejazyčných korpusů
1. Přehled cizojazyčných a vícejazyčných korpusů typy korpusů a možnosti jejich využití 2. Nová verze korpusu InterCorp (prosinec 2014) nové jazyky a texty lemmatizace a značkování 3. Webové korpusy srovnatelné
SEMINÁŘ Z ČESKÉHO JAZYKA. Pokaždé se něčemu přiučíme, kdykoliv otevřeme knihu
SEMINÁŘ Z ČESKÉHO JAZYKA Pokaždé se něčemu přiučíme, kdykoliv otevřeme knihu Charakteristika vzdělávacího oboru Seminář z českého jazyka Dovednost užívat češtiny jako mateřského jazyka v jeho mluvené i
Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky
Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci
Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka
Metody tvorby ontologií a sémantický web Martin Malčík, Rostislav Miarka Obsah Reprezentace znalostí Ontologie a sémantický web Tvorba ontologií Hierarchie znalostí (D.R.Tobin) Data jakékoliv znakové řetězce
4.9.2. Příprava na Cambridge English
4.9.2. Příprava na Cambridge English Seminář je určen pro pokročilé žáky anglického jazyka, kteří se chtějí systematicky připravovat ke zkoušce k získání nejrozšířenějšího mezinárodně uznávaného certifikátu
Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů
Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů
ZKUŠENOSTI S AUTOMATIZACÍ CITAČNÍ ANALÝZY NA ZAKONECHPROLIDI.CZ. Pavel Gardavský/AION CS, s.r.o
1 ZKUŠENOSTI S AUTOMATIZACÍ CITAČNÍ ANALÝZY NA ZAKONECHPROLIDI.CZ 21.9.2017 ČPIT 2017 Pavel Gardavský/AION CS, s.r.o O čem budu mluvit? 2 ZPL a citační analýza, typy, čísla, příklady Principy trochu podrobněji
Dolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
Disambiguace mnohoznačných slov pomocí vizuální informace
Disambiguace mnohoznačných slov pomocí vizuální informace Michal Vavrečka, Lenka Lhotská Biodat, FEL ČVUT Karlovo náměstí 13, Praha 1 vavrecka@fel.cvut.cz, Abstrakt V příspěvku se zabýváme analýzou současných
Mezinárodní výzkum PISA 2009
Mezinárodní výzkum PISA 2009 Zdroj informací: Palečková, J., Tomášek, V., Basl, J,: Hlavní zjištění výzkumu PISA 2009 (Umíme ještě číst?). Praha: ÚIV 2010. Palečková, J., Tomášek V. Hlavní zjištění PISA
Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.
Metadata, sémantika a sémantický web Ing. Vilém Sklenák, CSc. Inforum 2004, Praha, 27. 5. 2004 2/21 There are things we know that we know. There are known unknowns that is to say, there are things that
Klasifikace vzácných onemocnění, Orphanet
Klinické klasifikace a jejich použití v českém zdravotnictví I. 8. listopadu, 2016 Emauzský klášter, Praha Klasifikace vzácných onemocnění, Orphanet prof. MUDr. Milan Macek jr., DrSc. Ústav biologie a
Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha
Identifikace tématických sociálních sítí Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha 2 Obsah prezentace Cíl Fáze řešení a navržené postupy Prototyp a výsledky
Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,
Větná polarita v češtině Kateřina Veselovská Žďárek Hořovice, 27. 11. 2009 1 Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání
Proces auditu. Health Research & Information Division, ESRI, Dublin, July 2008
Proces auditu Proces auditu Fáze 1. Fáze 2. Fáze 3. Příprava auditu Provedení auditu a analýza výsledků Nálezy a doporučení Závěrečná zpráva auditora Počítačem podporovaný audit Proces auditu Vždy berte
NLP & strojové učení
NLP & strojové učení Miloslav Konopík 2. dubna 2013 1 Úvodní informace 2 Jak na to? Miloslav Konopík () NLP & strojové učení 2. dubna 2013 1 / 13 Co je to NLP? NLP = Natural Language Processing (zpracování
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus David Mareček obhajoba diplomové práce 8. 9. 2008 Motivace Na t-rovině jsou si jazyky podobnější alignment by zde měl být
PSANÍ. Anglický jazyk 5. třída Hana Stryalová
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Hana Stryalová Aj5-kap-str-psa-06 Z á k l a d o v ý t e x t : Dear Jessica! I am in Spain now. I am here with a Spanish girl. Her name is
Dovednosti dospělých v prostředí informačních technologií
Mezinárodní výzkum dospělých Programme for the International Assessment of Adult Competencies Dovednosti dospělých v prostředí informačních technologií Lucie Kelblová PIAAC Mezinárodní výzkum vědomostí
Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů
Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů O Vás 1. Dotazník vyplnilo sedm vysokoškolských pedagogů připravujících budoucí učitele cizích jazyků. 2. Šest
Karel Pala, Vít Suchomel
PA153 Počítačové zpracování přirozeného jazyka 06 Korpusy a korpusové nástroje, značkování Karel Pala, Vít Suchomel Centrum ZPJ, FI MU, Brno 21. října 2013 Karel Pala, Vít Suchomel PA153 Zpracování přirozeného
ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE
ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE Mgr. Barbora Štindlová, Ph. D., Mgr. Veronika Čurdová, Mgr. Petra Klimešová, Mgr. Eva Levorová ÚJOP UK, Praha Práce s chybou, Poděbrady
Výsledky mezinárodního výzkumu OECD PISA 2009
Výsledky mezinárodního výzkumu OECD PISA 2009 Programme for International Student Assessment mezinárodní projekt OECD měření výsledků vzdělávání čtenářská, matematická a přírodovědná gramotnost 15letí
VÝUKOVÝ MATERIÁL. Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632 Číslo projektu
VÝUKOVÝ MATERIÁL Identifikační údaje školy Vyšší odborná škola a Střední škola, Varnsdorf, příspěvková organizace Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632
Výukový plán. Tematický okruh č. 1 - odborné jazykové vzdělávání pracovníků chemického průmyslu - odborná terminologie - chemie
Výukový plán Tematický okruh č. 1 - odborné jazykové vzdělávání pracovníků chemického průmyslu - odborná terminologie - chemie Intenzita kurzu: 6x45 minut denně Počet hodin kurzu (45min): 50 hodin Použité
Strukturovaný životopis
Strukturovaný životopis Mgr. Magdaléna Rysová Osobní informace E-mail: magdalena.rysova@post.cz WWW: https://ufal.mff.cuni.cz/magdalena-rysova Vzdělání od 2012 FF UK v Praze: doktorské studium, obor Český
Úvod do programovacích jazyků (Java)
Úvod do programovacích jazyků (Java) Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programovacích jazyků (Java), 2007/2008 c 2006 2008 Michal Krátký Úvod do programovacích
Jak lze v korpusech hledat doklady pro výzkum morfologie?
Seminář cjbb75 1. 4. 2015 Jak lze v korpusech hledat doklady pro výzkum morfologie? Vyhledávání podle morfologické značky problém spolehlivosti desambiguace Vyhledejte v korpusu SYN2010 všechny vokativy
CO DĚLAT, ABY BYLA DATA V DOKTORSKÝCH DISERTACÍCH ZNOVU VYUŽITELNÁ PRO VÝZKUM? Joachim Schöpfel Hélène Prost Cécile Malleret
Prezentace je dostupná pod licencí Creative Commons, licence: CC-BY-SA-4.0 (http://creativecommons.org/licenses/by-sa/4.0/ ), via http://invenio.nusl.cz/record/200846 CO DĚLAT, ABY BYLA DATA V DOKTORSKÝCH
Vyučovací hodina. 1vyučovací hodina: 2vyučovací hodiny: Opakování z minulé hodiny. Procvičení nové látky
Vyučovací hodina 1vyučovací hodina: Opakování z minulé hodiny Nová látka Procvičení nové látky Shrnutí 5 min 20 min 15 min 5 min 2vyučovací hodiny: Opakování z minulé hodiny Nová látka Procvičení nové
Obr. 1.: Hlavní okno ukázka, že poměrně specializovaný medicínský termín se najde i ve velkém Platinum a Wordnetu
Anglicko-český lékařský slovník Lingea (Ing. Miroslav HEROLD, CSc.) Pod rozhraním Lingea Lexicon5 je nyní k dostání nový titul: Anglicko-český lékařský slovník (dále jen ACLL). Na rozdíl od slovníku technického,
Technický slovník anglicko-český a česko-anglický byl již pod rozhraním LEXICON 2 a 4.
Anglicko český technický slovník Lingea Ing. Miroslav HEROLD, CSc. Na Jeronýmovi 2010 byl ke shlédnutí nový slovníkový titul pod rozhraním LEXICON 5 Anglicko-český technický slovník. Toto rozhraní bylo
Specifika a scénáře vykazování dat AnaCredit prostřednictvím systému MtS-ISL-SÚD-SDNS
pecifika a scénáře vykazování dat prostřednictvím systému Mt-IL-ÚD-DN Verze dokumentu: Verze Komentář Datum 1.0 Úvodní verze specifika pro datové soubory, scénáře zasílání. 04/06/2018 Přílohy: Příloha
současný neformální mluvený jazyk (komunikace v rodině nebo mezi přáteli), včetně propojení přepisu se zvukem;
NABÍDKOVÝ LIST Ústav Českého národního korpusu Filozofická fakulta UK v Praze www.korpus.cz Odborné zaměření Český národní korpus je akademický projekt při FF UK, který se dlouhodobě soustředí na sběr,
5.1.5 Německý jazyk - 2. stupeň
5.1.5 Německý jazyk - 2. stupeň Charakteristika předmětu Obsahové, časové a organizační vymezení předmětu: Vzdělávání v předmětu Německý jazyk směřuje k: rozvíjení písemného i ústního projevu, vyjádření
Francouzský jazyk. Náměty jeu de role skupinová práce jazykové hry domácí úkoly práce s časopisy
Francouzský jazyk ročník TÉMA VÝSTUP G5 Tematické okruhy rodina škola místo, kde žije bydlení volný čas a zájmová činnost jídlo oblékání nákupy některé svátky, tradice příroda cizí země omluva a reakce
Sémantický web 10 let poté
Sémantický web 10 let poté Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2011, 26. 5. 2011 Vilém Sklenák
Dovednosti dospělých v prostředí informačních technologií
Mezinárodní výzkum dospělých Programme for the International Assessment of Adult Competencies Dovednosti dospělých v prostředí informačních technologií Lucie Kelblová PIAAC Mezinárodní výzkum vědomostí
Zpráva o přípravě a realizaci hlavního šetření PISA 2018
Zpráva o přípravě a realizaci hlavního šetření PISA 2018 Základní informace o šetření PISA Projekt Organizace pro hospodářskou spolupráci a rozvoj PISA (Programme for International Student Assessment)
Tematický plán učiva
Tematický plán učiva Předmět Jazyk anglický Školní rok 2013/2014 Třída-ročník 7. Vyučující : Mgr. Martina Štěpánová Rozumí obsahu jednoduché a zřetelně vyslovované konverzace dvou či více osob. 2. Když
Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce
1 JAZYK A JAZYKOVÁ KOMUNIKACE UČEBNÍ OSNOVY 1. 2 Cvičení z českého jazyka Cvičení z českého jazyka 7. ročník 1 hodina 8. ročník 1 hodina 9. ročník 1 hodina Charakteristika Žáci si tento předmět vybírají
Moravské gymnázium Brno s.r.o. Hana Blaudeová. Ročník 2. Datum tvorby Anotace. -prezentace určena pro učitele
Číslo projektu Název školy Autor Tematická oblast CZ.1.07/1.5.00/34.0743 Moravské gymnázium Brno s.r.o. Hana Blaudeová Český jazyk Ročník 2. Datum tvorby 05.05.2013 Anotace -prezentace určena pro učitele
Manuál k programu RIZIKA
Manuál k programu RIZIKA nástroj k efektivnímu vyhledávání a řízení pracovních rizik Program RIZIKA Program RIZIKA jsou víceuživatelskou aplikací s možností nastavení uživatelských práv pro jednotlivé
MODERNÍ PŘÍSTUPY K MANAGEMENTU
MLÁDKOVÁ Ludmila MODERNÍ PŘÍSTUPY K MANAGEMENTU Obsah Předmluva... VII 1. Znalostní pracovník... 1 1.1 Znalostní pracovník definice... 1 1.2 Charakteristické rysy znalostního pracovníka... 2 1.3 Rozdíl
ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14
ZÁKLADY PROGRAMOVÁNÍ Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 Co je vhodné vědět, než si vybereme programovací jazyk a začneme programovat roboty. 1 / 13 0:40 Implementace Umělá inteligence (UI) Umělá inteligence
Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112
Sémantické sítě a rámce Petr Křemen Katedra kybernetiky, FEL ČVUT Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112 Co nás čeká 1 Úvod do reprezentace znalostí 2 Sémantické sítě
Natural Language Toolkit
Natural Language Toolkit prezentace do předmětu PA154 Nástroje pro korpusy část 1 možnosti NLTK Stručná charakteristika NLTK je sada knihoven pro Python a programů pro symbolické a statistické zpracování
PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Hana Stryalová Aj5-kap-str-psa-04 Z á k l a d o v ý t e x t : Hi Mathew! We are in France now. We are in Paris today. It is a beautiful city
Charakteristika předmětu Anglický jazyk
Charakteristika předmětu Anglický jazyk Vyučovací předmět Anglický jazyk se vyučuje jako samostatný předmět s časovou dotací: Ve 3. 5. ročníku 3 hodiny týdně Výuka je vedena od počátečního vybudování si
Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR
Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR Bod programu: Věcné zpracování (možnosti obohacování dříve dodaných záznamů) Marie.Balikova@nkp.cz Pracovní skupina pro SK, 7.3.
BIM a stavební výrobky
BIM a stavební výrobky Ing. Jan Klečka, Ing. Filip Kalina Útvar technologií a materiálů, ÚVTŘ Obsah Digitalizace stavebnictví v ČR BIM a datové standardy BIM a výrobky 14.06.2018 BIM a stavební výrobky
ve strojovém překladu
Jaká data se používají ve strojovém překladu Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/39 Osnova Typy dat ve strojovém
Lekce 9 - Migrace dat
Lekce 9 - Migrace dat 1 Cíle lekce...1 2 Co je migrace dat?...1 3 Cíle migrace dat...1 4 Parametry migrace dat...1 5 Procesy migrace dat...2 6 Projekt migrace dat...3 7 Zařazení projektu migrace do projektu
PSANÍ. (1) My address is Dlouhá 34, Liberec. Thank you and!
PSANÍ Jazyk Úroveň Autor Kód materiálu Anglický jazyk 5. třída Mgr. Petra Prokophová aj5-kap-prk-psa-06 Z á k l a d o v ý t e x t : Dear Santa, (1) My address is Dlouhá 34, Liberec. Thank you and! (2)I
Slovníky a morfologická analýza
Počítačové zpracování přirozeného jazyka Slovníky a morfologická analýza Daniel Zeman http://ufal.mff.cuni.cz/course/popj1/ Slovník Zásobárna informací o slovech Morfologie vzory ohýbání, pravidelné odvozování
Přehledvzdělávacích materiálů
Přehledvzdělávacích materiálů Název školy Název a číslo OP Název šablony klíčové aktivity Název sady vzdělávacích materiálů Jméno tvůrce vzdělávací sady Číslo sady Anotace Základní škola Želiv Novými materiály
Orphanet Portál pro vzácná onemocnění
Orphanet Portál pro vzácná onemocnění MUDr. Marek Turnovec Ústav biologie a lékařské genetiky 2. lékařské fakulty UK a Fakultní nemocnice v Motole Národní koordinační centrum pro vzácná onemocnění Seminář
Jak na Medline efektivně
Univerzita Karlova v Praze Jak na Medline efektivně MUDr. Jitka Feberová, Ph.D. Ústav vědeckých informací, UK 2.LF Ústav výpočetní techniky UK Seminář Informační medicínské zdroje a způsoby vyhledávání
Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů
- 1.1 - Kapitola 1: Úvod Účel databázových systémů Pohled na data Modely dat Jazyk pro definici dat (Data Definition Language; DDL) Jazyk pro manipulaci s daty (Data Manipulation Language; DML) Správa
Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT
Dnešní téma Oblasti standardizace v ICT Případové studie standardizace v ICT: 1) Znakové sady 2) Jazyk 1. technická infrastruktura transfer a komunikace informací, přístup k informacím, sdílení zdrojů
Inovace CRM systémů využitím internetových zdrojů dat pro malé a střední podniky. Ing. Jan Ministr, Ph.D.
Inovace CRM systémů využitím internetových zdrojů dat pro malé a střední podniky Ing. Jan Ministr, Ph.D. I. Úvod Agenda II. Customer Intelligence (CI),zpracování dat z Internetu III. Analýza obsahu IV.
Gramatika. Přítomný čas prostý a průběhový. Minulý čas prostý pravidelných i nepravidelných sloves. Počitatelná a nepočitatelná podstatná jména
A B C D E F 1 Vzdělávací oblast: Jazyk a jazyková komunikace 2 Vzdělávací obor: Cizí jazyk 3 Vzdělávací předmět Anglický jazyk 4 Ročník: 7. 5 Klíčové kompetence Průřezová témata Výstupy Učivo (Dílčí kompetence)
WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY
WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY Datum konání: 11. dubna 2014 Místo konání: Filozofická fakulta Masarykovy univerzity (učebna G13) Název přednášky: Přednášející: Webové korpusy Aranea
Charakteristika studijního předmětu
Charakteristika studijního předmětu Název studijního předmětu Typ předmětu Cizí jazyk 2 povinný Ročník 1.; 2. Semestr 1.; 2.; 3.; 4. Rozsah studijního předmětu: Počet kreditů: Způsob zakončení: Forma výuky:
PLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika od 70. let 20. st. Mgr. Dana Hlaváčková, Ph.D.
PLIN041 Vývoj počítačové lingvistiky Korpusová lingvistika od 70. let 20. st. Mgr. Dana Hlaváčková, Ph.D. PLIN041 Vývoj počítačové lingvistiky Korpusová lingvistika a počítačová lexikografie Mgr. Dana
Závěrečná práce. Odborný styl
Závěrečná práce Odborný styl Anotace - abstrakt Anotace je napsána na samostatném listu a má rozsah 10 až 15 řádků.je stručným a komplexním popisem obsahu práce, nově objevených skutečností a z nich plynoucích
ČESKÁ TECHNICKÁ NORMA
ČESKÁ TECHNICKÁ NORMA ICS 35.040 2008 Informační technologie - Registry metadat (MDR) - Část 5: Principy identifikace a tvorby názvů dat ČSN ISO/IEC 11179-5 97 9736 Srpen Information technology - Metadata
ONLINE PŘÍPRAVNÝ KURZ KE ZKOUŠCE TOEFL IBT (Internet Based
ONLINE PŘÍPRAVNÝ KURZ KE ZKOUŠCE TOEFL IBT (Internet Based Test) od ETS Chcete získat certifikát, který dokazuje vaši znalosti angličtiny? Cambridge Institute má řešení. Využijte příležitost a zapište
Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky
Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů
FAKULTA INFORMAČNÍCH TECHNOLOGIÍ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV POČÍTAČOVÉ GRAFIKY A MULTIMÉDIÍ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF COMPUTER GRAPHICS AND
Gymnázium a Střední odborná škola Moravské Budějovice. Pravidla pro tvorbu seminárních a maturitních prací
Gymnázium a Střední odborná škola Moravské Budějovice Pravidla pro tvorbu seminárních a maturitních prací Obsah 1. Rychlý přehled... 3 1.1. Vzhled stránky:... 3 1.2. Formát nadpisů:... 3 1.3. Formát odstavcového
Mgr.Jana Berkovcová. Učitelka anglického jazyka. Školní metodik prevence. Školní rok 2018/ Anglický jazyk, 5.ročník. Učivo:
Mgr.Jana Berkovcová Učitelka anglického jazyka Školní metodik prevence Školní rok 2018/ 2019 Anglický jazyk, 5.ročník Učivo: Slovní zásoba na témata anglická abeceda, číslovky 20-100, členové širší rodiny,
Obsah přednášky. programovacího jazyka. Motivace. Princip denotační sémantiky Sémantické funkce Výrazy Příkazy Vstup a výstup Kontinuace Program
Denotační sémantika programovacího jazyka doc. Dr. Ing. Miroslav Beneš katedra informatiky, A-1007 59 732 4213 Obsah přednášky Princip denotační sémantiky Sémantické funkce Výrazy Příkazy Vstup a výstup
P(w i w 1 w 2...w i 1 ) = P(w 1...w i ) P(w 1...w i ) = P(w 1 ) P(w 2 w 1 ) P(w 3 w 1 w 2 )... P(w i w 1...w i 1 ) slova w i
n-gramy a textové korpusy n-gramy Pavel Rychlý, Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Úkol: Je zadáno n slov textu, jaké slovo následuje s největší pravděpodobností? Obsah:
CISAŽP. Celostátní informační systém pro sběr a hodnocení informací o znečištění životního prostředí
CISAŽP Celostátní informační systém pro sběr a hodnocení informací o znečištění životního prostředí Cíl budování systému Komplexně přispět k ochraně a zlepšování životního prostředí v České republice prostřednictvím
Zpráva z evaluačního nástroje Dotazník strategií učení cizímu jazyku
Zpráva z evaluačního nástroje Dotazník strategií učení cizímu jazyku Škola Testovací škola NÚOV, Praha Třída 3. A Předmět Francouzština Učitel pepa novák Vážená paní učitelko, vážený pane učiteli, v této
Programovací jazyky. imperativní (procedurální) neimperativní (neprocedurální) assembler (jazyk symbolických instrukcí)
Programovací jazyky Programovací jazyky nižší assembler (jazyk symbolických instrukcí) vyšší imperativní (procedurální) Pascal, C/C++, Java, Basic, Python, php neimperativní (neprocedurální) Lisp, Prolog
VĚCNÝ POPIS DOKUMENTŮ (VĚCNÁ KATALOGIZACE) Mgr. Dagmar Smékalová
VĚCNÝ POPIS DOKUMENTŮ (VĚCNÁ KATALOGIZACE) Mgr. Dagmar Smékalová smekalova@svkos.cz ZÁKLADNÍ POJMY 1 POŘÁDÁNÍ INFORMACÍ (IDENTIFIKAČNÍ A VĚCNÉ POŘÁDÁNÍ) VĚCNÁ KATALOGIZACE OBSAHOVÁ ANALÝZA DOKUMENTŮ SELEKČNÍ
XERXES Portál informačních zdrojů. Ing. Lukáš Budínský PhDr. Ondřej Fabián
XERXES Portál informačních zdrojů Ing. Lukáš Budínský PhDr. Ondřej Fabián Inforum Inforum 2011 2011 24. 24. května května 2011 2011 Obsah Východiska projektu Proč portál informačních zdrojů? Metavyhledávání
4. Francouzský jazyk
4. Francouzský jazyk 62 Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor: Cizí jazyk Vyučovací předmět: Francouzský jazyk Charakteristika vyučovacího předmětu Vzdělávací obsah vyučovacího
Kohezní politika EU po roce 2013
Kohezní politika EU po roce 2013 Daniel Braun Ministerstvo pro místní rozvoj Karviná, 11. listopadu 2010 Časový kontext přípravy budoucí kohezní politiky EU Schválení Strategie EU 2020 červen 2010. Zveřejnění
Logika a logické programování
Logika a logické programování témata ke zkoušce Poslední aktualizace: 16. prosince 2009 Zkouška je písemná, skládá se obvykle ze sedmi otázek (může být více nebo méně, podle náročnosti otázek), z toho
Vyučovací předmět: Francouzský jazyk. Charakteristika vyučovacího předmětu. Obsahové, časové a organizační vymezení předmětu
5.6. Vzdělávací oblast: Vzdělávací obor: Jazyk a jazyková komunikace Další cizí jazyk Vyučovací předmět: Francouzský jazyk Charakteristika vyučovacího předmětu Vyučovací předmět Francouzský jazyk je součástí
Základy vytěžování dat
Základy vytěžování dat předmět A7Bb36vyd Vytěžování dat Filip Železný, Miroslav Čepek, Radomír Černoch, Jan Hrdlička katedra kybernetiky a katedra počítačů ČVUT v Praze, FEL Evropský sociální fond Praha
vyprávění, popis přítomný čas, minulý čas, předložky, členy, stupňování
P S N Í Jazyk Úroveň utor Kód materiálu nglický jazyk 9. třída Lukáš Valeš aj9-kap-val-psa-09 Z á k l a d o v ý t e x t : Přečtěte si následující popis, který obsahuje několik chyb. Opravte je dle instrukcí
Učebnice, počítač, dataprojektor, interaktivní tabule, plány měst, mapy, smartphone, slovníky
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Německý jazyk Výstupy odpovídající úrovni A2 podle SERR Sexta 4 hodiny týdně Učebnice, počítač, dataprojektor, interaktivní tabule, plány měst, mapy, smartphone,
KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská. 13. 2. 2013 Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!
KORPUSOVÝ WORKSHOP VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT! Václav Cvrček, Lucie Chlumská 13. 2. 2013 Univerzita Karlova v Praze O (Ú)ČNK Ústav Českého národního korpusu, založen v roce