Korpusová lingvistika a počítačové zpracování přirozeného jazyka
|
|
- Tadeáš Němeček
- před 5 lety
- Počet zobrazení:
Transkript
1 Korpusová lingvistika a počítačové zpracování přirozeného jazyka Vladimír Petkevič & Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze Korpusový seminář 5. května 2016 Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 1 / 18
2 Osnova 1 Co je to NLP 2 Historie NLP 3 Metody NLP 4 Čím se NLP zabývá 5 Evaluace NLP 6 Odkazy Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 2 / 18
3 Osnova Co je to NLP 1 Co je to NLP 2 Historie NLP 3 Metody NLP 4 Čím se NLP zabývá 5 Evaluace NLP 6 Odkazy Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 3 / 18
4 Co je to NLP (Počítačové zpracování přirozeného jazyka, neboli: natural language processing (NLP) vs. počítačová lingvistika (computational linguistics) Na pomezí: lingvistiky informatiky umělé inteligence akustiky,... Zkoumá: komunikaci mezi lidmi a počítači v přirozeném jazyce typicky: analýzu a syntézu textů nebo řeči Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 4 / 18
5 Co je to NLP Co NLP zvládne NLP jako to dělá člověk: úkol, který je AI-complete Stejně těžké jako naučit počítat zvládnout to, co člověk (strong AI Počítači něco chybí, co to je? Korpusy a NLP NLP jako (spolu)tvůrce NLP jako uživatel NLP jako pomocník uživatele NLP: i jednoduché metody a nástroje pro zpracování textu na počítači Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 5 / 18
6 Osnova Historie NLP 1 Co je to NLP 2 Historie NLP 3 Metody NLP 4 Čím se NLP zabývá 5 Evaluace NLP 6 Odkazy Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 6 / 18
7 Historie NLP Historie 1950: Turingův test 1954: Georgetownský experiment 1966: Zpráva ALPAC (Automatic Language Processing Advisory Committee) 1966: ELIZA 1970: SHRDLU (Terry Winograd) 1990 strojové učení, statistické modely Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 7 / 18
8 Osnova Metody NLP 1 Co je to NLP 2 Historie NLP 3 Metody NLP 4 Čím se NLP zabývá 5 Evaluace NLP 6 Odkazy Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 8 / 18
9 Metody NLP Metody NLP modelování přirozeného jazyka pravidly (rule-based) statisticky (stochastic) hybridně Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 9 / 18
10 Osnova Čím se NLP zabývá 1 Co je to NLP 2 Historie NLP 3 Metody NLP 4 Čím se NLP zabývá 5 Evaluace NLP 6 Odkazy Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 10 / 18
11 Čím se NLP zabývá Čím se NLP zabývá 1/3 strojový překlad (machine translation) porozumění přirozenému jazyku (NL understanding) syntéza/generování přirozeného jazyka (NL generation) rozpoznávání řeči (speech recognition) syntéza řeči (text-to-speech), včetně znakového jazyka tokenizace, segmentace textu i řeči dialogové systémy, telematika, počítač pro smyslově postižené morfologická analýza morfologická desambiguace (part-of-speech tagging) syntaktická analýza (parsing) analýza diskursu (discourse analysis) analýza textů (text analytics, big data) Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 11 / 18
12 Čím se NLP zabývá Čím se NLP zabývá 2/3 určování koreferencí (coreference resolution) lexikální sémantická disambiguace (word sense disambiguation) postojová analýza (sentiment analysis) rozpoznávání pojmenovaných entit (named entity recognition) identifikace jazyka (language identification) optické rozpoznávání znaků (optical character recognition) rozpoznávání spamu detekce plagiátů, kyberšikany a trollingu automatická administrace internetových diskusí forenzní lingvistika, stylometrie výukový software Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 12 / 18
13 Čím se NLP zabývá Čím se NLP zabývá 3/3 korektury pravopisu a gramatiky (spell and grammar checking) zodpovídání dotazů (question answering) rozvíjení dotazů (question expansion) excerpce informací, naplňování báze znalostí z textu (information retrieval, extraction) indexace textu, řeči, videa ( automatická sumarizace (automatic summarization) zjednodušování textu (text simplification) segmentace podle tématu, určování tématu (topic segmentation and recognition) Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 13 / 18
14 Osnova Evaluace NLP 1 Co je to NLP 2 Historie NLP 3 Metody NLP 4 Čím se NLP zabývá 5 Evaluace NLP 6 Odkazy Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 14 / 18
15 Evaluace NLP Vnitřní vs. vnější etalon (gold standard) vs. srovnatelné výsledky jiného nástroje Černá vs. skleněná skříňka výsledky, rychlost, nároky vs. design, metody, algoritmy, lingvistické zdroje Automaticky vs. ručně etalon s dostatečnou mezianotátorskou shodou (IAA) vs. posuzovatelé Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 15 / 18
16 Osnova Odkazy 1 Co je to NLP 2 Historie NLP 3 Metody NLP 4 Čím se NLP zabývá 5 Evaluace NLP 6 Odkazy Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 16 / 18
17 Odkazy Odkazy http: //blog.algorithmia.com/2015/09/getting-started-with-natural-language-processing/ Petkevič & Rosen (ÚTKL FF UK) Korpusy a NLP Seminář ÚČNK 17 / 18
NLP & strojové učení
NLP & strojové učení Miloslav Konopík 2. dubna 2013 1 Úvodní informace 2 Jak na to? Miloslav Konopík () NLP & strojové učení 2. dubna 2013 1 / 13 Co je to NLP? NLP = Natural Language Processing (zpracování
VíceObsah: Organizace předmětu IB030. Situace na FI MU
Úvod do počítačové lingvistiky Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Obsah: Organizace předmětu IB030 Situace na FI MU Úvod do počítačové lingvistiky 1/11 1 / 20 Organizace
VíceObsah: Organizace předmětu IB030. Situace na FI MU A B C D E F 0 49 K Z
Úvod do počítačové lingvistiky Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Obsah: Situace na FI MU Úvod do počítačové lingvistiky 1/11 1 / 18 Hodnocení předmětu: závěrečná písemka
VíceK Z A B C D E F Obsah: Organizace předmětu IB030. Situace na FI MU
Úvod do počítačové lingvistiky Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Hodnocení předmětu: závěrečná písemka (max 80 bodů) jeden řádný a dva opravné termíny průběžný úkol (max
VíceText Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
VíceInovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami. reg. č.: CZ.1.07/2.2.00/28.0076
Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami reg. č.: CZ.1.07/2.2.00/28.0076 Lingvistické aplikace Kateřina Veselovská veselovska@ufal.mff.cuni.cz po 16:45 18:15
VícePočítačové zpracování přirozeného jazyka. Daniel Zeman
Počítačové zpracování přirozeného jazyka Daniel Zeman http://ufal.mff.cuni.cz/course/popj1/ zeman@ufal.mff.cuni.cz Předpoklady Žádné (téměř) Pouze: Základní znalost programování v některém programovacím
VíceNLP zpracování přirozeného jazyka
NLP zpracování přirozeného jazyka Miloslav Konopík 14. května 2013 1 Úvod 2 Motivace 3 Příklady úloh 4 Kouzlo velkých dat 5 Výpočet Miloslav Konopík ( NLP zpracování přirozeného jazyka 14. května 2013
VíceKoncepce rozvoje Ústavu teoretické a komputační lingvistiky FF UK na období Úvod
Koncepce rozvoje Ústavu teoretické a komputační lingvistiky FF UK na období 1. 2. 2016 31. 1. 2019 1. Úvod Ústav teoretické a komputační lingvistiky FF UK (dále ÚTKL) byl založen roku 1990 prof. PhDr.
VíceParalelní korpusy. 0/2 Z, zimní semestr 2006/2007. Alexandr Rosen
Paralelní korpusy 0/2 Z, zimní semestr 2006/2007 Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofická fakulta Univerzity Karlovy v Praze Alexandr Rosen (ÚTKL FF UK ) Paralelní korpusy 1
VícePředstavujeme hybridní studijní obor: Český jazyk se specializací počítačová lingvistika. Rozhovor s Danou Hlaváčkovou
Představujeme hybridní studijní obor: Český jazyk se specializací počítačová lingvistika. Rozhovor s Danou Hlaváčkovou Autorka rozhovoru: Adéla Štelclová Autoři fotografií: Jan Prokopius, Vít Baisa Anotace:
VícePLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno. Mgr. Dana Hlaváčková, Ph.D.
PLIN041 Vývoj počítačové lingvistiky Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno Mgr. Dana Hlaváčková, Ph.D. Korpusová lingvistika v ČR lexikografické počátky 1988 Iniciativní skupina pro
VíceHistorie a vývoj umělé inteligence
Historie a vývoj umělé inteligence 11. února 2015 1-1 Co je to inteligence? Encyklopedie Duden : Intelligenz = Fähigkeit des Menschen abstrakt und vernünftig zu denken und daraus zweckvolles Handeln abzuleiten.
VíceKomunikace člověk počítač v přirozeném jazyce
Komunikace člověk počítač v přirozeném jazyce 16. 5. 2012 10-1 Principy komunikace člověk - počítač v přirozeném jazyce 2 1 3 5 Technischer Dienst 4 Telefonischer Dienst Vertriebs-Dienst 10-2 Sensorické
VíceZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14
ZÁKLADY PROGRAMOVÁNÍ Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 Co je vhodné vědět, než si vybereme programovací jazyk a začneme programovat roboty. 1 / 13 0:40 Implementace Umělá inteligence (UI) Umělá inteligence
VíceÚstav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program
Ústav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program https://ubs.ff.cuni.cz/cs/ Charakteristika studijního programu SP vychází zvl. z vědních oborů: lingvistika, literatura,
VíceUmělá inteligence pro zpracování obrazu a zvuku
Umělá inteligence pro zpracování obrazu a zvuku Jan Švec honzas@ntis.zcu.cz Kontakt: Jan Švec honzas@ntis.zcu.cz jan.svec@speechtech.cz www.linkedin.com/in/jansvec Katedra kybernetiky ZČU v Plzni Katedra
VíceKorpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105
Korpusová lingvistika 2 Mgr. Dana Hlaváčková, Ph.D. CJBB105 Vývoj korpusové lingvistiky raná korpusová lingvistika, počítačová lexikografie, frekvenční studie (90. léta 19. st. 50. léta 20. st.) předěl
VíceDobývání znalostí z textů text mining
Dobývání znalostí z textů text mining Text mining - data mining na nestrukturovaných textových dokumentech 2 možné přístupy: Předzpracování dat + běžné algoritmy pro data mining Speciální algoritmy pro
VíceNatural Language Toolkit
Natural Language Toolkit prezentace do předmětu PA154 Nástroje pro korpusy část 1 možnosti NLTK Stručná charakteristika NLTK je sada knihoven pro Python a programů pro symbolické a statistické zpracování
VíceKorpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.
Korpusová lingvistika a počítačová Od 60. let 20. st. Raná korpusová lingvistika (konec 19. st 50. léta 20. st., Early corpus linguistics) strukturalistická tradice, americký deskriptivismus, metody založené
VíceNAIL072 ROZPOZNÁVÁNÍ VZORŮ
NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační
VíceOBECNÁ JAZYKOVĚDA (dvouoborové bakalářské studium) B 7310 Filologie
OBECNÁ JAZYKOVĚDA (dvouoborové bakalářské studium) B 7310 Filologie Y SPOLEČNÉHO ZÁKLADU POVINNÉ 1 1. Úvod do filozofie* 2. Cizí jazyk** 0p + 12s 3 Zk (Platnost akreditace: 17.2. 2009 1.3. 2015) Zk p 6
VíceWEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY
WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY Datum konání: 11. dubna 2014 Místo konání: Filozofická fakulta Masarykovy univerzity (učebna G13) Název přednášky: Přednášející: Webové korpusy Aranea
VíceVětná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,
Větná polarita v češtině Kateřina Veselovská Žďárek Hořovice, 27. 11. 2009 1 Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání
VíceA2M31RAT- Řečové aplikace v telekomunikacích
A2M31RAT- Řečové aplikace v telekomunikacích Záznam a zpracování hlasových signálů pro potřeby výzkumu a aplikací hlasových technologií. Textové korpusy Doc. Ing. Petr Pollák, CSc. 17.května2011-15:44
VíceStrojové učení a pravidla pro extrakci informací z textů
Strojové učení a pravidla pro extrakci informací z textů Barbora Hladká Ústav formální a aplikované lingvistiky MFF UK http://ufal.mff.cuni.cz Machine Learning Meetups, 2. prosince 2015 Pozvánka Jako výzkumníci
VícePLIN021 Sémantická analýza v praxi
PLIN021 Sémantická analýza v praxi OP VK Mezi bohemistikou a informatikou www.projekt-inova.cz Zuzana Nev ilová xpopelk@fi.muni.cz Centrum zpracování p irozeného jazyka, B203 Fakulta informatiky, Masarykova
VíceCommon Language Resources and Their Applications
Common Language Resources and Their Applications http://clara.b.uib.no/ Markéta Lopatková Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze formální rámec
VíceVyužití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz
VíceZkušenosti z reálných analýz nestrukturovaných dat
Applied Analytics Zkušenosti z reálných analýz nestrukturovaných dat Seminář ČSSI, 5.11. 2015 Insert insight Karel Jedlička a Lukáš Kulhavý 1 Copyright 2015 Deloitte Development LLC. All rights reserved.
VíceOCR systémy. Semestrální práce z předmětu Kartografická polygrafie a reprografie. Jakub Žlábek, Zdeněk Švec. Editor: Věra Peterová. Praha, květen 2010
Nejznámější Semestrální práce z předmětu Kartografická polygrafie a reprografie Autor: Editor: Věra Peterová Praha, květen 2010 Katedra mapování a kartografie Fakulta stavební ČVUT v Praze Nejznámější
VíceTVORBA JAZYKOVÉHO MODELU ZALOŽENÉHO NA TŘÍDÁCH
TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky a mezioborových inženýrských studií TVORBA JAZYKOVÉHO MODELU ZALOŽENÉHO NA TŘÍDÁCH Autoreferát dizertační práce Jindra Drábková Liberec 2005 Tvorba jazykového
VíceČEŠTINA PRO CIZINCE ČC / JEDNOOBOROVÉ MAGISTERSKÉ STUDIUM PREZENČNÍ
ČEŠTINA PRO CIZINCE ČC Ústav bohemistických studií kromě jazykové výuky zahraničních studentů pořádá od r. 1948 v době vysokoškolských prázdnin Letní školu slovanských studií, na níž probíhají lektorské
VíceForenzní lingvistika. jazykověda ve službách vyšetřování
Forenzní lingvistika jazykověda ve službách vyšetřování Kateřina Veselovská veselovska@ufal.mff.cuni.cz 13. října 2017, Ústav jazyků a komunikace neslyšících Kateřina Veselovská senior research associate
VíceJazyky a jazykové technologie v České republice. Tomáš Svoboda Jan Hajič
Jazyky a jazykové technologie v České republice Tomáš Svoboda Jan Hajič 1 Kolik jazyků máme v ČR? Jeden úřední jazyk (čeština) Skutečnost je složitější Turistika Obchod a mezinárodní komerční aktivity
VíceAutomatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus David Mareček obhajoba diplomové práce 8. 9. 2008 Motivace Na t-rovině jsou si jazyky podobnější alignment by zde měl být
VíceDolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT
Dolování dat z multimediálních databází Ing. Igor Szöke Speech group ÚPGM, FIT, VUT Obsah prezentace Co jsou multimediální databáze Možnosti dolování dat v multimediálních databázích Vyhledávání fotografií
VíceModernizace a inovace výpočetní kapacity laboratoří ITE pro účely strojového učení. Jiří Málek
Modernizace a inovace výpočetní kapacity laboratoří ITE pro účely strojového učení Jiří Málek Cíl projektu Cíl: Zefektivnění vzdělávání na ITE* v oblasti strojového učení pomocí posílení dostupné výpočetní
VíceFaktorované překladové modely. Základní informace
Základní informace statistická metoda překladu statistická metoda překladu založena na frázích (nikoliv slovo slovo) statistická metoda překladu založena na frázích (nikoliv slovo slovo) doplňková informace
VíceStrukturovaný životopis
Strukturovaný životopis Mgr. Magdaléna Rysová Osobní informace E-mail: magdalena.rysova@post.cz WWW: https://ufal.mff.cuni.cz/magdalena-rysova Vzdělání od 2012 FF UK v Praze: doktorské studium, obor Český
VíceSémantický web 10 let poté
Sémantický web 10 let poté Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2011, 26. 5. 2011 Vilém Sklenák
VíceFilozofická fakulta. Compiled Jan 21, :48:06 PM by Document Globe 1
Filozofická fakulta Na této stránce najdete kompletní nabídku Filozofické fakulty Univerzity Karlovy. Pokud máte zájem o kompletní nabídku, navštivte hlavní stránku. Přehled vědeckých týmů Centrum pro
VíceEfektivní komunikace díky inovativním hlasovým technologiím. Praha, 25.11.2011 Call centrum ve finančních službách
Efektivní komunikace díky inovativním hlasovým technologiím Praha, 25.11.2011 Call centrum ve finančních službách Agenda Představení společnosti Ovládání hlasových aplikací přirozenou řečí Nové bezpečností
VíceJazyky a počítač: překážky a možnosti. Eva Hajičová MFF UK Praha
Jazyky a počítač: překážky a možnosti Eva Hajičová MFF UK Praha Historický pohled 1947: Warren Weaver, dekódování 1949: memorandum Translation 1952: první konference o SP, USA 1954: Georgetown Univ., R
VíceSémantický web a extrakce
Sémantický web a extrakce informací Martin Kavalec kavalec@vse.cz Katedra informačního a znalostního inženýrství FIS VŠE Seminář KEG, 11. 11. 2004 p.1 Přehled témat Vize sémantického webu Extrakce informací
VíceData Science projekty v telekomunikační společnosti
Data Science projekty v telekomunikační společnosti Jan Romportl Chief Data Scientist, O2 Czech Republic Data, mapa a teritorium Data Science Mezioborová technicky orientovaná oblast, která se zabývá inovativním
VícePrávní datasety. co, proč, kdo a komu. Jakub HARAŠTA. Ústav práva a technologií, Právnická fakulta MU
Právní datasety co, proč, kdo a komu Jakub HARAŠTA Ústav práva a technologií, Právnická fakulta MU Podpořeno Grantovou agenturou České republiky projekt GA17-20645S Obsah Úvod Právní datasety Rozhodovací
VícePanelová diskuse Technologie pro byznys
Panelová diskuse Technologie pro byznys Konference Inteligentní specializace regionu Plzeň, 29. 5. 2019 Cíl a scénář panelové diskuse Hledáme další možnosti spolupráce výzkumné a podnikové sféry v Plzeňském
VíceKarel Pala, Vít Suchomel
PA153 Počítačové zpracování přirozeného jazyka 06 Korpusy a korpusové nástroje, značkování Karel Pala, Vít Suchomel Centrum ZPJ, FI MU, Brno 21. října 2013 Karel Pala, Vít Suchomel PA153 Zpracování přirozeného
VíceCKL. Centrum. lingvistiky. Projekt MŠMT M MT LC536 (LC05) Univerzita Karlova v Praze, ÚFAL MFF. Masarykova Univerzita Brno, FI
CKL --- Centrum komputační lingvistiky Projekt MŠMT M MT LC536 (LC05) Univerzita Karlova v Praze, ÚFAL MFF Západočeská univerzita Plzeň,, KKY FAV Masarykova Univerzita Brno, FI Ústav pro jazyk český AV
Víceobecná lingvistika LING Ústav obecné lingvistiky Filozofická fakulta Univerzity Karlovy
LING Ústav obecné lingvistiky Filozofická fakulta Univerzity Karlovy obecná lingvistika Den otevřených dveří 11. ledna 2014 15 hodin, nám. Jana Palacha 2, míst. 104 LING oddělení lingvistiky Filozofická
VíceEXTRAKCE STRUKTUROVANÝCH DAT O PRODUKTOVÝCH A PRACOVNÍCH NABÍDKÁCH POMOCÍ EXTRAKČNÍCH ONTOLOGIÍ ALEŠ POUZAR
EXTRAKCE STRUKTUROVANÝCH DAT O PRODUKTOVÝCH A PRACOVNÍCH NABÍDKÁCH POMOCÍ EXTRAKČNÍCH ONTOLOGIÍ ALEŠ POUZAR PŘEDMĚT PRÁCE Popis extrakce strukturovaných dat ve vybraných doménách ze semistrukturovaných
VíceInformace pro výběr bakalářského oboru
Informace pro výběr bakalářského oboru 2017.03.15 J. Matas Bakalářské obory informatika a počítačové vědy software internet věcí počítačové hry a grafika kapacita všech oborů je dostatečná pro volný výběr
VícePortál IT komunity v ČR Kamil Matoušek, Jiří Kubalík ČVUT Praha
Portál IT komunity v ČR Kamil Matoušek, Jiří Kubalík ČVUT Praha Projekt SoSIReČR SoSIReČR = Sociální síť informatiků v regionech České republiky Projekt je hrazen z rozpočtu Evropského sociálního fondu
VíceK čemu je studentovi střední školy teoretická informatika?
K čemu je studentovi střední školy teoretická informatika? 9. konference škol vyučujících IT Blatná, 7. 10. 2011 Daniel Lessner, KSVI MFF UK lessner@ksvi.mff.cuni.cz Osnova Úvod Pojmy Čím se zabývám Příklady
VíceMzdy na ÚFALu
Mzdy na ÚFALu 2009 4.5.2009 1 Mzdové tabulky UK Univerzitní mzdové tabulky (předpis UK) Nespadají po státní systém (odměňování státní správy) Třída ~ tarifní rozpětí, plus osobní ohodnocení Akademické
VíceVývojové trendy 1. Dnešní téma. Vývojové trendy 2. Vývojové trendy ve zpracování informací a znalostí
Dnešní téma Vývojové trendy 1 Vývojové trendy ve zpracování informací a znalostí Znalostní management Využití umělé inteligence Sémantický web Zpracování přirozeného jazyka 1 Hnacím motorem vývoje v současnosti
VíceUvod Modely n-tic Vyhodnocov an ı Vyhlazov an ı a stahov an ı Rozˇ s ıˇ ren ı model u n-tic Jazykov e modelov an ı Pavel Smrˇ z 27.
Jazykové modelování Pavel Smrž 27. listopadu 2006 Osnova 1 Úvod motivace, základní pojmy 2 Modely n-tic 3 Způsob vyhodnocování 4 Vyhlazování a stahování 5 Rozšíření modelů n-tic 6 Lingvisticky motivované
Vícesoučasný neformální mluvený jazyk (komunikace v rodině nebo mezi přáteli), včetně propojení přepisu se zvukem;
NABÍDKOVÝ LIST Ústav Českého národního korpusu Filozofická fakulta UK v Praze www.korpus.cz Odborné zaměření Český národní korpus je akademický projekt při FF UK, který se dlouhodobě soustředí na sběr,
VíceÁ Ě Í Ě Á Á ó č ž č ž č Í š úč é úč š ž č é ů č é č é é ů č ů č č ů é Ž š ů ů š č é Ž č é Ž č Í ž Ž Ž é é Ů é Ř ů ť š é é č é é é š č č é č č č č š č š é č é č ů č č š ú é č é š é Ž Ž é é ú č č é ů č š
Víceúč úč ž ů ž Č Č č č ů ž úč č úč ť Ň č ú Ý č č Ú Ú ť ú č ď ů ž š úč ž úč úč ž ť ď ť ď ž ú č č úč š ž Ů č č ú úč ž ů ť úč ž ž ž Ů č ž ú č Š úč č Úč Č Č š ď š Š š Ó Ó ž ůč ú Ď ť ž ů ů č ů Č ů ž úč Ý č ž úč
Víceč ů š ň č č Ú č č č Ú ů Ú č ž ú š š ý č ú ó ó ž č ý ý ý č ž č ý ž ý č ý ž ž č ý ý ý ž ý ý ý ý š ý š ů ů č č ý ž č ý ů š ž ý Ú Ú úč š ů ž ů ů Úč ž č ý č š ý ů č š ý ý ý ů č č ž ů š ů ů š ý ý ů ů č č ž ú
VíceRudolf Rosa. Strojový překlad pojmenovaných entit za pomoci Wikipedie
Rudolf Rosa Strojový překlad pojmenovaných entit za pomoci Wikipedie Obsah Strojový překlad Statistický strojový překlad Frázový statistický strojový překlad Překlad pojmenovaných entit O. Hálek, R. Rosa,
VíceČEŠTINA PRO CIZINCE. ČC / JEDNOOBOROVÉ BAKALÁŘSKÉ STUDIUM PREZENČNÍ (tříleté) Povinné předměty
ČEŠTINA PRO CIZINCE ČC Ústav bohemistických studií kromě jazykové výuky zahraničních studentů pořádá od r. 1948 v době vysokoškolských prázdnin Letní školu slovanských studií, na níž probíhají lektorské
VíceAutomatická post-editace výstupů frázového strojového překladu (Depfix)
Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj (WMT 2010):
VícePublikační činnost. Václav Cvrček
Publikační činnost Monografie a rozsáhlejší publikace: Cvrček, V.: Kvantitativní analýza kontextu. NLN. Praha 2013. Cvrček, V. Cvrčková Porkertová, L.: Velký slovník rýmů. NLN. Praha 2011. Cvrček, V. Kodýtek,
VíceMotivace pro jazykovou správnost. Prezentace pro předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU podzim 2014
Motivace pro jazykovou správnost Prezentace pro předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU podzim 2014 Proč potřebujeme pravopis? Abychom komplikovali život sobě (a studentům)?
VíceMartin Dostal Analýza nestrukturovaných dat s využitím Linked Data
Martin Dostal Analýza nestrukturovaných dat s využitím Linked Data Katedra informatiky a výpočetní techniky Fakulta aplikovaných věd Západočeská univerzita v Plzni 1) Linked Data Obsah Problém s různou
VíceKomunikace a jazyková správnost (pravopis)? Předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU podzim 2015
Komunikace a jazyková správnost (pravopis)? Předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU podzim 2015 Pozitivní komunikace Výchozí axiom: nelze nekomunikovat Naše civilizace stojí
VíceProcesuální rušení langue aneb Kdo za to taky může?
Procesuální rušení langue aneb Kdo za to taky může? Radek Čech katedra českého jazyka FF Ostravská univerzita Procesuální rušení langue aneb Kdo za to taky může? Procesuální rušení langue aneb Kdo za to
VíceAffisix. Matematicko-fyzikální fakulta Univerzity Karlovy v Praze, Česká Republika,
Automatické rozpoznávání předpon a přípon s pomocí nástroje Affisix Jaroslava Hlaváčová, Michal Hrušecký Matematicko-fyzikální fakulta Univerzity Karlovy v Praze, Česká Republika, Hlavacova@ufal.mff.cuni.cz,
Víceve strojovém překladu
Jaká data se používají ve strojovém překladu Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky MFF UK ELRC Training Workshop, 15. prosinec 2015 1/39 Osnova Typy dat ve strojovém
VíceMatematická lingvistika
Matematická lingvistika Ve druhé polovině 20. stol. dochází ve vědě k výrazné změně charakterizované vznikem nových pomezních oborů. Tradiční odvětví vědy přijímají nové metody z oborů blízkých i relativně
VíceAutomatické párování uzlů českých a anglických tektogramatických stromů
Automatické párování uzlů českých a anglických tektogramatických stromů David Mareček pondělní seminář 13. 10. 2008 Osnova rozdíly mezi párováním na morfologické a na tektogramatické rovině ruční párování
VíceGENEROVÁNÍ KÓDU 9. SHRNUTÍ - PŘÍKLAD POSTUPU PŘEKLADU VSTUPNÍHO PROGRAMU (ZA POUŽITÍ DOSUD ZNÁMÝCH TECHNIK)
GENEROVÁNÍ KÓDU 9. SHRNUTÍ - PŘÍKLAD POSTUPU PŘEKLADU VSTUPNÍHO PROGRAMU (ZA POUŽITÍ DOSUD ZNÁMÝCH TECHNIK) 2011 Jan Janoušek MI-GEN Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Úvod
VíceIA161 Pokročilé techniky zpracování přirozeného jazyka
IA161 Pokročilé techniky zpracování přirozeného jazyka Strojový překlad Vít Baisa Překlad angličtina čeština Moses is an implementation of the statistical (or data-driven) approach to machine translation
VíceDoplnění domén do systému zodpovídání otázek UIO
MASARYKOVA UNIVERZITA V BRNĚ FAKULTA INFORMATIKY ^TIS typ Doplnění domén do systému zodpovídání otázek UIO BAKALÁŘSKÁ PRÁCE Martin Polák Brno,2006 Prohlášení Prohlašuji, že tato bakalářská práce je mým
VíceNĚMECKÝ JAZYK A LITERATURA (jednooborové navazující magisterské studium) N 7310 Filologie
NĚMECKÝ JAZYK A LITERATURA (jednooborové navazující magisterské studium) N 7310 Filologie (Platnost akreditace: 10.5. 2011 31.5. 2017) PP povinné předměty OBOROVÉ PŘEDMĚTY POVINNÉ 1 dop. kr. přednášející
VícePLIN021 Sémantická analýza v praxi
PLIN021 Sémantická analýza v praxi OP VK Mezi bohemistikou a informatikou www.projekt-inova.cz Zuzana Nevěřilová xpopelk@fi.muni.cz Centrum zpracování přirozeného jazyka, B203 Fakulta informatiky, Masarykova
VícePočítačové zpracování přirozeného jazyka
Fakulta informatiky Masarykovy university Počítačové zpracování přirozeného jazyka Karel Pala Brno, září 2000 Obsah 1 Předmluva 4 2 Úvod 7 2.1 Roviny analýzy jazyka...................... 11 2.2 Reprezentace
VíceBakalářská práce Framework pro prezentaci NLP algoritmů
Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra informatiky a výpočetní techniky Bakalářská práce Framework pro prezentaci NLP algoritmů Plzeň 2016 Roman Zeleník Místo této strany bude
VíceReálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce
1 JAZYK A JAZYKOVÁ KOMUNIKACE UČEBNÍ OSNOVY 1. 2 Cvičení z českého jazyka Cvičení z českého jazyka 7. ročník 1 hodina 8. ročník 1 hodina 9. ročník 1 hodina Charakteristika Žáci si tento předmět vybírají
VíceKONTROLA KONZISTENCE INFORMACÍ EXTRAHO- VANÝCH Z TEXTU CONSISTENCY CHECKING OF RELATIONS EXTRACTED FROM TEXT
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV POČÍTAČOVÉ GRAFIKY A MULTIMÉDIÍ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF COMPUTER GRAPHICS AND
VíceMetody analýzy modelů. Radek Pelánek
Metody analýzy modelů Radek Pelánek Fáze modelování 1 Formulace problému 2 Základní návrh modelu 3 Budování modelu 4 Verifikace a validace 5 Simulace a analýza 6 Sumarizace výsledků Simulace a analýza
VícePříloha č. 1 Návrh Projektu velké infrastruktury schválený vládou
Příloha č. 1 Návrh Projektu velké infrastruktury schválený vládou Projekt LINDAT/CLARIN Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum Uchazeč Uchazečem o podporu je Univerzita
VíceTechnologie počítačového zpracování řeči
hlasová komunikace pod kontrolou Technologie počítačového zpracování řeči Pavel Cenek OptimSys, s.r.o. 5. odborný seminář Teorie a praxe IP telefonie Praha, 5. 6. prosince 2012 Řečové technologie přehled
VíceUčíme počítače (nejen) česky: ÚFAL
Učíme počítače (nejen) česky: ÚFAL Barbora Hladká Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze http://ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky
VícePočítače a volný čas dětí a mládeže
Počítače a volný čas dětí a mládeže ICT Koordinátor Jihlava, listopad 2007 Tomáš Pitner Masarykova univerzita, Brno Universität Wien e-mail: tomp@fi.muni.cz, tel: 549495940 Obsah modulu Počítač a volný
VíceMichal Laclavík Martin Šeleng. Vyh adávanie informácií
Michal Laclavík Martin Šeleng Vyh adávanie informácií Slovenská technická univerzita v Bratislave 2012 RNDr. Michal Laclavík, PhD., Mgr. Martin Šeleng, PhD. Lektori: Prof. Ing. Ján Parali, PhD. Mgr. Gabriela
VíceUčící se klasifikátory obrazu v průmyslu
Učící se klasifikátory obrazu v průmyslu FCC průmyslové systémy s.r.o. FCC průmyslové systémy je technicko obchodní společností, působící v oblasti průmyslové automatizace. Tvoří ji dvě základní divize:
VíceAutomatická post-editace výstupů frázového strojového překladu (Depfix)
Rudolf Rosa diplomová práce Automatická post-editace výstupů frázového strojového překladu (Depfix) Automatic post-editing of phrase-based machine translation outputs Motivační příklad Zdroj: All the winners
VíceDalší povinnosti / odb. praxe. Návrh témat prací. Návaznost na další stud. prog.
Teoretická informatika Složitost I 2p+1c Z, Zk P RNDr. Čepek, PhD není stanoven Složitost II 2p+1c Z, Zk PV RNDr. Čepek, PhD Vyčíslitelnost II 2p Zk PV doc. Kučera, CSc. Datové struktury I 2p Zk P RNDr.
VíceInformatika na gymnáziu Dan Lessner
Informatika na gymnáziu Dan Lessner ksvi.mff.cuni.cz/ucebnice ucime-informatiku.blogspot.cz Osnova 1. Osnova 2. Úvod 3. Výzkumné otázky 4. Metodika 5. Vymezení oboru 6. Pilotáž a výsledky 7. Závěr Credit:
VíceÚvod do strojového překladu PV061. Vít Baisa, Karel Pala Centrum ZPJ FI MU
Úvod do strojového překladu PV061 Vít Baisa, Karel Pala vit.baisa@gmail.com pala@fi.muni.cz Centrum ZPJ FI MU Historie strojového překladu C. Shannon, W. Weaver (1948-49): text v čínštině je stejný jako
VíceDobývání znalostí z webu web mining
Dobývání znalostí z webu web mining Web Mining is is the application of data mining techniques to discover patterns from the Web (Wikipedia) Tři oblasti: Web content mining (web jako kolekce dokumentů)
VícePojednání k SDZ. Ing. Martin Ondra. Ústav Konstruování Odbor Průmyslového Designu Fakulta strojního inženýrství Vysoké učení technické v Brně
Ing. Martin Ondra Ústav Konstruování Odbor Průmyslového Designu Fakulta strojního inženýrství Vysoké učení technické v Brně Základní informace Název: Identita značky v designu průmyslového výrobku Školitel:
Více1. Přehled cizojazyčných a vícejazyčných korpusů
1. Přehled cizojazyčných a vícejazyčných korpusů typy korpusů a možnosti jejich využití 2. Nová verze korpusu InterCorp (prosinec 2014) nové jazyky a texty lemmatizace a značkování 3. Webové korpusy srovnatelné
VíceKarta předmětu prezenční studium
Karta předmětu prezenční studium Název předmětu: Objektově orientovaná analýza a návrh (OOAN) Číslo předmětu: 548-0040 Garantující institut: Garant předmětu: Institut geoinformatiky RNDr. Daniela Szturcová,
VícePAVEL MATERNA A TŘÍSLOŽKOVÁ TEORIE JAZYKA
STUDIA PHILOSOPHICA 62, 2015, 2 ALEŠ HORÁK KAREL PALA PAVEL MATERNA A TŘÍSLOŽKOVÁ TEORIE JAZYKA V tomto textu předkládáme některé výsledky naší dlouholeté odborné spolupráce s Pavlem Maternou, které si
Více