Obsah: Organizace předmětu IB030. Situace na FI MU

Podobné dokumenty
Obsah: Organizace předmětu IB030. Situace na FI MU A B C D E F 0 49 K Z

K Z A B C D E F Obsah: Organizace předmětu IB030. Situace na FI MU

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

NLP & strojové učení

Historie a vývoj umělé inteligence

Umělá inteligence a rozpoznávání

Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

RELATIONAL DATA ANALYSIS

Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV

Komunikace člověk počítač v přirozeném jazyce

Motivace pro jazykovou správnost. Prezentace pro předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU podzim 2014

Komunikace a jazyková správnost (pravopis)? Předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU podzim 2015

IB013 Logické programování I Hana Rudová. jaro 2011

NLP zpracování přirozeného jazyka

Úvod do umělé inteligence, jazyk Prolog

Úvod do umělé inteligence, jazyk Prolog

Úvod do umělé inteligence, jazyk Prolog

IUVENTAS Soukromé gymnázium a Střední odborná škola, s. r. o. Umělá inteligence. Jméno: Třída: Rok:

Úvod do umělé inteligence, jazyk Prolog

KURZ TEORETICKÉ ASPEKTY UMĚLÉ INTELIGENCE (KA 16)

Úvod do umělé inteligence, jazyk Prolog

Úvod do umělé inteligence, jazyk Prolog

Základy umělé inteligence

Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105

Chatboti Virtuální pomocníci pro váš byznys. Watson Solution Market. 14. září 2017 ParkHotel Praha

Institucionální akreditace - bakalářské studium informatiky

Úvod do Informatiky. 0 Organizační pokyny k výuce IB000. Organizátor předmětu: Ondrej Moriš Cvičící (online přes IS MU):

Datová věda (Data Science) akademický navazující magisterský program

Sémantický web 10 let poté

Vzdělávací oblast: Inovace a zkvalitnění Vzdělávací obor: žáci SOU všechny obory výuky cizích jazyků na středních školách

Zabýváme se konstrukcí racionálních agentů.

Informace pro výběr bakalářského oboru

Výukový materiál zpracovaný v rámci operačního programu Vzdělávání pro konkurenceschopnost

H. Dreyfuss: What computers can t do, 1972 What computers still can t do, J. Weizenbaum. Computer power and human reason, 1976


Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Present simple (přítomný čas prostý)

PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :

Nejúspěšnější chatboti a jak fungují?

Název projektu: Multimédia na Ukrajinské

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

Zásadní gramatické struktury (pro SOU) Michal Kadlec, Dis

VZDĚLÁVACÍ MATERIÁL. Závěrečná písemná práce pro 5. ročník z anglického jazyka Mgr. Iveta Milostná VY_32_INOVACE_A19 Pořadové číslo: 19.

VeriFIT Automatizovaná analýza a verifikace

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

KURZ KOGNITIVNÍ VĚDA A UMĚLÁ INTELIGENCE (KA 17)

POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :

Aplikace umělé inteligence Watson a Quill

NÁVRHY TEMATICKÝCH PLÁNŮ. 1. ročník Počet hodin

II_ _Listening Pracovní list č. 2.doc II_ _Listening Pracovní list č. 3.doc II_ _Listening Řešení 1,2.doc

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

UŽITEČNÉ ODKAZY. ROZŘAZOVACÍ TESTY. -Slovní zásoba-nižší úroveň

Kognitivní informatika očima studentů


IA161 Pokročilé techniky zpracování přirozeného jazyka

1, Žáci dostanou 5 klíčových slov a snaží se na jejich základě odhadnout, o čem bude následující cvičení.

Web 2.0 vs. sémantický web

Řečové technologie pomáhají překonávat bariéry

I. ZÁVĚREČNÁ ZPRÁVA PROJEKTU

Úvod do Informatiky 2006

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

POSLECH. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :

Moderní systémy pro získávání znalostí z informací a dat

Project 3 Unit 7B Kelly s problem

PSANÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :

Vývojové trendy 1. Dnešní téma. Vývojové trendy 2. Vývojové trendy ve zpracování informací a znalostí

Úvod do praxe stínového řečníka. Úvod

Umělá&inteligence! Co#o#nás#říká,#i#když#to#(někdy)#nechceme#slyšet?#

Výukový materiál zpracovaný v rámci operačního programu Vzdělávání pro konkurenceschopnost

Hello, let s play! VY_32_INOVACE_STE_05-14_AJ-4. autor Mgr. Šárka Štěpánková. vzdělávací oblast Jazyk a jazyková komunikace. předmět Anglický jazyk

Co je kognitivní informatika?

Mzdy na ÚFALu

VY_22_INOVACE_81. P3 U4A Times and Places

ŠABLONY INOVACE OBSAH UČIVA

Mut goes shopping VY_22_INOVACE_27. Vzdělávací oblast: Jazyk a jazyková komunikace. Vzdělávací obor: Anglický jazyk. Ročník: 6

Sémantický web a extrakce

SYSTÉM PRO AUTOMATICKÉ OVĚŘOVÁNÍ ZNALOSTÍ

Ontologie. Otakar Trunda

Informatika na Univerzitě Palackého

Informatika na gymnáziu Dan Lessner

Vizualizace v Information Retrieval

PAVEL MATERNA A TŘÍSLOŽKOVÁ TEORIE JAZYKA

PROGRAMOVACÍ JAZYKY A PŘEKLADAČE STRUKTURA PŘEKLADAČE

Předměty. Algoritmizace a programování Seminář z programování. Verze pro akademický rok 2012/2013. Verze pro akademický rok 2012/2013

Faktorované překladové modely. Základní informace

PROGRAMOVÁNÍ ROBOTŮ V PROSTŘEDÍ TIA PORTAL Josef Kváč

EU PENÍZE ŠKOLÁM Operační program Vzdělávání pro konkurenceschopnost

Projekt: ŠKOLA RADOSTI, ŠKOLA KVALITY Registrační číslo projektu: CZ.1.07/1.4.00/ EU PENÍZE ŠKOLÁM

Comparation of mobile

obecná lingvistika LING Ústav obecné lingvistiky Filozofická fakulta Univerzity Karlovy

Filozofická fakulta. Compiled Jan 21, :48:06 PM by Document Globe 1

Projekt: ŠKOLA RADOSTI, ŠKOLA KVALITY Registrační číslo projektu: CZ.1.07/1.4.00/ EU PENÍZE ŠKOLÁM

současný neformální mluvený jazyk (komunikace v rodině nebo mezi přáteli), včetně propojení přepisu se zvukem;

Filozofická fakulta Ostravské univerzity v Ostravě. Informace o přijímacích zkouškách podle studijních programů

Strojové učení se zaměřením na vliv vstupních dat

Výukový materiál zpracovaný v rámci operačního programu Vzdělávání pro konkurenceschopnost

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

Další povinnosti / odb. praxe. Návrh témat prací. Návaznost na další stud. prog.

Transkript:

Úvod do počítačové lingvistiky Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Obsah: Organizace předmětu IB030 Situace na FI MU Úvod do počítačové lingvistiky 1/11 1 / 20

Organizace předmětu IB030 Organizace předmětu IB030 Hodnocení předmětu: závěrečná písemka (max 80 bodů) jeden řádný a dva opravné termíny průběžný úkol (max 20 bodů) navíc možnost 1 bodu za netriviální vylepšení slajdů hodnocení součet bodů za písemku i úkol (max 100 bodů) rozdíly zk, k, z různé limity např.: A 80 100 B 73 79 C 65 72 D 58 64 E 50 57 F 0 49 K 45 100 Z 40 100 Úvod do počítačové lingvistiky 1/11 2 / 20

Organizace předmětu IB030 Organizace předmětu IB030 Hodnocení předmětu: závěrečná písemka (max 80 bodů) jeden řádný a dva opravné termíny průběžný úkol (max 20 bodů) navíc možnost 1 bodu za netriviální vylepšení slajdů hodnocení součet bodů za písemku i úkol (max 100 bodů) rozdíly zk, k, z různé limity např.: A 80 100 B 73 79 C 65 72 D 58 64 E 50 57 F 0 49 K 45 100 Z 40 100 Úvod do počítačové lingvistiky 1/11 2 / 20

Organizace předmětu IB030 Organizace předmětu IB030 Hodnocení předmětu: závěrečná písemka (max 80 bodů) jeden řádný a dva opravné termíny průběžný úkol (max 20 bodů) navíc možnost 1 bodu za netriviální vylepšení slajdů hodnocení součet bodů za písemku i úkol (max 100 bodů) rozdíly zk, k, z různé limity např.: A 80 100 B 73 79 C 65 72 D 58 64 E 50 57 F 0 49 K 45 100 Z 40 100 Úvod do počítačové lingvistiky 1/11 2 / 20

Organizace předmětu IB030 Organizace předmětu IB030 Hodnocení předmětu: závěrečná písemka (max 80 bodů) jeden řádný a dva opravné termíny průběžný úkol (max 20 bodů) navíc možnost 1 bodu za netriviální vylepšení slajdů hodnocení součet bodů za písemku i úkol (max 100 bodů) rozdíly zk, k, z různé limity např.: A 80 100 B 73 79 C 65 72 D 58 64 E 50 57 F 0 49 K 45 100 Z 40 100 Úvod do počítačové lingvistiky 1/11 2 / 20

Organizace předmětu IB030 Organizace předmětu IB030 Hodnocení předmětu: závěrečná písemka (max 80 bodů) jeden řádný a dva opravné termíny průběžný úkol (max 20 bodů) navíc možnost 1 bodu za netriviální vylepšení slajdů hodnocení součet bodů za písemku i úkol (max 100 bodů) rozdíly zk, k, z různé limity např.: A 80 100 B 73 79 C 65 72 D 58 64 E 50 57 F 0 49 K 45 100 Z 40 100 Úvod do počítačové lingvistiky 1/11 2 / 20

Organizace předmětu IB030 Organizace předmětu IB030 Hodnocení předmětu: závěrečná písemka (max 80 bodů) jeden řádný a dva opravné termíny průběžný úkol (max 20 bodů) navíc možnost 1 bodu za netriviální vylepšení slajdů hodnocení součet bodů za písemku i úkol (max 100 bodů) rozdíly zk, k, z různé limity např.: A 80 100 B 73 79 C 65 72 D 58 64 E 50 57 F 0 49 K 45 100 Z 40 100 Úvod do počítačové lingvistiky 1/11 2 / 20

Základní informace Organizace předmětu IB030 Základní informace cvičení občas doporučené malé úkoly jeden hodnocený úkol (viz další slajdy) web předmětu http://nlp.fi.muni.cz/poc_lingv/ slajdy průběžně doplňovány na webu předmětu kontakt na přednášejícího Aleš Horák <hales@fi.muni.cz> (Subject: IB030...) Úvod do počítačové lingvistiky 1/11 3 / 20

Základní informace Organizace předmětu IB030 Základní informace cvičení občas doporučené malé úkoly jeden hodnocený úkol (viz další slajdy) web předmětu http://nlp.fi.muni.cz/poc_lingv/ slajdy průběžně doplňovány na webu předmětu kontakt na přednášejícího Aleš Horák <hales@fi.muni.cz> (Subject: IB030...) Úvod do počítačové lingvistiky 1/11 3 / 20

Základní informace Organizace předmětu IB030 Základní informace cvičení občas doporučené malé úkoly jeden hodnocený úkol (viz další slajdy) web předmětu http://nlp.fi.muni.cz/poc_lingv/ slajdy průběžně doplňovány na webu předmětu kontakt na přednášejícího Aleš Horák <hales@fi.muni.cz> (Subject: IB030...) Úvod do počítačové lingvistiky 1/11 3 / 20

Základní informace Organizace předmětu IB030 Základní informace cvičení občas doporučené malé úkoly jeden hodnocený úkol (viz další slajdy) web předmětu http://nlp.fi.muni.cz/poc_lingv/ slajdy průběžně doplňovány na webu předmětu kontakt na přednášejícího Aleš Horák <hales@fi.muni.cz> (Subject: IB030...) Úvod do počítačové lingvistiky 1/11 3 / 20

Základní informace Organizace předmětu IB030 Základní informace cvičení občas doporučené malé úkoly jeden hodnocený úkol (viz další slajdy) web předmětu http://nlp.fi.muni.cz/poc_lingv/ slajdy průběžně doplňovány na webu předmětu kontakt na přednášejícího Aleš Horák <hales@fi.muni.cz> (Subject: IB030...) Úvod do počítačové lingvistiky 1/11 3 / 20

Organizace předmětu IB030 Základní informace Samostatný hodnocený úkol programátorský dva typy programátorský lingvistický programátorský úkol upravit některou z dostupných jazykových knihoven pro češtinu: NLTK Natural Language Toolkit http://www.nltk.org FreeLing http://nlp.lsi.upc.edu/freeling/ Stanford University Natural Language Software http://nlp.stanford.edu/software/ Field Linguist s Toolbox http://www-01.sil.org/computing/toolbox/ Facebook research fasttext https://github.com/facebookresearch/fasttext k odevzdání je zapotřebí: naprogramovaný odsouhlasený vybraný algoritmus na češtině dokumentace programu s ukázkami a návodem na instalaci/spuštění na serveru aurora.fi.muni.cz a vyhodnocením úspešnosti algoritmu na ne zcela triválních českých datech vše odeslat v komprimovaném archivu e-mailem přednášejícímu (Subject: IB030 odevzdani ukolu) do 19. května 2017 hodnocení bude od 0 do 20 bodů podle: složitosti vybraného algoritmus kvality zpracování algoritmu i dokumentace Úvod do počítačové lingvistiky 1/11 4 / 20

Organizace předmětu IB030 Základní informace Samostatný hodnocený úkol programátorský dva typy programátorský lingvistický programátorský úkol upravit některou z dostupných jazykových knihoven pro češtinu: NLTK Natural Language Toolkit http://www.nltk.org FreeLing http://nlp.lsi.upc.edu/freeling/ Stanford University Natural Language Software http://nlp.stanford.edu/software/ Field Linguist s Toolbox http://www-01.sil.org/computing/toolbox/ Facebook research fasttext https://github.com/facebookresearch/fasttext k odevzdání je zapotřebí: naprogramovaný odsouhlasený vybraný algoritmus na češtině dokumentace programu s ukázkami a návodem na instalaci/spuštění na serveru aurora.fi.muni.cz a vyhodnocením úspešnosti algoritmu na ne zcela triválních českých datech vše odeslat v komprimovaném archivu e-mailem přednášejícímu (Subject: IB030 odevzdani ukolu) do 19. května 2017 hodnocení bude od 0 do 20 bodů podle: složitosti vybraného algoritmus kvality zpracování algoritmu i dokumentace Úvod do počítačové lingvistiky 1/11 4 / 20

Organizace předmětu IB030 Základní informace Samostatný hodnocený úkol programátorský dva typy programátorský lingvistický programátorský úkol upravit některou z dostupných jazykových knihoven pro češtinu: NLTK Natural Language Toolkit http://www.nltk.org FreeLing http://nlp.lsi.upc.edu/freeling/ Stanford University Natural Language Software http://nlp.stanford.edu/software/ Field Linguist s Toolbox http://www-01.sil.org/computing/toolbox/ Facebook research fasttext https://github.com/facebookresearch/fasttext k odevzdání je zapotřebí: naprogramovaný odsouhlasený vybraný algoritmus na češtině dokumentace programu s ukázkami a návodem na instalaci/spuštění na serveru aurora.fi.muni.cz a vyhodnocením úspešnosti algoritmu na ne zcela triválních českých datech vše odeslat v komprimovaném archivu e-mailem přednášejícímu (Subject: IB030 odevzdani ukolu) do 19. května 2017 hodnocení bude od 0 do 20 bodů podle: složitosti vybraného algoritmus kvality zpracování algoritmu i dokumentace Úvod do počítačové lingvistiky 1/11 4 / 20

Organizace předmětu IB030 Základní informace Samostatný hodnocený úkol programátorský dva typy programátorský lingvistický programátorský úkol upravit některou z dostupných jazykových knihoven pro češtinu: NLTK Natural Language Toolkit http://www.nltk.org FreeLing http://nlp.lsi.upc.edu/freeling/ Stanford University Natural Language Software http://nlp.stanford.edu/software/ Field Linguist s Toolbox http://www-01.sil.org/computing/toolbox/ Facebook research fasttext https://github.com/facebookresearch/fasttext k odevzdání je zapotřebí: naprogramovaný odsouhlasený vybraný algoritmus na češtině dokumentace programu s ukázkami a návodem na instalaci/spuštění na serveru aurora.fi.muni.cz a vyhodnocením úspešnosti algoritmu na ne zcela triválních českých datech vše odeslat v komprimovaném archivu e-mailem přednášejícímu (Subject: IB030 odevzdani ukolu) do 19. května 2017 hodnocení bude od 0 do 20 bodů podle: složitosti vybraného algoritmus kvality zpracování algoritmu i dokumentace Úvod do počítačové lingvistiky 1/11 4 / 20

Organizace předmětu IB030 Základní informace Samostatný hodnocený úkol lingvistický lingvistický úkol tvorba specializovaných jazykových dat pro evaluaci automatických nástrojů Word Embeddings Analogy Test Set: test: skupina slov, označ, které tam nepatří úkol: 1. tvorba sad slov, ze kterých lze tvořit tyto testy 2. testování a hodnocení ostatních sad sady: # sladkosti zelenina 1. čokoláda, zmrzlina, laskonka, marcipán, nugát, oplatek 2. mrkev, paprika, kedlubna, rajče, cibule, ředkvička testy: 1. laskonka, oplatek, kedlubna, zmrzlina, marcipán 2. ředkvička, kedlubna, mrkev, laskonka, paprika... k odevzdání je zapotřebí: oznámit včas výběr úkolu odeslat výsledek v obou částech dle instrukcí na webu hodnocení bude od 0 do 20 bodů podle: výsledků kombinovaného hodnocení navržených sad Úvod do počítačové lingvistiky 1/11 5 / 20

Organizace předmětu IB030 Základní informace Samostatný hodnocený úkol lingvistický lingvistický úkol tvorba specializovaných jazykových dat pro evaluaci automatických nástrojů Word Embeddings Analogy Test Set: test: skupina slov, označ, které tam nepatří úkol: 1. tvorba sad slov, ze kterých lze tvořit tyto testy 2. testování a hodnocení ostatních sad sady: # sladkosti zelenina 1. čokoláda, zmrzlina, laskonka, marcipán, nugát, oplatek 2. mrkev, paprika, kedlubna, rajče, cibule, ředkvička testy: 1. laskonka, oplatek, kedlubna, zmrzlina, marcipán 2. ředkvička, kedlubna, mrkev, laskonka, paprika... k odevzdání je zapotřebí: oznámit včas výběr úkolu odeslat výsledek v obou částech dle instrukcí na webu hodnocení bude od 0 do 20 bodů podle: výsledků kombinovaného hodnocení navržených sad Úvod do počítačové lingvistiky 1/11 5 / 20

Organizace předmětu IB030 Základní informace Samostatný hodnocený úkol lingvistický lingvistický úkol tvorba specializovaných jazykových dat pro evaluaci automatických nástrojů Word Embeddings Analogy Test Set: test: skupina slov, označ, které tam nepatří úkol: 1. tvorba sad slov, ze kterých lze tvořit tyto testy 2. testování a hodnocení ostatních sad sady: # sladkosti zelenina 1. čokoláda, zmrzlina, laskonka, marcipán, nugát, oplatek 2. mrkev, paprika, kedlubna, rajče, cibule, ředkvička testy: 1. laskonka, oplatek, kedlubna, zmrzlina, marcipán 2. ředkvička, kedlubna, mrkev, laskonka, paprika... k odevzdání je zapotřebí: oznámit včas výběr úkolu odeslat výsledek v obou částech dle instrukcí na webu hodnocení bude od 0 do 20 bodů podle: výsledků kombinovaného hodnocení navržených sad Úvod do počítačové lingvistiky 1/11 5 / 20

Literatura Organizace předmětu IB030 Literatura Pala, Karel: Počítačové zpracování přirozeného jazyka, Brno FI MU, 2000. 190 s. The Oxford handbook of computational linguistics, ed. by Ruslan Mitkov. Oxford University Press, 2003, 784 s. Allen, James: Natural language understanding, Redwood : Benjamin/Cummings Publishing, 1995, 654 s. Chomsky, Noam: Syntaktické struktury, Praha : Academia, 1966. 209 s. Materna, Pavel - Štěpán, Jan: Filozofická logika: nová cesta?, Olomouc (Univerzita Palackého), 2000. 127 s. slajdy na webu předmětu Úvod do počítačové lingvistiky 1/11 6 / 20

Literatura Organizace předmětu IB030 Literatura Pala, Karel: Počítačové zpracování přirozeného jazyka, Brno FI MU, 2000. 190 s. The Oxford handbook of computational linguistics, ed. by Ruslan Mitkov. Oxford University Press, 2003, 784 s. Allen, James: Natural language understanding, Redwood : Benjamin/Cummings Publishing, 1995, 654 s. Chomsky, Noam: Syntaktické struktury, Praha : Academia, 1966. 209 s. Materna, Pavel - Štěpán, Jan: Filozofická logika: nová cesta?, Olomouc (Univerzita Palackého), 2000. 127 s. slajdy na webu předmětu Úvod do počítačové lingvistiky 1/11 6 / 20

Literatura Organizace předmětu IB030 Literatura Pala, Karel: Počítačové zpracování přirozeného jazyka, Brno FI MU, 2000. 190 s. The Oxford handbook of computational linguistics, ed. by Ruslan Mitkov. Oxford University Press, 2003, 784 s. Allen, James: Natural language understanding, Redwood : Benjamin/Cummings Publishing, 1995, 654 s. Chomsky, Noam: Syntaktické struktury, Praha : Academia, 1966. 209 s. Materna, Pavel - Štěpán, Jan: Filozofická logika: nová cesta?, Olomouc (Univerzita Palackého), 2000. 127 s. slajdy na webu předmětu Úvod do počítačové lingvistiky 1/11 6 / 20

Literatura Organizace předmětu IB030 Literatura Pala, Karel: Počítačové zpracování přirozeného jazyka, Brno FI MU, 2000. 190 s. The Oxford handbook of computational linguistics, ed. by Ruslan Mitkov. Oxford University Press, 2003, 784 s. Allen, James: Natural language understanding, Redwood : Benjamin/Cummings Publishing, 1995, 654 s. Chomsky, Noam: Syntaktické struktury, Praha : Academia, 1966. 209 s. Materna, Pavel - Štěpán, Jan: Filozofická logika: nová cesta?, Olomouc (Univerzita Palackého), 2000. 127 s. slajdy na webu předmětu Úvod do počítačové lingvistiky 1/11 6 / 20

Literatura Organizace předmětu IB030 Literatura Pala, Karel: Počítačové zpracování přirozeného jazyka, Brno FI MU, 2000. 190 s. The Oxford handbook of computational linguistics, ed. by Ruslan Mitkov. Oxford University Press, 2003, 784 s. Allen, James: Natural language understanding, Redwood : Benjamin/Cummings Publishing, 1995, 654 s. Chomsky, Noam: Syntaktické struktury, Praha : Academia, 1966. 209 s. Materna, Pavel - Štěpán, Jan: Filozofická logika: nová cesta?, Olomouc (Univerzita Palackého), 2000. 127 s. slajdy na webu předmětu Úvod do počítačové lingvistiky 1/11 6 / 20

Literatura Organizace předmětu IB030 Literatura Pala, Karel: Počítačové zpracování přirozeného jazyka, Brno FI MU, 2000. 190 s. The Oxford handbook of computational linguistics, ed. by Ruslan Mitkov. Oxford University Press, 2003, 784 s. Allen, James: Natural language understanding, Redwood : Benjamin/Cummings Publishing, 1995, 654 s. Chomsky, Noam: Syntaktické struktury, Praha : Academia, 1966. 209 s. Materna, Pavel - Štěpán, Jan: Filozofická logika: nová cesta?, Olomouc (Univerzita Palackého), 2000. 127 s. slajdy na webu předmětu Úvod do počítačové lingvistiky 1/11 6 / 20

Náplň předmětu Organizace předmětu IB030 Náplň předmětu počítačové zpracování přirozeného jazyka (Natural Language Processing, NLP) roviny analýzy jazyka reprezentace morfologických a syntaktických struktur analýza a syntéza: morfologická, syntaktická, sémantická formy reprezentace znalostí o lexikálních jednotkách porozumění jazyku: reprezentace významu věty, inference a reprezentace znalostí Úvod do počítačové lingvistiky 1/11 7 / 20

Náplň předmětu Organizace předmětu IB030 Náplň předmětu počítačové zpracování přirozeného jazyka (Natural Language Processing, NLP) roviny analýzy jazyka reprezentace morfologických a syntaktických struktur analýza a syntéza: morfologická, syntaktická, sémantická formy reprezentace znalostí o lexikálních jednotkách porozumění jazyku: reprezentace významu věty, inference a reprezentace znalostí Úvod do počítačové lingvistiky 1/11 7 / 20

Náplň předmětu Organizace předmětu IB030 Náplň předmětu počítačové zpracování přirozeného jazyka (Natural Language Processing, NLP) roviny analýzy jazyka reprezentace morfologických a syntaktických struktur analýza a syntéza: morfologická, syntaktická, sémantická formy reprezentace znalostí o lexikálních jednotkách porozumění jazyku: reprezentace významu věty, inference a reprezentace znalostí Úvod do počítačové lingvistiky 1/11 7 / 20

Náplň předmětu Organizace předmětu IB030 Náplň předmětu počítačové zpracování přirozeného jazyka (Natural Language Processing, NLP) roviny analýzy jazyka reprezentace morfologických a syntaktických struktur analýza a syntéza: morfologická, syntaktická, sémantická formy reprezentace znalostí o lexikálních jednotkách porozumění jazyku: reprezentace významu věty, inference a reprezentace znalostí Úvod do počítačové lingvistiky 1/11 7 / 20

Náplň předmětu Organizace předmětu IB030 Náplň předmětu počítačové zpracování přirozeného jazyka (Natural Language Processing, NLP) roviny analýzy jazyka reprezentace morfologických a syntaktických struktur analýza a syntéza: morfologická, syntaktická, sémantická formy reprezentace znalostí o lexikálních jednotkách porozumění jazyku: reprezentace významu věty, inference a reprezentace znalostí Úvod do počítačové lingvistiky 1/11 7 / 20

Náplň předmětu Organizace předmětu IB030 Náplň předmětu počítačové zpracování přirozeného jazyka (Natural Language Processing, NLP) roviny analýzy jazyka reprezentace morfologických a syntaktických struktur analýza a syntéza: morfologická, syntaktická, sémantická formy reprezentace znalostí o lexikálních jednotkách porozumění jazyku: reprezentace významu věty, inference a reprezentace znalostí Úvod do počítačové lingvistiky 1/11 7 / 20

Obsah 1 Organizace předmětu IB030 Základní informace Literatura Náplň předmětu 2 Historie počítačové lingvistiky Cíle počítačové lingvistiky 3 Situace na FI MU Přednášky se vztahem k NLP NLP Centre Centrum ZPJ NLP projekty a SW Úvod do počítačové lingvistiky 1/11 8 / 20

Co je počítačová lingvistika Lingvistika: jazykověda (lingua = lat. jazyk) věda o jazycích, jejich třídění, stavbě, zvukové i psané podobě zkoumá strukturu jazyka slovotvorba, kombinace slov do vět, význam věty,... : od 60. let, Computational linguistics, často NLP (Natural Language Processing) spojení umělé inteligence (informatiky) a lingvistiky jako jedna z kognitivních věd zkoumá problémy analýzy či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem. tvoří jazykové modely pojmy algoritmus, datová struktura, (formální) gramatika,... Úvod do počítačové lingvistiky 1/11 9 / 20

Co je počítačová lingvistika Lingvistika: jazykověda (lingua = lat. jazyk) věda o jazycích, jejich třídění, stavbě, zvukové i psané podobě zkoumá strukturu jazyka slovotvorba, kombinace slov do vět, význam věty,... : od 60. let, Computational linguistics, často NLP (Natural Language Processing) spojení umělé inteligence (informatiky) a lingvistiky jako jedna z kognitivních věd zkoumá problémy analýzy či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem. tvoří jazykové modely pojmy algoritmus, datová struktura, (formální) gramatika,... Úvod do počítačové lingvistiky 1/11 9 / 20

Co je počítačová lingvistika Lingvistika: jazykověda (lingua = lat. jazyk) věda o jazycích, jejich třídění, stavbě, zvukové i psané podobě zkoumá strukturu jazyka slovotvorba, kombinace slov do vět, význam věty,... : od 60. let, Computational linguistics, často NLP (Natural Language Processing) spojení umělé inteligence (informatiky) a lingvistiky jako jedna z kognitivních věd zkoumá problémy analýzy či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem. tvoří jazykové modely pojmy algoritmus, datová struktura, (formální) gramatika,... Úvod do počítačové lingvistiky 1/11 9 / 20

Co je počítačová lingvistika Lingvistika: jazykověda (lingua = lat. jazyk) věda o jazycích, jejich třídění, stavbě, zvukové i psané podobě zkoumá strukturu jazyka slovotvorba, kombinace slov do vět, význam věty,... : od 60. let, Computational linguistics, často NLP (Natural Language Processing) spojení umělé inteligence (informatiky) a lingvistiky jako jedna z kognitivních věd zkoumá problémy analýzy či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem. tvoří jazykové modely pojmy algoritmus, datová struktura, (formální) gramatika,... Úvod do počítačové lingvistiky 1/11 9 / 20

Co je počítačová lingvistika Lingvistika: jazykověda (lingua = lat. jazyk) věda o jazycích, jejich třídění, stavbě, zvukové i psané podobě zkoumá strukturu jazyka slovotvorba, kombinace slov do vět, význam věty,... : od 60. let, Computational linguistics, často NLP (Natural Language Processing) spojení umělé inteligence (informatiky) a lingvistiky jako jedna z kognitivních věd zkoumá problémy analýzy či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem. tvoří jazykové modely pojmy algoritmus, datová struktura, (formální) gramatika,... Úvod do počítačové lingvistiky 1/11 9 / 20

Co je počítačová lingvistika Lingvistika: jazykověda (lingua = lat. jazyk) věda o jazycích, jejich třídění, stavbě, zvukové i psané podobě zkoumá strukturu jazyka slovotvorba, kombinace slov do vět, význam věty,... : od 60. let, Computational linguistics, často NLP (Natural Language Processing) spojení umělé inteligence (informatiky) a lingvistiky jako jedna z kognitivních věd zkoumá problémy analýzy či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem. tvoří jazykové modely pojmy algoritmus, datová struktura, (formální) gramatika,... Úvod do počítačové lingvistiky 1/11 9 / 20

Co je počítačová lingvistika Lingvistika: jazykověda (lingua = lat. jazyk) věda o jazycích, jejich třídění, stavbě, zvukové i psané podobě zkoumá strukturu jazyka slovotvorba, kombinace slov do vět, význam věty,... : od 60. let, Computational linguistics, často NLP (Natural Language Processing) spojení umělé inteligence (informatiky) a lingvistiky jako jedna z kognitivních věd zkoumá problémy analýzy či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem. tvoří jazykové modely pojmy algoritmus, datová struktura, (formální) gramatika,... Úvod do počítačové lingvistiky 1/11 9 / 20

Turingův test Historie počítačové lingvistiky z roku 1950, založen na tzv.imitační hře úkol program komunikující jako člověk zahrnuje: zpracování přirozeného jazyka (NLP) reprezentaci znalostí (KRepresentation) vyvozování znalostí (KReasoning) strojové učení (počítačové vidění) (robotiku) od 1991 Loebnerova cena (Loebner Prize) každý rok $4.000 za nejlidštější program, nabízí $100.000 a zlatá medaile za složení celého Turingova testu Úvod do počítačové lingvistiky 1/11 10 / 20

Turingův test Historie počítačové lingvistiky z roku 1950, založen na tzv.imitační hře úkol program komunikující jako člověk zahrnuje: zpracování přirozeného jazyka (NLP) reprezentaci znalostí (KRepresentation) vyvozování znalostí (KReasoning) strojové učení (počítačové vidění) (robotiku) od 1991 Loebnerova cena (Loebner Prize) každý rok $4.000 za nejlidštější program, nabízí $100.000 a zlatá medaile za složení celého Turingova testu Úvod do počítačové lingvistiky 1/11 10 / 20

Turingův test Historie počítačové lingvistiky z roku 1950, založen na tzv.imitační hře úkol program komunikující jako člověk zahrnuje: zpracování přirozeného jazyka (NLP) reprezentaci znalostí (KRepresentation) vyvozování znalostí (KReasoning) strojové učení (počítačové vidění) (robotiku) od 1991 Loebnerova cena (Loebner Prize) každý rok $4.000 za nejlidštější program, nabízí $100.000 a zlatá medaile za složení celého Turingova testu Úvod do počítačové lingvistiky 1/11 10 / 20

Turingův test Historie počítačové lingvistiky z roku 1950, založen na tzv.imitační hře úkol program komunikující jako člověk zahrnuje: zpracování přirozeného jazyka (NLP) reprezentaci znalostí (KRepresentation) vyvozování znalostí (KReasoning) strojové učení (počítačové vidění) (robotiku) od 1991 Loebnerova cena (Loebner Prize) každý rok $4.000 za nejlidštější program, nabízí $100.000 a zlatá medaile za složení celého Turingova testu Úvod do počítačové lingvistiky 1/11 10 / 20

Eliza, Parry,... Historie počítačové lingvistiky Eliza Joseph Weizenbaum, MIT, 1964 66 program napodobující chování psychoterapeuta: young woman: Men are all alike. eliza: In what way? young woman: They re always bugging us about something. eliza: Can you think of a specific example? young woman: Well, my boyfriend made me come here. eliza: Your boyfriend made you come here? young woman: He says I m depressed much of the time. eliza: I am sorry to hear you are depressed. young woman: It s true. I m unhappy. Parry (Kenneth Colby, 70. léta), protějšek Elizy počítačová simulace pacienta postiženého paranoiou oba využívají spíš triky než analýzu praktický význam tzv. expertní systémy, chatboti Úvod do počítačové lingvistiky 1/11 11 / 20

Eliza, Parry,... Historie počítačové lingvistiky Eliza Joseph Weizenbaum, MIT, 1964 66 program napodobující chování psychoterapeuta: young woman: Men are all alike. eliza: In what way? young woman: They re always bugging us about something. eliza: Can you think of a specific example? young woman: Well, my boyfriend made me come here. eliza: Your boyfriend made you come here? young woman: He says I m depressed much of the time. eliza: I am sorry to hear you are depressed. young woman: It s true. I m unhappy. Parry (Kenneth Colby, 70. léta), protějšek Elizy počítačová simulace pacienta postiženého paranoiou oba využívají spíš triky než analýzu praktický význam tzv. expertní systémy, chatboti Úvod do počítačové lingvistiky 1/11 11 / 20

Eliza, Parry,... Historie počítačové lingvistiky Eliza Joseph Weizenbaum, MIT, 1964 66 program napodobující chování psychoterapeuta: young woman: Men are all alike. eliza: In what way? young woman: They re always bugging us about something. eliza: Can you think of a specific example? young woman: Well, my boyfriend made me come here. eliza: Your boyfriend made you come here? young woman: He says I m depressed much of the time. eliza: I am sorry to hear you are depressed. young woman: It s true. I m unhappy. Parry (Kenneth Colby, 70. léta), protějšek Elizy počítačová simulace pacienta postiženého paranoiou oba využívají spíš triky než analýzu praktický význam tzv. expertní systémy, chatboti Úvod do počítačové lingvistiky 1/11 11 / 20

Eliza, Parry,... Historie počítačové lingvistiky Eliza Joseph Weizenbaum, MIT, 1964 66 program napodobující chování psychoterapeuta: young woman: Men are all alike. eliza: In what way? young woman: They re always bugging us about something. eliza: Can you think of a specific example? young woman: Well, my boyfriend made me come here. eliza: Your boyfriend made you come here? young woman: He says I m depressed much of the time. eliza: I am sorry to hear you are depressed. young woman: It s true. I m unhappy. Parry (Kenneth Colby, 70. léta), protějšek Elizy počítačová simulace pacienta postiženého paranoiou oba využívají spíš triky než analýzu praktický význam tzv. expertní systémy, chatboti Úvod do počítačové lingvistiky 1/11 11 / 20

Eliza, Parry,... Historie počítačové lingvistiky Eliza Joseph Weizenbaum, MIT, 1964 66 program napodobující chování psychoterapeuta: young woman: Men are all alike. eliza: In what way? young woman: They re always bugging us about something. eliza: Can you think of a specific example? young woman: Well, my boyfriend made me come here. eliza: Your boyfriend made you come here? young woman: He says I m depressed much of the time. eliza: I am sorry to hear you are depressed. young woman: It s true. I m unhappy. Parry (Kenneth Colby, 70. léta), protějšek Elizy počítačová simulace pacienta postiženého paranoiou oba využívají spíš triky než analýzu praktický význam tzv. expertní systémy, chatboti Úvod do počítačové lingvistiky 1/11 11 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Chatbot dialogový robot Historie počítačové lingvistiky mnoho proprietárních řešení pro návrh dialogových robotů praktické dialogy i pouze udržení zájmu přístupy: pravidla založená na vzorech Artificial Intelligence Markup Language, AIML robot ALICE, Mitsuku vítězí v Loebnerově ceně praktičtější použití, hodně závisí na podkladových pravidlech učení z předchozích dialogů potřebuje velké množství dialogů na učení lépe se přizpůsobí novým tématům (což je plus i mínus, viz Microsoft Tay) robot Cleverbot, Xiaoice Úvod do počítačové lingvistiky 1/11 12 / 20

Turingův test jiné varianty Historie počítačové lingvistiky Winograd Schema Challenge: vyhlášený organizacemi Commonsense Reasoning a Nuance od 2015 strukturovanější test založený na rozpoznávání anafor podrobněji v přednášce o sémantice Turing tests in Creative Arts: DigiLit generování povídek PoetiX generování sonetů Human-Computer Music Interaction AccompaniX, AlgoRhythm generování doprovodné hudby pro duet s člověkem Úvod do počítačové lingvistiky 1/11 13 / 20

Turingův test jiné varianty Historie počítačové lingvistiky Winograd Schema Challenge: vyhlášený organizacemi Commonsense Reasoning a Nuance od 2015 strukturovanější test založený na rozpoznávání anafor podrobněji v přednášce o sémantice Turing tests in Creative Arts: DigiLit generování povídek PoetiX generování sonetů Human-Computer Music Interaction AccompaniX, AlgoRhythm generování doprovodné hudby pro duet s člověkem Úvod do počítačové lingvistiky 1/11 13 / 20

Turingův test jiné varianty Historie počítačové lingvistiky Winograd Schema Challenge: vyhlášený organizacemi Commonsense Reasoning a Nuance od 2015 strukturovanější test založený na rozpoznávání anafor podrobněji v přednášce o sémantice Turing tests in Creative Arts: DigiLit generování povídek PoetiX generování sonetů Human-Computer Music Interaction AccompaniX, AlgoRhythm generování doprovodné hudby pro duet s člověkem Úvod do počítačové lingvistiky 1/11 13 / 20

Turingův test jiné varianty Historie počítačové lingvistiky Winograd Schema Challenge: vyhlášený organizacemi Commonsense Reasoning a Nuance od 2015 strukturovanější test založený na rozpoznávání anafor podrobněji v přednášce o sémantice Turing tests in Creative Arts: DigiLit generování povídek PoetiX generování sonetů Human-Computer Music Interaction AccompaniX, AlgoRhythm generování doprovodné hudby pro duet s člověkem Úvod do počítačové lingvistiky 1/11 13 / 20

Turingův test jiné varianty Historie počítačové lingvistiky Winograd Schema Challenge: vyhlášený organizacemi Commonsense Reasoning a Nuance od 2015 strukturovanější test založený na rozpoznávání anafor podrobněji v přednášce o sémantice Turing tests in Creative Arts: DigiLit generování povídek PoetiX generování sonetů Human-Computer Music Interaction AccompaniX, AlgoRhythm generování doprovodné hudby pro duet s člověkem Úvod do počítačové lingvistiky 1/11 13 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

IBM Watson DeepQA Historie počítačové lingvistiky stroj označovaný jako Watson DeepQA vyvinutý za účelem porazit lidské šampiony ve hře Jeopardy (Riskuj) navazuje tím na stroj DeepBlue, který v roce 1997 porazil Kasparova v šachu po 5 letech vývoje se to Watsonovi podařilo 16.února 2011 princip: vytvoření databáze tvrzení z internetových dat analýza částí otázky, členění otázek podle typu vysoce paralelní hledání odpovědi s určením míry jistoty vyladěný algoritmus pro kombinaci stovek výsledků do výsledného rozhodovacího skóre viz Jak a proč Watson vyhrál Jeopardy! nejedná se o umělou inteligenci podle Turingova testu praktický význam inteligentní zpracování obrovského množství textů pro hledání odpovědi Úvod do počítačové lingvistiky 1/11 14 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Historie počítačové lingvistiky Historie počítačové lingvistiky 1957 rusko-anglický překlad Chomsky (60. léta) generativní gramatika, vrozenost jazyka,... strojový překlad není ani dnes dokonalý potřebuje porozumět obsahu textu (Paretův zákon pravidlo 80/20) problémy víceznačnost, množství významů slov, různé způsoby užití slov k vyjádření významu, Commonsense a lidské uvažování Robert Wilensky: NLP je AI-complete 80. a 90. léta rozvoj formalismů pro syntaktickou analýzu PJ (LFG, LTAG, HPSG) současně zkoumání kvality statistických metod s rozsáhlými daty srovnatelné výsledky! 90. léta až 200x tvorba zdrojů vyšší úrovně (syntakticko-sémantické lexikony, wordnety,...) stále není na obzoru splnění Turingova testu Úvod do počítačové lingvistiky 1/11 15 / 20

Cíle počítačové lingvistiky Cíle počítačové lingvistiky Významné úkoly v NLP: analýza přirozeného jazyka morfologická, syntaktická, sémantická generování přirozeného jazyka syntéza a rozpoznávání řeči strojový překlad (Machine translation) odpovídání na otázky (Question answering) získávání informací (Information retrieval) korektura textu (Spell-checking, Grammar checking) extrakce informací (Information extraction) výtah z textu (Text summarization) určení typu dokumentu (Text Classification/Clustering) Úvod do počítačové lingvistiky 1/11 16 / 20

Cíle počítačové lingvistiky Cíle počítačové lingvistiky Významné úkoly v NLP: analýza přirozeného jazyka morfologická, syntaktická, sémantická generování přirozeného jazyka syntéza a rozpoznávání řeči strojový překlad (Machine translation) odpovídání na otázky (Question answering) získávání informací (Information retrieval) korektura textu (Spell-checking, Grammar checking) extrakce informací (Information extraction) výtah z textu (Text summarization) určení typu dokumentu (Text Classification/Clustering) Úvod do počítačové lingvistiky 1/11 16 / 20

Cíle počítačové lingvistiky Cíle počítačové lingvistiky Významné úkoly v NLP: analýza přirozeného jazyka morfologická, syntaktická, sémantická generování přirozeného jazyka syntéza a rozpoznávání řeči strojový překlad (Machine translation) odpovídání na otázky (Question answering) získávání informací (Information retrieval) korektura textu (Spell-checking, Grammar checking) extrakce informací (Information extraction) výtah z textu (Text summarization) určení typu dokumentu (Text Classification/Clustering) Úvod do počítačové lingvistiky 1/11 16 / 20

Cíle počítačové lingvistiky Cíle počítačové lingvistiky Významné úkoly v NLP: analýza přirozeného jazyka morfologická, syntaktická, sémantická generování přirozeného jazyka syntéza a rozpoznávání řeči strojový překlad (Machine translation) odpovídání na otázky (Question answering) získávání informací (Information retrieval) korektura textu (Spell-checking, Grammar checking) extrakce informací (Information extraction) výtah z textu (Text summarization) určení typu dokumentu (Text Classification/Clustering) Úvod do počítačové lingvistiky 1/11 16 / 20