PLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno. Mgr. Dana Hlaváčková, Ph.D.

Podobné dokumenty
Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105

Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.

Koncepce rozvoje Ústavu teoretické a komputační lingvistiky FF UK na období Úvod

KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!

pracoval M. Grepl i knihu o skladbě spisovné češtiny. Mezinárodní ohlas vzbudila sémanticky orientovaná monografie M. Grepla a P.

obecná lingvistika LING Ústav obecné lingvistiky Filozofická fakulta Univerzity Karlovy

DOKTORSKÉ STUDIUM: OBOR OBECNÁ JAZYKOVĚDA

PLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika od 70. let 20. st. Mgr. Dana Hlaváčková, Ph.D.

Karel Pala, Vít Suchomel

Magisterské studium. OJ410 Magisterská diplomní práce všichni

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

ČEŠTINA PRO CIZINCE ČC / JEDNOOBOROVÉ MAGISTERSKÉ STUDIUM PREZENČNÍ

OBECNÁ JAZYKOVĚDA (dvouoborové bakalářské studium) B 7310 Filologie

STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA. Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého

Den otevřených dveří Katedra české literatury a literární vědy Katedra českého jazyka

literatury a interpretace literárního díla) CC / 110. Česká literatura a kultura 19. století Jana Bischofová 2/1 Z 2/1 Zk

Den otevřených dveří Katedra české literatury a literární vědy Katedra českého jazyka

P(w i w 1 w 2...w i 1 ) = P(w 1...w i ) P(w 1...w i ) = P(w 1 ) P(w 2 w 1 ) P(w 3 w 1 w 2 )... P(w i w 1...w i 1 ) slova w i

PROMĚNY ČESKÉ SLAVISTIKY PO ROCE 1989

Počítačové zpracování přirozeného jazyka

WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY

PROMĚNY ČESKÉ SLAVISTIKY PO ROCE 1989

Koncepce rozvoje Ústavu Českého národního korpusu v období Václav Cvrček, Ph.D.

NĚMECKÝ JAZYK A LITERATURA (jednooborové navazující magisterské studium) N 7310 Filologie

Fakulta informatiky Masarykovy university. (pracovní verze) Karel Pala

ÚSTAV ROMÁNSKÝCH STUDIÍ. Oddělení portugalistiky urs.ff.cuni.cz

Informace pro studenty doktorského studijního programu obecná jazykověda a teorie komunikace (OJTK)

n-gramy Jazykové modely a textové korpusy n-gramy pokrač. Markovovy modely Obsah: se dostanou na trh... Jazykové modely Co to je korpus?

Zadávání a vedení bakalářských a diplomových prací na PF UJEP

Současná česká jazykovédná bohemistika jako součást středoevropské slavistiky

Common Language Resources and Their Applications

Sdělení děkana Filozofické fakulty Univerzity Karlovy číslo.../2016. Čl. 1 Úvodní ustanovení

Školitelé: doc. PhDr. Aleš Brandner, CSc. doc. PhDr. Jiří Gazda, CSc.

Specializované korpusy mluveného jazyka - jejich tvorba a využití

Sdělení děkana Filozofické fakulty Univerzity Karlovy v Praze číslo 2015UKFF00993

DOKTORSKÉ STUDIUM: OBOR SROVNÁVACÍ INDOEVROPSKÁ

eština v pohledu synchronním a diachronním

Matematická lingvistika

Další povinnosti / odb. praxe. Návrh témat prací. Návaznost na další stud. prog.

HODNOCENÍ ISO PRO ROK 2012 KATEDRA 714

ROZPIS PŘEDMĚTŮ PRO JEDNOTLIVÉ TYPY STUDIA OBECNÉ JAZYKOVĚDY. Bakalářské studium

Univerzita Karlova v Praze, Filozofická fakulta

ČEŠTINA PRO CIZINCE. ČC / JEDNOOBOROVÉ BAKALÁŘSKÉ STUDIUM PREZENČNÍ (tříleté) Povinné předměty

zejména synonymie a antonymie, s odpovídajícím popisem gramatických vlastností

Práce s lexikálním materiálem a možnosti exemplifikace v lexikální databázi LEXIKON 21 1

Publikační činnost. Václav Cvrček

PROGRAM PONDĚLÍ 14. KVĚTNA 2018

Hodnocení ISO pro rok 2013 katedra 714

DOKTORSKÉ STUDIUM: OBOR HUNGARISTIKA

Využití korpusů pro lingvistická bádání Tony McEnery & Andrew Wilson: Corpus Linguistics, Korpusy zdroje empirických dat Korpusy a výzkum řeči

Strukturovaný životopis

Správa o činnosti organizácie SAV. Príloha D. Údaje o pedagogickej činnosti organizácie. Semestrálne prednášky:

ČESKÝ JAZYK A LITERATURA (jednooborové bakalářské studium) B 7310 Filologie (Platnost akreditace: )

ZPRÁVA O PRŮBĚHU PRACÍ na programovém projektu Informační společnost ET

Zápis č. 11 ze zasedání vědecké rady Filozofické fakulty MU dne 15. října 2015

Obsah: Organizace předmětu IB030. Situace na FI MU A B C D E F 0 49 K Z

K Z A B C D E F Obsah: Organizace předmětu IB030. Situace na FI MU

NÁZEV HABILITAČNÍ PRÁCE: Využití diskriminační analýzy pro predikci budoucího vývoje firmy

DSP Obor délka Aktuální počet Platnost. Specializace v pedagogice Teorie výtvarné výchovy 3 11/

Filozofická fakulta Ostravské univerzity v Ostravě. Informace o přijímacích zkouškách podle studijních programů

Profesní životopis PhDr. Matúš Šucha, PhD.

Hodnocení ISO pro rok 2014 katedra 714

Depfix: Jak dělat strojový překlad lépe než Google Translate

Hodnocení ISO pro rok 2017/18

Polská literatura. Oborová komise: prof. PhDr. Ivo Pospíšil, DrSc. předseda. Mgr. Roman Madecki, Ph.D. místopředseda.

Schéma organizační struktury Slovanského ústavu AV ČR

Radoslav Večerka (* )

Filozofická fakulta Ostravské univerzity

NIZOZEMSKÝ JAZYK A LITERATURA (jednooborové bakalářské studium) B 7310 Filologie

ANGLISTIKA-AMERIKANISTIKA (jednooborové bakalářské studium) B 7311 Anglistika-amerikanistika

Ústav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program

KORPUS SOUKROMÉ KORESPONDENCE (KSK) Z HLEDISKA MORFOLOGICKÉHO ZNAČKOVÁNÍ (Studie byla připravena v rámci projektu GA ČR č.

PhDr. Květoslava Musilová, Dr.

Děkan Filozofické fakulty Univerzity Palackého v Olomouci vypisuje výběrová řízení na obsazení následujících pozic v rámci kateder FF UP:

Seznam projektových workshopů a vzdělávacích akcí konaných mimo PF JU

ČESKÝ JAZYK A LITERATURA (dvouoborové navazující magisterské studium) N 7310 Filologie (Platnost akreditace:

Hodnocení ISO pro rok 2015 katedra 714

ÚSTAV ROMÁNSKÝCH STUDIÍ. Oddělení portugalistiky urs.ff.cuni.cz

PROMĚNY MEDIÁLNÍHO DISKURSU

SOUPIS PRACÍ MIRKA ČEJKY DO ROKU 1990

MASARYKOVA UNIVERZITA FILOZOFICKÁ FAKULTA STUDIJNÍ KATALOG. Kabinet češtiny pro cizince obor Čeština pro cizince

Výroční zpráva katedry českého jazyka a literatury za rok 2009

MORFOLOGICKÉ ZNAČKOVÁNI SLOŽENÝCH SLOVESNÝCH TVARŮ V KORPUSU

Evropské fórum vědy a techniky praha

B00009 Star oslověnština a slavistika 1

O B S A H LINGVISTIKA OBECNÁ 0.0 Obecná problematika 0.00 Obecné otázky. Základní pojmy 0.01 Teorie a metodologie lingvistické práce

Hodnocení projektových návrhů vnitřní soutěže FF UK o rozvojové prostředky na rok 2015

Komunikace a jazyková správnost (pravopis)? Předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU podzim 2015

Profesní životopis PhDr. Matúš Šucha, PhD.

Info schůzka. 16-Jan-16 Open Day - Dept. of English 1

se zaměřením na vzdělávání Časový plán (kreditové hodnocení jednotlivých předmětů odpovídá standardům ECTS)

HODNOCENÍ ISO PRO ROK 2011 KATEDRA 714

Info schůzka. 2-Nov-18 Open Day - Dept. of English 1

Profesní životopis PhDr. Matúš Šucha, PhD.

Představujeme hybridní studijní obor: Český jazyk se specializací počítačová lingvistika. Rozhovor s Danou Hlaváčkovou

Jazykovědné sdružení České republiky

Matúš Šucha: Profesní životopis. Profesní životopis. PhDr. Matúš Šucha, Ph. D. Ke dni: 18. ledna Matúš Šucha. Strana 1 (celkem 6)

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek

GRANTY HISTORICKÉHO ÚSTAVU AV ČR

Na počátku tvorby nového všeobecného výkladového slovníku současné češtiny. Pavla Kochová, Zdeňka Opavská

Transkript:

PLIN041 Vývoj počítačové lingvistiky Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno Mgr. Dana Hlaváčková, Ph.D.

Korpusová lingvistika v ČR lexikografické počátky 1988 Iniciativní skupina pro přípravu počítačových korpusů, textů a slovníků (Pala, Čermák, Schmiedtová, Hajičová ad.) Počítačový fond češtiny, 1992 Skupina pro počítačový fond češtiny Čermák, Králík, Pala, Hajič, Hajičová, Sgall, Schmiedtová, Benko, Kučera 1993 95 Počítačový korpus českých psaných textů (GAČR) spojení s Nakladatelstvím Lidové noviny podpora pro vydání nového výkladového slovníku

Korpusová lingvistika v ČR 1994 založení Ústavu Českého národního korpusu a počátek projektu Český národní korpus ředitel ÚČNK prof. František Čermák (do 2013) 1995 cesta do Velké Británie po centrech korpusové lingvistiky Pala, Čermák, Petkevič, Schmiedtová Oxford University Press, University of Oxford Patrick Hanks School od English, Birmingham City University John Sinclaire Lancaster University Geoffrey Leech

Korpusová lingvistika v ČR počátky pracoviště obtížné (sklep FF UK) nedostatek počítačů nedostatek pracovníků odpor některých lingvistů k novému směru výzkumu postupně rozrůstání týmu lingvisté, matematici, programátoři budování prvního korpusu SYN2000 problematika tokenizace, lemmatizace a tagování spolupráce s ÚFAL MFF UK, ÚTKL FF UK, FF a FI MU

Korpusová lingvistika v ČR příprava korpusového manažeru nepodařilo se získat ze zahraničí Pavel Rychlý CQP (Corpus Query Processor) Universität Stuttgart, Institut für Maschinelle Sprachverarbeitung, prof. Ulrich Heid, autoři CQP Schulze a Christ Manatee Bonito Pavel Rychlý (dizertační práce) webové rozhraní Bonito2, Sketch Engine, KonText

Korpusová lingvistika v SR počátky Jozef Mistrík, frekvenční slovník (1969) materiál v obdobném složení jako Brown Corpus (zcela nezávisle) statistické výpočty na počítači (n. p. Slovnaft) 1988 1994 Emil Páleš formální model flexe slovenštiny (2 tis. lex. jednotek) později rozšířen na cca 40 tis., Benko, Hašanová, Kostolanský (model BHK, Krátky slovník slovenského jazyka) 1991 1993 Spoločná pracovná skupina pre počítačovú lingvistiku (JÚĽŠ + IC) grant Metodika budovania korpusu textov a bázy dát slovenského jazyka 2002 vznik Oddelenia Slovenského národného korpusu (JÚĽŠ SAV) první korpus r. 2006

Filozofická fakulta UJEP/MU Brno bohemistika na FF UJEP se postupně odděluje od slavistiky, české literatury a obecné jazykovědy od poč. 90. let Ústav českého jazyka pracoviště se soustřeďuje hlavně na: diachronní studie a dialektologie (Trávníček, Havránek, Kellner, Lamprecht, Šlosar) syntax (Bauer, Grepl, Karlík)

Filozofická fakulta UJEP/MU Brno Karel Pala (1939, Zlín) 1956 1960 Vysoká škola jazyka ruského a literatury v Praze, specializace překladatelská (čeština a ruština), rektor B. Havránek, později FF UK v Praze vliv Pavla Materny a Pavla Tichého (TIL) 1962 1964 postgraduální kurz z matematické lingvistiky, logiky a informatiky, UK a ÚJČ (pod vedením prof. P. Sgalla) 1964 nástup na FF UJEP Brno 1967 získání titulu PhDr. FF UJEP Brno 1972 1973: lektor českého jazyka na School of Slavonic and East European Studies, UCL, předčasně ukončeno pro odmítnutí spolupráce s StB

Filozofická fakulta UJEP/MU Brno 1973 získání CSc. v oboru český jazyk, Univerzita Karlova, školitel prof. P. Sgall 1993 docentská habilitace v oboru český jazyk (se zaměřením na komputační lingvistiku a počítačové zpracování přirozeného jazyka), MU Brno 1993 1995: lektor českého jazyka na School of Slavonic and East European Studies, University of London 1964 1995 FF UJEP/MU (přesun do Brna na základě konkurzu na místo odb. asistenta, přijímal ho děkan prof. Milan Jelínek od 1995 FI MU Centrum zpracování přirozeného jazyka

Filozofická fakulta UJEP/MU Brno Lidová píseň a samočinný počítač, 1976, Pala, Holý, Štědroň Česká morfologie a syntax v PROLOGU, 1987, Pala, Osolsobě, Franc Logická analýza přirozeného jazyka, 1989, Materna, Pala, Zlatuška Základy výpočetní techniky pro filology, 1989, Pala, Halasová Základy počítačové lingvistiky, 1992, Pala, Osolsobě

Filozofická fakulta UJEP/MU Brno Karel Pala od 1964 Katedra českého jazyka, slovanské a obecné jazykovědy Filozofické fakulty UJEP prosadil užívání počítačů na katedře Seminář počítačové lingvistiky (1992 1995) spolupráce s logikem Pavlem Maternou, informatikem Jiřím Zlatuškou, anglistou Alešem Svobodou morfologická a syntaktická analýza Karel Pala, Klára Osolsobě a Stanislav Franc morfologicko-syntaktický analyzátor klara využívající jazyk Prolog a aparát DC gramatik (Definite Clause Grammars)

Filozofická fakulta UJEP/MU Brno jazykový korektor pro textový editor T602 (Osolsobě, Franc) morfologický analyzátor Xantypa (Osolsobě, Franc) morfologický analyzátor LEMMA (Osolsobě, Pavel Ševeček)

Centrum zpracování přirozeného jazyka korpusový manažer (Bonito), korpusové nástroje morfologická analýza (Ajka) a desambiguace (desamb) syntaktická analýza (synt) počítačová lexikografie (gedit) slovotvorná analýza (Deriv) Czech WordNet slovesná valence (Brief) a sémantika

Karlík Bartáková Večerka Krčmová Rusínová Čejka Pala Lamprecht Erhart Šlosar Grepl Chloupek