Syntaxe gramatiky a syntaktické struktury

Podobné dokumenty
Syntaxe gramatiky a syntaktické struktury

Sémantická interpretace

Virtuální počítač. Uživatelský program Překladač programovacího jazyka Operační systém Interpret makroinstrukcí Procesor. PGS K.

Automaty a gramatiky(bi-aag) Motivace. 1. Základní pojmy. 2 domácí úkoly po 6 bodech 3 testy za bodů celkem 40 bodů

Formální jazyky a gramatiky Teorie programovacích jazyků

TÉMATICKÝ OKRUH Teorie zpracování dat, Databázové a informační systémy a Teorie informačních systémů

PROGRAMOVACÍ JAZYKY A PŘEKLADAČE LL SYNTAKTICKÁ ANALÝZA DOKONČENÍ, IMPLEMENTACE.

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

PROGRAMOVACÍ JAZYKY A PŘEKLADAČE FORMALISMY PRO SYNTAXÍ ŘÍZENÝ PŘEKLAD: PŘEKLADOVÉ A ATRIBUTOVÉ GRAMATIKY.

Vztah jazyků Chomskeho hierarchie a jazyků TS

Úvod z historie. Kompilátory. Kompilace / Kompilátor Compile / Compiler. Pojem kompilátoru. Úvod z historie

AUTOMATY A GRAMATIKY. Pavel Surynek. Kontextové uzávěrové vlastnosti Turingův stroj Rekurzivně spočetné jazyky Kódování, enumerace

Konečný automat. Jan Kybic.

1 Úvod do kompilátorů

ALGORITMIZACE A PROGRAMOVÁNÍ

Výroková logika syntaxe a sémantika

/1: Teoretická informatika(ti) přednáška 4

Rekurentní rovnice, strukturální indukce

Výpočetní modely pro rozpoznávání bezkontextových jazyků zásobníkové automaty LL(k) a LR(k) analyzátory

5. Abstraktní podstatná jména se často tvoří odvozováním od přídavných jmen různými příponami. Utvořte:

Implementace LL(1) překladů

Gramatické formalismy pro ZPJ

Bezkontextové jazyky. Bezkontextové jazyky 1 p.1/39

postaveny výhradně na syntaktické bázi: jazyk logiky neinterpretujeme, provádíme s ním pouze syntaktické manipulace důkazy

Automaty a gramatiky

Automaty a gramatiky(bi-aag) Formální překlady. 5. Překladové konečné automaty. h(ε) = ε, h(xa) = h(x)h(a), x, x T, a T.

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

PROGRAMOVACÍ JAZYKY A PŘEKLADAČE LEXIKÁLNÍ ANALÝZA

Prolog PROgramming in LOGic část predikátové logiky prvního řádu rozvoj začíná po roce 1970 Robert Kowalski teoretické základy Alain Colmerauer, David

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Rekurentní rovnice, strukturální indukce

PLIN041 Vývoj počítačové lingvistiky Algebraická lingvistika. Mgr. Dana Hlaváčková, Ph.D. od 2. pol. 50. let 20. st.

Aktuální změny v didaktickém testu z češtiny 2015

Strukturální rozpoznávání

Syntaktická analýza. Implementace LL(1) překladů. Šárka Vavrečková. Ústav informatiky, FPF SU Opava

Jak se dělá GRAMATICKÝ KOREKTOR ČEŠTINY. Karel Oliva Ústav pro jazyk český Akademie věd ČR

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Modelování procesů s využitím MS Visio.

VY_12_INOVACE_32_ZAKLAD_VETY. Časová dotace: 45 min Datum ověření:

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Předmět: Český jazyk a literatura

Vlastnosti Derivační strom Metody Metoda shora dolů Metoda zdola nahoru Pomocné množiny. Syntaktická analýza. Metody a nástroje syntaktické analýzy

Jednoznačné a nejednoznačné gramatiky

Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

2 Formální jazyky a gramatiky

VÝUKOVÝ MATERIÁL. Bratislavská 2166, Varnsdorf, IČO: tel Číslo projektu

Olympiáda v českém jazyce 45. ročník, 2018/2019

UML. Unified Modeling Language. Součásti UML

4.2 Syntaxe predikátové logiky

Překladač sestrojující k regulárnímu výrazu ekvivalentní konečný automat Připomeňme si jednoznačnou gramatiku G pro jazyk RV({a, b})

Depfix: Jak dělat strojový překlad lépe než Google Translate

Výstupy z RVP Učivo Ročník Průřezová témata Termín/hodiny Komunikační a slohová výchova 12 čte s porozuměním přiměřeně náročné texty potichu i nahlas

Semestrální práce 2 znakový strom

Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Vyučovací předmět: Český jazyk a literatura Ročník: 6.

Lexikální analýza Teorie programovacích jazyků

PROGRAMOVACÍ JAZYKY A PŘEKLADAČE STRUKTURA PŘEKLADAČE

Český jazyk - Jazyková výchova

Poslední aktualizace: 14. října 2011

Ročník: 4. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby

Automatická post-editace výstupů frázového strojového překladu (Depfix)

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

Stromy. Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy

/01: Teoretická informatika(ti) přednáška 5

OJ305 TYPOLOGIE JAZYKŮ z pohledu syntaxe

Dataprojektor, jazykové příručky, pracovní listy

Vzdělávací obsah vyučovacího předmětu

Francouzský jazyk. Náměty jeu de role skupinová práce jazykové hry domácí úkoly práce s časopisy

Okresní kolo Olympiády v českém jazyce 2007/ ročník

Deskripční logika. Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Deskripční logika 37 / 157

doplněk, zřetězení, Kleeneho operaci a reverzi. Ukážeme ještě další operace s jazyky, na které je

Ročník: 5. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby

Překladač a jeho struktura

Český jazyk v 5. ročníku

Kolaborativní aplikace

Identifikátor materiálu: EU-3-3, Č, 8.r., Prezentace Přísudek Vytvořeno: Josef Gajdoš (Autor) čeština. - žádné. výklad.

UML a jeho použití v procesu vývoje. Jaroslav Žáček jaroslav.zacek@osu.cz

Sémantický web a extrakce

Modelování procesů (2) Procesní řízení 1

Náhled testu. Přijímací zkouška magisterského studia. konečný automat bez zbytečných stavů, který přijímá jazyk popsaný tímto výrazem, má:

Olympiáda v českém jazyce 45. ročník 2018/2019

Stonožka jak se z výsledků dozvědět co nejvíce

Náhled testu. Přijímací zkouška magisterského studia. konečný automat bez zbytečných stavů, který přijímá jazyk popsaný tímto výrazem, má:

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

Západočeská univerzita v Plzni Dokumentace překladače PL/0 v PHP Předmět KIV/FJP

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 9. Průřezová témata Mezipředmětové vztahy.

Turingovy stroje. Teoretická informatika Tomáš Foltýnek

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

Dataprojektor, kodifikační příručky

SADA VY_32_INOVACE_CJ1

Čtvrtek 8. prosince. Pascal - opakování základů. Struktura programu:

Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova

Čísla značí použité pravidlo, šipka směr postupu Analýza shora. Analýza zdola A 2 B 3 B * C 2 C ( A ) 1 a A + B. A Derivace zleva:

Výstupy z RVP Učivo Ročník Průřezová témata Termín/hodiny Komunikační a slohová výchova 12 čte s porozuměním přiměřeně náročné texty potichu i nahlas

Olympiáda v českém jazyce 44. ročník, 2017/2018

8) Jaké jsou důvody pro použití víceprůchodového překladače Dříve hlavně kvůli úspoře paměti, dnes spíše z důvodu optimalizace

SYNTAX LS Úvod

Školní kolo Olympiády v českém jazyce 2007/ ročník

GENEROVÁNÍ KÓDU 9. SHRNUTÍ - PŘÍKLAD POSTUPU PŘEKLADU VSTUPNÍHO PROGRAMU (ZA POUŽITÍ DOSUD ZNÁMÝCH TECHNIK)

Konstruktory překladačů

Transkript:

Syntaxe gramatiky a syntaktické struktury Aleš Horák E-mail: hales@fimunicz http://nlpfimunicz/poc_lingv/ syntaxe charakterizace dobře utvořených kombinací slovních tvarů do věty nebo fráze pomocí gramatických pravidel výstup ze syntaktické analýzy (např derivační strom) tvoří často vstup pro analýzu sémantickou start sentence ends Obsah: homského teorie syntaxe ýchodiska syntaktické analýzy pes nese ADJ malou kost PREP do pp boudy Základní termíny Úvod do počítačové lingvistiky 5/11 1 / 33 Základní termíny fráze (phrase) jednotka jazyka větší než slovo, ale menší než věta např jmenná fráze, slovesná fráze, adjektivní fráze nebo příslovečná fráze lexikální symbol, lexikální kategorie (lexical category) tzv preterminál speciální neterminál gramatiky, který se přímo přepisuje na terminálový řetězec znaků, tj pravidla tvaru X w pes člověk dům nese chodit psal ADJ PREP AD Úvod do počítačové lingvistiky 5/11 2 / 33 Základní termíny pokrač Základní termíny frázová kategorie (phrasal category) neterminální symbol gramatiky, který nevyjadřuje lexikální kategorii ADJP ADJP ADJ P ADJP P P S P P větný člen (constituent) lexikální nebo frázová kategorie označuje všechny slova, která odpovídají určitému lexikálnímu symbolu (všechna podstatná jména, přídavná jména, ) Úvod do počítačové lingvistiky 5/11 3 / 33 Úvod do počítačové lingvistiky 5/11 4 / 33

Základní termíny Analýza programovacích a přirozených jazyků Základní termíny pokrač větná struktura (sentence structure) strukturovaný popis větných členů povrchová struktura (surface structure) derivační/složkový strom jako výsledek bezkontextové (F) analýzy pes závislostní struktura (dependency structure) zobrazuje závislosti mezi je větnými členy pes S je P zvíře zvíře hloubková struktura (deep structure) sémantická interpretace fráze Popisuje role větných členů (agens, patiens, donor, cause, ) Syntaktická analýza programovacích přirozených jazyků počítačové programy a přirozené jazyky sdíĺı teorii formálních jazyků a praktický zájem o efektivní algoritmy analýzy ALGOL 60 první programovací jazyk popsaný pomocí Backus-aurovy formy (BF) <if_statement> ::= if <boolean_expression> then <statement_sequence> [ else <statement_sequence> ] end if ; dokázalo se, že BF je ekvivalentní FG (1962) podnítilo výzkum formálních jazyků z hlediska jazyků přirozených Typy gramatik Úvod do počítačové lingvistiky 5/11 5 / 33 Analýza programovacích a přirozených jazyků gramatiky: regulární (regular) neterminál terminál[neterminál] S as ekvivalentní síle konečných automatů, S b neumí a n b n bezkontextové (context-free) neterminál cokoliv S asb ekvivalentní síle zásobníkových automatů, umí a n b n, neumí a n b n c n kontextové (context-sensitive) víc termů na levé straně (kontext neterminálu) ASB AaBcB umí a n b n c n rekurzivně vyčíslitelné (recursively enumerable) bez omezení ekvivalentní síle Turingova stroje přirozený jazyk byl dlouho pokládán za bezkontextový nyní prokázáno, že obsahuje kontextové prvky Úvod do počítačové lingvistiky 5/11 7 / 33 Úvod do počítačové lingvistiky 5/11 6 / 33 Gramatiky přirozeného jazyka Gramatiky přirozeného jazyka konkrétní popis gramatiky přirozeného jazyka je velmi složitým úkolem kontrast s faktem, že rodiĺı mluvčí nemívají potíže s pochopením významu vět asi nejstarší formální popis jazyka gramatika sanskrtu od indického učence Paniniho vznikla cca 400 přnl dochovaná v rituálních védických textech gramatika podobná BF (Backus-aurově formě) používala bezkontextových i kontextových pravidel, obsahovala asi 1700 termů zabývala se z větší části morfologíı, nikoliv syntaxí, nebot pořádek slov je v sanskrtu dosti volný toto dílo bylo evropské škole obecné lingvistiky, která má kořeny v řecké a římské tradici, neznámé až do 19 století Úvod do počítačové lingvistiky 5/11 8 / 33

dva základní způsoby zadávání gramatik složkový přístup: složkové stromy elmi velký a těžký slon nastoupil na palubu číslo 12-386-10, kterou tím zatížil na maximum sentence vp skupiny slov tvoří větné jednotky, které jsou označovány jako fráze, a jako větné členy (složky, constituents) formují větu např adjp slon nastoupil PREP na pp podstatné jméno součást jmenné fráze (noun phrase P) jmenná fráze spolu s předložkou tvoří předložkovou frázi (prepositional phrase PP) AD elmi adjp a ADJ velký ADJ těžký palubu, vp syntaktická struktura věty je zachycována jako složkový strom UM 12 číslo - num UM 386 PRO kterou - PRO tím UM 10 zatížil PREP na pp maximum Úvod do počítačové lingvistiky 5/11 9 / 33 pokrač závislostní přístup: jeden člen vazby je označován jako řídící, druhý jako závislý např přídavné jméno závisí na řídícím podstatném jménu syntaktická struktura věty je zachycována pomocí závislostního stromu: uzly odpovídají elementárním jednotkám vstupu (často slovům) hrany označují vztahy závislosti mezi elementárními jednotkami závislost není relací mezi jednotlivými slovy, ale obecně relací mezi jedním slovem a frází řízenou druhým slovem např vazba mezi konkrétním slovesem a podmětem nebo vazba mezi slovesem a předmětem věty technicky vzato, závislostní relace je vztahem mezi uzly a podstromy (uzlem a všemi uzly, které na tomto uzlu závisí) Úvod do počítačové lingvistiky 5/11 11 / 33 Úvod do počítačové lingvistiky 5/11 10 / 33 závislostní stromy elmi velký a těžký slon nastoupil na palubu číslo 12-386-10, kterou tím zatížil na maximum [root] velký a elmi modifier těžký slon subject nastoupil na additional-prep palubu prep-object číslo modifier 12 modifier - modifier 386 modifier - modifier 10 modifier Úvod do počítačové lingvistiky 5/11 12 / 33 zatížil kterou object tím object na additional-prep, maximum prep-object

pokrač hybridní stromy elmi velký a těžký slon nastoupil na palubu číslo 12-386-10, kterou tím zatížil na maximum sentence jen zřídka se používá čistě složkový či striktně závislostní přístup ve složkovém jsou závislosti zpravidla vyjádřeny přidáním označení, která složka je řídící pro danou frázi závislostní strom bývá doplněn o informaci určující lineární precedenci je možné pak mezi těmito přístupy výsledek převádět coord velký a těžký nastoupil slon subject na additional-prep palubu prep-object číslo modifier elmi modifier coord, zatížil 12-386 - 10 kterou object tím object na additional-prep maximum prep-object Úvod do počítačové lingvistiky 5/11 13 / 33 označení uzlu (název neterminálu) podle zvoleného přístupu reprezentuje: gramatická role (gramatická funkce) start charakterizují vztahy mezi větnými složkami na povrchové úrovni určujeme, zda daný větný člen je P v roli podmětu (1pád), P v roli předmětu (4pád), ADP určující lokaci (předl skupina se 6pádem) atd v češtině (a jazycích se systémem gramatických pádů) pomáhá k určení gramatické role právě informace o pádu ovšem přiřazení gramatických roĺı ke gramatickým pádům a naopak není zdaleka jednoznačné n1 ADJ1 Dnešní Úvod do počítačové lingvistiky 5/11 15 / 33 1 1 noviny sentence L přinesly 4 4 zprávu ends n4 PREP6 o pp6 n6 ADJ6 nečekaném 6 6 6 vývoji 2 2 situace Úvod do počítačové lingvistiky 5/11 14 / 33 pokrač tematická role (též hloubkový/sémantický pád) na rozdíl od gramatické role se jedná o sémantickou kategorii určujeme např: Agens kdo je životným původcem nějaké cílevědomé činnosti Patiens co hraje roli entity, na kterou se působí Donor osoba, která dává ause entita, která způsobuje, že je něco děláno Hospodářský vývoj v ČR by mohl být příznivější při pružnější dopravě, v čemž brání některá legislativní opatření Úvod do počítačové lingvistiky 5/11 16 / 33

Příznaky a příznakové struktury informace v uzlu syntaktického stromu: příznaky/rysy (features) zaznamenávají syntaktické nebo sémantické informace o slovu nebo frázi např test na shodu: Malý Petr přišel domů podmět ( Petr) je ve shodě s přísudkem ( přišel) v čísle a rodě přídavné jméno (malý) a podstatné jméno (Petr) se shodují v pádě, čísle a rodě S(n, g) P(, n, g) P(n, g) P(c, n, g) ADJ(c, n, g) (c, n, g) Příznaky a příznakové struktury pokrač gramatické znaky (slovní druh, gramatický pád, rod, číslo, osoba, ) je výhodné začlenit do gramatiky ve formě dvojic atribut hodnota potom je možné zobecňovat, např vyjádřit shodu v pádě, čísle a rodě výhradně pomocí atributů aplikace v mnoha gramatických formalismech jazykové objekty jsou zde modelovány jako příznakové struktury (feature structures), tedy právě matice dvojic atribut hodnota u složitějších struktur nestačí pak běžné porovnání instanciace jde oběma směry použije se unifikace Pořádek slov ve větě Úvod do počítačové lingvistiky 5/11 17 / 33 Pořádek slov ve větě syntaktická pozice standardní pozice větných členů ve větě angličtina: S O M P T Subject, erb, Object, Modus, Place, Temp avšak např předmět se může přesunout na první pozici topikalizace The book I read v češtině téměř libovolné přesuny syntaktických elementů souvisí s tzv aktuálním větným členěním Úvod do počítačové lingvistiky 5/11 18 / 33 Možnosti zadávání gramatik Možnosti zadávání gramatik nejčastější formát specifikace gramatik produkční pravidla gramatika se skládá z pravidel generujících správně utvořené řetězce cíl analyzátoru najít odvození vstupního řetězce ze zadaného neterminálu (označovaného obyčejně velkým písmenem S z anglického sentence věta) na základě daných pravidel pokud je tohoto cíle dosaženo, vstup je akceptován a je mu přiřazena odpovídající struktura v minulosti rovněž populární přechodové sítě (transition networks) přechody sítě = lingvistické jednotky, uzly sítě = stavy analyzátoru v procesu analýzy vstupu Přechody jsou označeny symboly definujícími, za jakých podmínek se analyzátor může přesunout z jednoho stavu do stavu druhého rozšířené přechodové sítě (AT Augmented T) jsou doplněny o podmínky a procedury ekvivalentní deklarativním gramatikám Úvod do počítačové lingvistiky 5/11 19 / 33 Úvod do počítačové lingvistiky 5/11 20 / 33

homského teorie syntaxe homského teorie syntaxe homského standardní teorie syntaxe 50 léta 20 stol oam homsky vytvořil formální teorii syntaxe jedna ze základních tezí autonomie syntaxe k ověření syntaktické správnosti věty nepotřebujeme znát její význam resp v angličtině Bezbarvé zelené myšlenky zuřivě spí vs Spí myšlenky zelené zuřivě bezbarvé olorless green ideas sleep furiously vs Furiously sleep ideas green colorless znalost jazyka = gramatika homského předpoklady o rozumu: rozum má vrozenou strukturu rozum je modulární rozum obsahuje speciální modul pro jazyk porozumění jazyku je oddělitelné od jiných aktivit syntaxe je formální nezávislá na významu a komunikačních funkcích znalost jazyka je modulární obsahuje moduly pro jednotlivé fáze analýzy jazyka syntaktické principy mají univerzální platnost pro různé přirozené jazyky Úvod do počítačové lingvistiky 5/11 21 / 33 homského teorie syntaxe pokrač Úvod do počítačové lingvistiky 5/11 22 / 33 homského teorie syntaxe pokrač oam homsky, Aspects of the Theory of Syntax, 1965 standardní teorie syntaxe transformační generativní gramatika (TGG) snaží se řešit i zachycení sémantických vztahů v hloubkové struktuře postupně se vyvinula: v rozšířenou standardní teorii (1968) později tzv Government & Binding Theory (teorie nadřazení a vázání, 1981), která zakládá na pojmu univerzální gramatiky 90 léta teorie minimalismu (snaha po úspornosti popisného aparátu) základní části standardní teorie: bázová komponenta bezkontextová pravidla a schémata pravidel generují základní strukturu větných členů lexikon popisuje lexikální kategorie a syntaktické rysy lexikálních položek transformační pravidla vložení, smazání, přesun, změna-rysu, kopie-rysu transformace převádí hloubkové struktury na struktury povrchové Úvod do počítačové lingvistiky 5/11 23 / 33 Úvod do počítačové lingvistiky 5/11 24 / 33

homského teorie syntaxe homského teorie syntaxe Příklad bázové komponenty pravidla: S P P P (D) A* PP* P (P) (PP) PP P P lexikon: D: ten, ta A: velký, hnědý, starý : pták, psem, lovec, já, lesa : loví, jí, šli P: se, do věta: Ten starý lovec se psem šli do lesa syntaktický strom: D Ten A starý P lovec P se S P psem šli P P do PP lesa Příklad transformačních pravidel např pasivizace (v angličtině): John chose a book P1 P2 1 2 3 3 2+be+en by+1 přesuny + vložení + změny-rysu transformace: obligatorní např přesun slovesné koncovky za sloveso fakultativní např pasivizace, tvorba otázek, negace (změna významu) pravidla bázové komponenty popisují strom hloubkové struktury v obvyklém pořadí transformace umožňují jeho změny na různé povrchové varianty (trpný rod, otázka, ) stopa (trace) ukazuje, kde byl prvek před přemístěním Úvod do počítačové lingvistiky 5/11 25 / 33 ýchodiska syntaktické analýzy ávrh podkladů a datových struktur ávrh podkladů a datových struktur Úvod do počítačové lingvistiky 5/11 26 / 33 ýchodiska syntaktické analýzy ávrh podkladů a datových struktur ávrh podkladů a datových struktur pokrač syntaktický strom kompletní hierarchický popis struktury věty úkol syntaktické analýzy = pro danou gramatiku a daný vstup (větu) dát všechny syntaktické stromy existují techniky pro kompaktní uložení lesa takových stromů (chart parsing) jelikož se zabýváme výhradně syntaktickou strukturou a nevylučujeme a priori strukturní stromy s absurdní interpretací, má většina vět mnoho různých syntaktických stromů Obehnat Šalounův pomník mistra Jana Husa na pražském Staroměstském náměstí živým plotem z hustých keřů s trny navrhuje občanské sdružení Společnost Jana Jesenia Automatická analýza syntaxe musí vždy projít třemi fázemi: 1 musí být zvolena notace pro zápis gramatiky gramatický formalismus 2 musí být ve zvoleném formalismu napsána gramatika pro každý jazyk, který bude zpracováván 3 musí být vybrán nebo navržen algoritmus, který určí, zda daný vstup odpovídá gramatice, a pokud ano, jaký popis mu odpovídá Pocet uspesnych stromu = 3 610 464 Úvod do počítačové lingvistiky 5/11 27 / 33 Úvod do počítačové lingvistiky 5/11 28 / 33

ýchodiska syntaktické analýzy ýchodiska syntaktické analýzy abstraktní gramatika Is (This Wine) (ery Expensive) wwwgrammaticalframeworkorg Is odděluje abstraktní a konkrétní gramatiky návrh gramatik desítek jazyků popis gramatiky využívá pro analýzu i generování (tzv linearizace) abstraktní gramatika může sloužit jako interlingua při překladu desítky navazujících aplikací http://wwwgrammaticalframeworkorg/demos/ This Wine ery Expensive Úvod do počítačové lingvistiky 5/11 29 / 33 ýchodiska syntaktické analýzy Úvod do počítačové lingvistiky 5/11 30 / 33 ýchodiska syntaktické analýzy konkrétní gramatika Eng konkrétní gramatika Z Úvod do počítačové lingvistiky 5/11 31 / 33 Úvod do počítačové lingvistiky 5/11 32 / 33

ýchodiska syntaktické analýzy překlad > import Foodgr linking OK Food> import FoodEnggf linking OK Languages: FoodEng 0 msec Food> import Foodzegf linking OK Languages: Foodze FoodEng 4 msec Food> linearize Is (This heese) Delicious tento sýr je dobrý this cheese is delicious 4 msec Food> parse -lang=eng "this wine is expensive" linearize -lang=ze toto víno je velmi drahé viz možnosti např na wwwphrasomaticnet Úvod do počítačové lingvistiky 5/11 33 / 33