Depfix: Jak dělat strojový překlad lépe než Google Translate

Podobné dokumenty
Jak dělat strojový překlad lépe než Google Translate

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Automatická post-editace výstupů frázového strojového překladu (Depfix)

ve strojovém překladu

Jak pracuje internetový vyhledávač

Chytal tlouště na višni

ZŠ ÚnO, Bratří Čapků 1332

Rudolf Rosa. Strojový překlad pojmenovaných entit za pomoci Wikipedie

Obsah. Úvodní poznámka 11 Německý jazyk, spisovná řeč a nářečí 13 Pomůcky ke studiu němčiny 15

http: //pravopisne.cz/2014/11/test-podstatna-jmena-konkretni-a-abstraktni-11/

MASARYKOVA UNIVERZITA Ekonomicko-správní fakulta

SADA VY_32_INOVACE_CJ1

Český jazyk Název Ročník Autor

Pražský závislostní korpus jako elektronická cvičebnice češtiny

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony

Číslo materiálu: VY 32 INOVACE 27/15

Český jazyk - Jazyková výchova

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek

Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Vyučovací předmět: Český jazyk a literatura Ročník: 6.

Ročník Autor: Mgr. Vladimíra Barboříková

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Přísudek. Vytvořeno dne: ve větě

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

MASARYKOVA UNIVERZITA Ekonomicko-správní fakulta

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

Ondřej Bojar Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze

Dataprojektor, jazykové příručky, pracovní listy

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Předmět: Český jazyk a literatura

Jazyky a jazykové technologie v České republice. Tomáš Svoboda Jan Hajič

Číslo hodiny. Označení materiálu

II.3 Toky lidských zdrojů v oblasti vědy a technologií

Český jazyk a literatura

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ


Oblast 2 KOMUNIKAČNÍ A SLOHOVÁ VÝCHOVA evidenční znak

VY_12_INOVACE_32_ZAKLAD_VETY. Časová dotace: 45 min Datum ověření:

Popis morfologických značek poziční systém

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

Národní institut pro další vzdělávání MŠMT Senovážné náměstí 25, Praha 1. Olympiáda v českém jazyce, 42. ročník, 2015/2016 okresní kolo

Zvyšování kvality výuky technických oborů

Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA

VĚTNÉ ČLENY. Mgr. Jiří Ondra Procvičení základních pojmů a kategorií z oblasti české skladby. Zdokonalování jazykových vědomostí a dovedností

Výstupy z RVP Učivo Ročník Průřezová témata Termín/hodiny Komunikační a slohová výchova 12 čte s porozuměním přiměřeně náročné texty potichu i nahlas

DIGITÁLNÍ UČEBNÍ MATERIÁL

Ústav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program

SEZNAM VYTVOŘENÝCH digitálních učebních materiálů





Příklad rozpracování minimální doporučené úrovně pro úpravu. očekávaných výstupů v rámci podpůrných opatření. do učebních osnov vyučovacího předmětu

Výpočetní a aplikovaná matematika

Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus

ÚSTAV ROMÁNSKÝCH STUDIÍ. Oddělení italianistiky urs.ff.cuni.cz Den otevřených dveří FF UK

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Český jazyk Ročník: 7. Průřezová témata Mezipředmětové vztahy.

Přísudek a podmět. Český jazyk 9. ročník Mgr. Iveta Burianová

ICT plán Základní škola Netvořice, okres Benešov

Olympiáda v českém jazyce 45. ročník 2018/2019

Přehled vzdělávacích materiálů

Zpráva o přijímacím řízení na MFF v roce 2012

Zvyšování kvality výuky technických oborů

Název materiálu: Jazykové rozbory

MASARYKOVA UNIVERZITA Ekonomicko-správní fakulta

Specializovaný korpus BANÁT a jeho využití

Přijímací řízení do bakalářských a magisterských studijních programů v českém jazyce, 2014/2015

Roční úvodní kurs českého jazyka pro nově příchozí žáky - cizince

VY_12_INOVACE_72 Základní škola a mateřská škola Herálec, Herálec 38, ; IČ: ; tel.:

ANOTACE nově vytvořených/inovovaných materiálů




ČTENÍ. M e t o d i c k é p o z n á m k y k z á k l a d o v é m u t e x t u :

Tematický plán pro školní rok 2015/16 Předmět: Český jazyk Vyučující: Mgr. Iveta Jedličková Týdenní dotace hodin: 8 hodin Ročník: pátý

Zvyšování kvality výuky technických oborů

SLOVNÍ DRUHY- KVÍZ. Zakroužkuj správnou odpověď.

Pedagogická činnost. Matematického ústavu v Opavě. Slezské univerzity v Opavě. v roce 2002

VY_32_INOVACE_ / IQ cesta

II.3 Toky lidských zdrojů v oblasti vědy a technologií

Zpráva o přijímacím řízení na MFF v roce 2004

Přijímací testy z českého jazyka (autorka Mgr. Kateřina Stündlová)

Zpráva o přijímacím řízení na MFF v roce 2007

Moravské gymnázium Brno s.r.o. Hana Blaudeová. Ročník 2. Datum tvorby Anotace. -prezentace určena pro učitele

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

VĚTNÉ ČLENY - PODMĚT A PŘÍSUDEK

Zpráva o přijímacím řízení na MFF v roce 2005

Předmět: Český jazyk a literatura Ročník : 6. Jazyková výchova

Test přijímací zkoušky z českého jazyka

Učební osnovy vyučovacího předmětu český jazyk a literatura se doplňují: 2. stupeň Ročník: sedmý. Tematické okruhy průřezového tématu

Číslo projektu: CZ.1.07/1.4.00/

ČESKÝ JAZYK A LITERATURA 4.ROČNÍK

Výstupy z RVP Učivo Ročník Průřezová témata Termín/hodiny Komunikační a slohová výchova 12 čte s porozuměním přiměřeně náročné texty potichu i nahlas

Větné členy. MASARYKOVA ZÁKLADNÍ ŠKOLA A MATEŘSKÁ ŠKOLA VELKÁ BYSTŘICE projekt č. CZ.1.07/1.4.00/ Název projektu: Učení pro život

PLIN041 Vývoj počítačové lingvistiky. Korpusová lingvistika v ČR Počítačová lingvistika v ČR Brno. Mgr. Dana Hlaváčková, Ph.D.

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Český jazyk Ročník: 6. Průřezová témata Mezipředmětové vztahy.

IA161 Pokročilé techniky zpracování přirozeného jazyka

NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA

ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE

Tematický plán Český jazyk pro 4. ročník

PREZENTACE FAKULTY STROJNÍHO INŽENÝRSTVÍ

Transkript:

Rudolf Rosa rur@nikdeeu http://ufalmffcunicz/rudolf-rosa Depfix: Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované lingvistiky ČLO, Praha, 22 dubna 2014

Jak překládá strojový překladač? print screen z GT Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 2/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf??? Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 3/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii paralelní korpus česko-anglický paralelní korpus (CzEng): 15 000 000 vět knihy, legislativa EU, titulky, dvojjazyčné weby hindsko-anglický (HindEnCorp): 287 000 vět Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 4/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf??? Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 5/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf??? Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 6/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 7/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave??? Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 8/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 9/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady??? Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 10/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 11/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 12/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) + pravděpodobnosti frázových párů ym = ve (66%) / v (33%) Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 13/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) rywac ym e brediboc e hycf Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 14/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) rywac ym e brediboc e hycf ym = ve (66%) / v (33%) žije Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 15/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) rywac ym e brediboc e hycf žije ve Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 16/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) rywac ym e brediboc e hycf žije ve ptakopysk Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 17/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) rywac ym e brediboc e hycf žije ve ptakopysk ryba Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 18/44

Jak překládá strojový překladač? cvync ym vedal e brediboc ptakopysk plave ve vodě rywac ym eocdlerye em asfytme ježura žije v austrálii rywac fala e brediboc ptakopysk žije tady rywac ym vedal e hycf ryba žije ve vodě cvync fala e hycf plave tady ryba = frázový statistický strojový překlad (Google, Moses) + změna slovosledu, + jazykový model: žije ve ptakopysk ryba ryba žije v ptakopysk Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 19/44

Co frázový překlad (moc) neumí anglická věta: All the winners received a diploma překlad pomocí systému Moses: Všem výhercům obdržel diplom frázový překlad moc neumí gramatiku neví, že něco je podmět, a že to má být v 1 pádě neví, že slova mají číslo, a že by se mělo shodovat číslo podmětu a přísudku Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 20/44

Co frázový překlad (moc) neumí někdy se hodí dívat se dovnitř slov skloňování (pád, číslo, rod, negace) časování (čas, osoba, slovesný rod) někdy se hodí dívat se na strukturu věty shody (podmět-přísudek, jméno-přívlastek) slovesná valence (např někdo 1 poslal něco 4 někomu 3 ) zapojit gramatiku přímo do frázového překladu je složité (byť to trochu jde) opravovat chyby zvlášť je jednodušší Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 21/44

Depfix automatická post-editace I frázový strojový překlad IIautomatická oprava chyb 1 automatický jazykový rozbor slovní druhy, mluvnické kategorie (98%) větný rozbor, větné členy (80%) 2 automatická oprava chyb (Depfix) pravidla (shoda, slovesný čas) statistika (slovesná valence) Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 22/44

Jak Depfix opravuje chyby anglická věta: All the winners received a diploma překlad pomocí systému Moses: Všem výhercům obdržel diplom oprava pomocí systému Depfix: Všichni výherci obdrželi diplom Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 23/44

Jazykový rozbor věty slovní druhy, mluvnické kategorie Všem výhercům obdržel diplom lemma výherce, podst jm, 3 p, mn č, rod m živ větný rozbor, větné členy přívlastek shodný Všem podmět výhercům přísudek obdržel předmět diplom Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 24/44

Všem výhercům obdržel diplom a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výhercům NNMP3 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všem Atr PLXP3 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 25/44

Podmět a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výhercům NNMP3 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všem Atr PLXP3 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 26/44

Podmět a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výhercům NNMP3 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všem Atr PLXP3 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 27/44

Podmět 1 pád a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všem Atr PLXP3 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 28/44

Všem výherci obdržel diplom a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všem Atr PLXP3 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 29/44

Shoda jména a přívlastku a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všem Atr PLXP3 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 30/44

Shoda: rod, číslo, pád a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všichni Atr PLMP1 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 31/44

Všichni výherci obdržel diplom a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všichni Atr PLMP1 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 32/44

Shoda podmětu s přísudkem a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdržel Pred VpYSXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všichni Atr PLMP1 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 33/44

Shoda: rod, číslo, osoba a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdrželi Pred VpMPXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všichni Atr PLMP1 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 34/44

Všichni výherci obdrželi diplom a-tree zone=en a-tree zone=cs received Pred VBD AuxK obdrželi Pred VpMPXRA AuxK Z: winners Sb NNS diploma NN výherci Sb NNMP1 diplom NNIS1 All Atr PDT the AuxA DT a AuxA DT Všichni Atr PLMP1 Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 35/44

Jak Depfix opravuje chyby anglická věta: All the winners received a diploma překlad pomocí systému Moses: Všem výhercům obdržel diplom oprava pomocí systému Depfix: Všichni výherci obdrželi diplom Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 36/44

Oprava slovesné valence anglická věta: EU criticizes not only the Greek government překlad pomocí Google Translate: EU kritizuje nejen řecká vláda oprava pomocí systému Depfix: EU kritizuje nejen řeckou vládu Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 37/44

Automatický rozbor EU criticizes not only the Greek government EU kritizuje nejen řecká vláda criticize kritizovat government předmět vláda 1 pád Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 38/44

Pravděpodobnosti pádů criticize kritizovat government předmět vláda 1 pád sloveso kritizovat, pád pro předmět: P(1 pád) =?% P(4 pád) =?% Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 39/44

Pravděpodobnosti pádů criticize kritizovat government předmět vláda 1 pád sloveso kritizovat, pád pro předmět: P(1 pád) = 3% paralelní korpus P(4 pád) = 80% Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 40/44

Pravděpodobnosti pádů sloveso kritizovat, pád pro předmět: P(1 pád) = 3% P(4 pád) = 80% paralelní korpus překlad pomocí Google Translate: EU kritizuje nejen řecká vláda oprava pomocí systému Depfix: EU kritizuje nejen řeckou vládu Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 41/44

Závěr frázový strojový překlad je jednoduchý a úspěšný celkem se obejde bez lingvistiky ale má problémy s gramatikou jeho chyby lze automaticky opravovat na to se lingvistika hodí automaticky určovat slovní druhy, větné členy dva možné přístupy k opravě chyb člověk ručně sestaví opravovací pravidla systém se naučí pravidla sám (podle korpusu) Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 42/44

Přijďte k nám studovat! bakalářské studium (3 roky) Matematicko-fyzikální fakulta UK ( Matfyz ) obecná informatika, zaměření matematická lingvistika http://wwwmffcunicz navazující magisterské studium (2 roky), pak případně doktorské studium (4 roky) Ústav formální a aplikované lingvistiky (ÚFAL) informatika, obor matematická lingvistika http://ufalmffcunicz Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 43/44

Děkuji za pozornost Rudolf Rosa rur@nikdeeu Depfix: Jak dělat strojový překlad lépe než Google Translate Univerzita Karlova v Praze Matematicko-fyzikální fakulta Ústav formální a aplikované lingvistiky Pro tuto prezentaci a další informace navštivte http://ufalmffcunicz/rudolf-rosa Rudolf Rosa Depfix: Jak dělat strojový překlad lépe než Google Translate ÚFAL MFF UK 44/44