Ondřej Bojar Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze

Podobné dokumenty
ve strojovém překladu

Ondřej Bojar Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze

Matematika I, LS 2017/ přednáška

Ç Ð Ò ËÐ Ø ÖÓÚ ØÖ ÔÐ ØÙ Ç Ð Ò ËÐ Ø ÖÓÚ ØÖ ÔÐ ØÙ Å ÐÓ Î Ó Ó Ø Ó ÖÚ ØÓ È Ò Ô Ó ÙÒ Ú ÖÞ Ø Ú ÈÐÞÒ ½¾º½¼º¾¼½½

m05 G id.směs m (p,t)= x i H mi i=1 x i S mi R k x i ln x i k x i G mi + RT k G mi = H mi TS mi k x i V mi V id.směs m (T,p)=

ÓÑ ØÖ Ñ ØÓ Ý ËØ Ò Ö Ò Ú Ý Ç Ø ØÒ Ñ ØÓ Ý ÃÓÖ Å Ñ Ú Ñ Ö ½½º Ù Ò ¾¼¼

Ô Ð Ö Ó Ø ÓÙ Ô ÔÓÑ Ñ Ó Ù Ñ ÔÖ Ú ÔÓ Ó ÒÓ Ø õ Ø Ý Ó Ø n=100, n A =17, f A =0,17, 95% Òغ ÔÓк(0,10;0,24) Ó Ø n=100, n B =41, f B =0,41 95% Òغ ÔÓк(0,31

B06. p (1) = p (2) T (1) = T (2) n (1) 1 + n (2) 1 = n 1 =konst n (1) 2 + n (2) 2 = n 2 =konst

Ê ¾ À ¾ ÓÑ Ò ÒØÒ Þ Ò Ê(Ø) Ø ½ ÓÑ Ò ÒØÒ ÑÓØ Ê(Ø) Ø ¾/ ÈÖÓ Ð Ñ ÔÐÓ Ó Ú Ñ ÖÙ ÈÖÓ Ð Ñ ÓÖ ÞÓÒØÙ ÈÖÓ Ð Ñ Ñ Ò Ø ÑÓÒÓÔ Ðó ÁÒ Ò ÑÓ Ð ÖÓÞÔ Ò Ò ÒØÖÓÔ ÔÖ Ò Ô ÈÖÓ

a +b +... c +d +... Ò Ó ν produkty >0 ν vých.látky <0µ

B10. p st. i plyny. = a Ç2 = p Ç 2. p st =

n, π j = nπ j (1 π j ) nπ j (X j nπ j ) 2 χ 2 = χ 2 k 1 j=1

y x Yi, Y ˆi 4

Ó Ú Ø Ð ÓØÓ Ð ØÖ Ó ÚÙ ÔÓÚ úóú Ò Ò Ñ ÝÞ À ÒÖ À ÖØÞ ½ ß½ µ Òú ÖÓ Ù ½ Ô Ú ÔÓ Ù ÔÖÓ Þ Ø Ü Ø Ò Å ÜÛ ÐÐ Ñ Ô ÔÓÚ Þ Ò Ð ØÖÓ¹ Ñ Ò Ø ÚÐÒ Úõ ÑÐ ØÓ Ó ú Ó Ú ØÐ Ò õ

m09 x, y, z ) J i = D i D i = k B T f i 6πηr i


ÑÓÞ ÐРл ÓÑ» Ö»ÛÛÛ»»Þ»Ú Ø Ø» Ò Üº ØÑÐ s.1 B01 ÚÓ Ò Ò Ó ½ º ÞÒ ¾¼½½ ÃÓÐ Â ÝÞ ÐÒ Ñ Ø Ú ÈÖ Î ÀÌ Ñ ØÒÓ Ø ¾ Þ Ò Ñ Ú Ó Ñµ Ù ÓÚ Ö º ÓÐ Ú ØºÞ ¾ ¾¾¼ ØØÔ»»ÛÛÛº

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Automatická post-editace výstupů frázového strojového překladu (Depfix)

B04. = x. z = z 2 z 1 = z(x 2,x 2 ) z(x 1,y 1 ) (x2,y 2 ) (x 1,y 1 )

Depfix: Jak dělat strojový překlad lépe než Google Translate

Ag + (aq)+e Ag(s) z=1

ØÓ Ë ÙÖ ØÝ ÎÇ ÁÒØÖÓ ÙØ ÓÒ Ë Ö Ø»Ë Ö Ø Ñ Ò Ñ ÒØ ÇÖ Ò ØÓÖ ÁÒ Ù ØÖ Ð ËÓ ØÛ Ö ÁÆËÇ Ö ÁÒ ÓÖÑ Ø ÓÒ ËÝ Ø Ñ Ò Ò Ö Ò ÙÐØØ Ö ÁÒ ÓÖÑ Ø Ì Ò ÍÒ Ú Ö ØØ Ï Ò ÁÒ Ø ØÙØ

Jak dělat strojový překlad lépe než Google Translate

ú ř ů ů ž č č ř ů ř Í řď č ř ž ů žď ž ů ů ř ú Š š ů č č šť ž ř č ř ú ž ř ň ňů ň ňů ň Ý ňů ň

ÈÖÓ Ð õù ú Ñ ÚÓ ÔÐÓÑÓÚÓÙ ÔÖ ÚÝÔÖ ÓÚ Ð ÑÓ Ø ØÒ Ú Ö Ò ÔÓ¹ Ùú Ø Ñ ØÓÚ Ò ÔÖ Ñ Ò º ËÓÙ Ð Ñ Þ Ô ÓÚ Ò Ñ ÔÖ º Î ÈÖ Þ Ò ½ º Ù Ò ¾¼¼½ Ñ Ð Â

Ø Ý ß ÚÓ ÚÓ Ø ÞÔ Ó Ò ÔÓ Ý Ñ Ð ØÖÓÒ ÙÚÒ Ø Ñ ú Ý Áº Ö Ø ÔÓÐÓÚÓ µ ÓÚÝ Ø Ý ß ÚÓ ÚÓ Ø ÞÔ Ó Ò ÔÓ Ý Ñ ÓÒØ ÁÁº ÖÓÞØÓ Ý Ø Ú Ò ÒÝ ÓÐ µ ÓÒØÓÚ Ø Ý ß ÚÓ ÚÓ Ø ÞÔ Ó

ú ů Ý ůš š ů š ů Ý Ý ů

Ç ½ ÍÚÓ ¾ ½º½ ÍÚÓ Ø ÖÑ ÒÓÐÓ º º º º º º º º º º º º º º º º º º º º º º º º º ¾ Ó ØÚÓ Ö ÙÖ ØÚ ¾º½ ÙÖ ØÚ Ó Ö º º º º º º º º º º º º º º º º º º º º º

ňňšťšý ÝÝÝ ÝÝÝÝŠ řřáš Ě Ý Ý ÝÝÝ

Ä Ôõ ÚÓ Ý Ò ÚÝÑÝ Ð Ð Ó ÔÓ Ð Ð Ò õ ÑÙ Ô ÓÚ Ô ÔÖ ú Ó ÔÓÐ Ù Ø ÑÒ ËÔÓÐ ÒÓ Ø º Æ Ð Ù Ø ÜØ Þ ÞÒ Ð Ó Þ Ö Ú Ú Ò Ô ØÓÑÒÓ Ø Ó ÙØÓÖ Ò Ñ Ñ Þ Ø Ù ÐÙ ÓÚ Ó ÝÑÔ Þ ÔÓÞ

Ä ØÓÔ ÓÚ Ô Ò Ó Ð Ø Ùú РѺºº ºººÚ ØÖ Ð ÓÚ Ô Ò Ð Ò Ñº Ì Ñ Ò Ò Ò Ñ Ò ÔÓ Ô Ñ Ð ØÓÔ ÓÚ Ô Ò Ò ÐÓ٠Ѻºº Ë Ú Ð ÞÖÓÚÒ Ò Ò ÐÓÙ Ñ Ò Ø ÖÙõ Ø Ó ÒÙ ÔÓ Ô ÐÒÓ Ý Ñ Ú

ěž Úč úč Í ěž Ž č Ž ž ů Á Č Č Ž Úč Ž Úč Ž ň ž Ů č č Ž Úč Ž Í č š ě ň ó ÚČ č Ž Úč č Č š Ž Š Š ÍŠ

ÐÒ ÙÐØ Å Ø Ñ Ø Ó¹ ÝÞ ÔÓÐÙÔÖ È ØÖ Ñ ËÚ Ñ ËÁ ÎÍÌ Â ÖÓÑ Ö Ñ Ú ÁÒØ Ö Ø ÙØ Ò ØÖÙ ØÙÖ Ø Ù Ö Å ÐÓ Ð Ú Ã ÖÐÓÚ Ú ÈÖ Þ ÍÒ Ú ÖÞ Ø ÀÓÖ Ñ Ì Î Ê Í Ò ÔÓÐ ÒÓ Ø Ê ½ º

Č ů ť ú ů ť ť ú ů ů ť ť ň ů Ť ť ů ó Č ú ť ů ů ů ú ó ó ť ů ů ú ú ú Á ú ť ť ó ň ů ů ň ť Ů Ů ť ň ů ů

Notice:Jagran Infotech Ltd. Printed by Fontographer 4.1 on 6/3/2003 at 7:12 PM



ÖÙ Ø Æ Ò ÑÝõÐ Ò Ó Ú úù Ô Ò Ú Ò ÔÓ Ø Ö Ý Ò ÔÓÔ Ð Ô Ô Ò Þ ØÙº È ÚÓ Ñ Ö Ú Ð Ø º ÐÓÚ Ý Ú Ø ØÙÐ Ù ÞÒ Ñ Ò ú Ùú Þ Ò Ñ Ù Ø Ô Ñ Ò Ó Þ ØÙ Ð ØÓ Ò ØÑ ÖÓ Ñº ÈÓÔÖÚ

ÍÒ Ú ÖÞ Ø Ã ÖÐÓÚ Ú ÈÖ Þ Å Ø Ñ Ø Ó¹ ÝÞ ÐÒ ÙÐØ ÁÈÄÇÅÇÎý ÈÊý Ê ÃÖ ÅÓ Ð Ô ö Ò Ò ÖÙ ÓÚ Ñ Ó Þ Ù Ã Ø Ö ÒÙÑ Ö Ñ Ø Ñ Ø Ý Î ÓÙ ÔÐÓÑÓÚ ÔÖ Óº ÊÆ Öº ÎÐ Ñ Ö Â ÒÓÚ Ö

Ú č š ů č éč ě š č ě š š ě ú ů č é é š č ě é č ú ě ě č ě č ě š ň č ů é é é é ě č é š é é é é é č ě š é č é é é é é Ž ě é é č Ý č

Ý š ž é ů Š ú ú ú Ó ů ú ú é Ó Ó Č ů ú Ú ň ů š ů š ů ú ú é é ž

Ë ÔÖÚÒ Ñ Ò Ñ ÎÝÙú Ú Ñ ÔÖõ Ú Ò Ú Ô Ð Ò Ý Þ ÔÐÒ Ð Ô Ñ Ò Ý Ó Ö Þ Ý Ò Ð Ù ØÖ Ò Ý ÔÖÓ Ú õ Ó Ùõ Ö ØÖ Ð Ú Òݺ ÃÓÒ ÙÖ ÓÚ Ý Ø Ñ Ò Þ Þ ÑÓÚ Ò ÖÓ ØÐ Ò Ð Þ Ñ Ó õø

Ř é é é úť Ú é é é é é ú é é é ú ú ú Č ú Č ú ú

Š ň é Ž Č š é š é é ř Ž Ž č š é é č é Ž ř é Š Ú Ž ř é ž Ť é č Š č ř Ť ž ž ř ř é š ž ó Ž é é ř š ř ř ř š ž ř č ž é ř ř ř ž é é č č ů ř é é é ž ř é ó č

Ě Í Č ŘÍ Ů ň ž óý ó ó ó ú ž ú ú ó ř ů ř É ř ň ř ř ň ř ň ú ň ó ř ř ř ř ó ú ú ř ó ř ř ř ň Á

ÈÖÓ Ø ÐÐËØÓÖ ¹ Ó ØÓÚ ÑÔÐ Ñ ÒØ ÅÄ¹Ò Ø ÚÒ Ó Ëà Ã Ö Ð Ê Ø Å Ð Î Ð ÒØ Â Ò ÎÖ Ò Ã Ø Ö ÔÓ Ø ó Ä ÎÍÌ ÈÖ Ã ÖÐÓÚÓ Ò Ñ Ø ½ ½¾½ ÈÖ ¾ ßÖ Ø Ú Ð ÒØ ÚÖ ÒÝ ½Ð кÚÙغÞ

É š š š Ú ó š É Á ó Ž Ú Ú Ú š Ú š š š Á š š ň Ú Ř Ý š Ú Ú ÚÚ Ý š ň ď ň š Ó Č Ž š Ó š š Š Ž Ú š É É š š ň š Č Ž Ž š š š š

Obec Mi kov. Zpráva o výsledku p ezkoumání hospoda ení. územního samosprávného celku. za období od do

ó ž ř ó ú ž ů ř ř ř š ů ř ř řž ř ř š ř š š ř é řž š ž ř ř ř š ů ó ř š éúř ř š ž ř ó ú ř ó ú ó ř ř úš ř šš žš ťé řď ž óú ž é šř š é š ř é ř é ó é é é é

ÚÓÐÙØ ¹ Ó ÙÑ ÒØ Â Ò ÃÓÐÓÑ ÞÒ

Ñ Ñ Ø Ý Ô ººº Ø Ý ØÙ Ô º È Ò ÔÓ Ð ÒÓ Ó Ò ÑÖØ ÐÒ Ó ÚÖÓ Ù ú ØÙ Ñ Ø ÖÓ Ò Ó Ó ß ÖÓ Ð ØÓ Ô º Ø ÑÓ ÔÖÓ Ô ÖÓ Ù Ú Ó Ô Ò Ø Ò Ô ÚÝ Ò Ñµ Ò Ø Ú ß Ýú Ð ØÓ ÔÓÑ Ð Ú

ÍÒ Ú ÖÞ Ø Ã ÖÐÓÚ Ú ÈÖ Þ Å Ø Ñ Ø Ó¹ ÝÞ ÐÒ ÙÐØ ÁÈÄÇÅÇÎý ÈÊý Ù Ö ÙØÓÑ Ø Ô ÞÓÚ Ò ÚÞÒ ÑÙ Ë Ò ¹Ø Ò Ø Ú ÓÖÑ ÐÒ ÔÐ ÓÚ Ò Ð Ò Ú Ø Ý Î ÓÙ ÊÆ Öº Å Ö Ø ÄÓÔ Ø ÓÚ È

č ž ž ž č ů č úč č ň ú Ů Ů ů ž ž č ž ú č č š ť ž ó š Ě ž úč ď Ž ž ž ž Á


Ě Ž

arxiv: v1 [math.ca] 8 Aug 2008

ÍÒ Ú ÖÞ Ø Ã ÖÐÓÚ Ú ÈÖ Þ Å Ø Ñ Ø Ó¹ ÝÞ ÐÒ ÙÐØ ÁÈÄÇÅÇÎý ÈÊý Å ØÓÙ Ê Ò Ð Å Ò Ø ÚÐ ØÒÓ Ø ÐÒ ÓÖ ÐÓÚ Ò Ð ØÖÓÒÓÚ Ý Ø Ñó Ø Ú Ø ÓÖ Ø ÝÞ Ý Î ÓÙ ÔÐÓÑÓÚ ÔÖ ÔÖÓ º

ú ó ž ú ó ť

á ý á á ú ú ř ý ý ů ě ů ř á á á á ě ě š ř ů á ě ě ě ů ř š ý š ě ů ž ář ř ř š ý ář á ě ř á ý ě ů á á á ě á ž ě ě ů ě ý ě ř ě šť Č ý á á ř á ě á ř ý ý á

ó ó ó


ÔÖÓ Ó Ù Â ÖÓ Ò Ñ Ô õðó Ð ØÓ Þ Ó Ú Ð Ú Ò Ñ Ò ÚÝÚ Ò Ò Ò õ ØÙ º ÈÓ Þ Ñ Ø Ñ Þ Ò Ù Úõ ÒÓ Þ ÐÓ ÔÖÓ ÓÙÞ Ø ÑÒÓÞ Ð ØÓ Ó Ó Ý Ø ÐÓ Ý Ý ÚÖ Ø Ð º Ç ÚÝ ÝÐÝ Ø ÒØÓ Ö

ť č ř š ú Ž úč Ž ó č ř ř č Š ř ř č ř č ř Ž Ž úč Ž ř ř Ř ř ř č ř ř č ř ž Ž Úč Ž

Matematika v proměnách věků. II

Ů ř ž ř ř ú řž ř ř ú ď ř ř ř ž ř ď ř ř ř ř ř ř ř ž ř ř ř ř ř ř ř ř ř ř ž ř ř ž ř ř ř ž ž ž ř ž Ť ř

ň ě ý ů Ž Ú ěř ž ý ý řů ý ě ů ě ó ů ř ý Č ó Ž ě Ž ý Ú ě ý ů ž ř Š ř ř ř ř ě ě ň ň ů ě ě ů ú ů ě ů ř ů ž ř ě ě Ž ý ů Ž ř ž ř ě ě ě ý ň ř ě ý ů ěž ú ř ž

ď ž ř ý ý ú ý ý ž ř ý ž ř ý ú ň Ř Ř ř ď ý ů ň Š ž ř ý Ř ý Ř ž ř ý ř ž ž ů Íý ř

ů Ě ů ů ů ů Ě Ť ů ů ů Ú ů ů Ú Ě Č Ň Ů Ú ů Č Č Ť Ú Ú Ú Ú Ú

Ž Ř ú Ž Ú ú ú Ú ď Ů Ť Ťú Ř Ý Ť ď Ť Ř Ý Ř Ú Ř Ú ž ď ú Ť ť Ý Ú ž Ť Ť Ť Ú ú Ú Ú Ú Ú

ž Ž ů ů Š Ž ů ů ů Ž Ž ů Ž Š Š ů Ž ů ů ň Ž ú Ž Ú Ž Š ť ť ť ť Ž

: ;

Ů ž ž ž ú ž ž š úč Ů š ú ž ú ň ú ú ú ž š ú ú ň ž ú ž

ÔÖ ÚÓ ÃÐÙ Ù ØÙ ØÖÓÔ ÝØÙÑ ÖÒÓ ½»¾¼½ ÒÒÓ Ø ÐÙ Ù ß Ð Ò Ú ÓÖÓÚ Þ ËÝÑÔ Þ ÙÑ ¾¼½ Â ÓÙ ØÙ Ý Ú ÁÞÖ Ð ÎÐ Ñ Ö Ã õô Ö ß ÁÒ Ñ ÑÓÖ Ñ Ô Ô ÝÐÙÑ ÀÍ ß Ô ÖÓ Ò Ý Ö

Å Ë Ê ÃÇÎ ÍÆÁÎ Ê ÁÌ È ÖÓ ÓÚ ÙÐØ Ø Ú Ø ÓÖ Ø ÝÞ Ý ØÖÓ ÝÞ Ý ÁÈÄÇÅÇÎý ÈÊý ÅÓ ÐÓÚ Ò ÔÖÓÑ ÒÒÓ Ø Ú Þ Ý σ ÇÖ Å Ð Ò ÈÖÚ Î ÓÙ ÔÐÓÑÓÚ ÔÖ Óº Å Öº Â ÃÖØ È º º ¾¼½½

Ý Ř Ž Č ú Č ú ď Ě Č Ž Ž Ý ú Ž ú Ý Ž Č Ž ú Č Č ú Ž ú Ě Ř Ž ú ď Ž Ý Ó Ň ú Ú Č Ň ĚŽ ĚŽ Ž Ď Ž Ó Ú ú Ř Ú Ž Ý

é Ý é š č š é š é é š š Š č č é é é é š č š é é é é č š š š ň é é Ú Č š é ó

Á Č Ú ó ó ů ůč ó ó ó ó ó ó ó Ú ó Č ú ó ů ú ů ú Ú Š Ó Š Ú óň ú ó ď Ž

ň ú Ú ů é é ň ů ž ů ů ů ů é é é é ú ň é ú ú ů é é ů ů Č é ň ú ú ů é é ů Ť ň é ů ů ú ň é ú ť ť é é é ů é é ů é é ť ň ú ú ů é é ů ů ú é ů é ů é ů ť ů ú

ú ó ž č č Ž č Ž Ť č ú č š ó č ž č ž č š š š Ž č č ž Ž ú ň š ž Ž č č ú č ú č ž š ú Ž Ž Č Ž ó č š č š Ž ó č č ú č ó š ó Úč š č č ž č Ú č č č č ó č ž ž č

K 4 K 5 K 6 C 5 P 5 P 6

ěř ý ž ů ž ý ž ý ý ě ž č ě ů ř é č ý ú ř é ř ý č ě ÍŽ é č ř é ě ě é é ů č ý ř ě ě č é ý ů ů ř é ě ř Í ůě č é Ž ř ě ž é č ř é ě é é ě ý é ě ř ž é é č ě

Ř Á

ý ů ú ú ý ý ý é š ý ů é ý ů ú ú ů ýš ýš é ý š ýš ý ý ý ů š ý

É Ý ú ů Č ů Š ú ú ó Ž ů Ž Ž ů ů ů ú ů ň ů Ú ť ó ň ň Ó ů Ú ó ó ó ň Š ó ň ó Ó ú ňó ó ď Ě ó ú Ý ď ó ó ó Ú ó ň ó ů ů Ť ó ó ó

Ž ó á ť ť á Ó š š

č č é é é é é č é č Ó Š Í é é ž ú é é ž ú é ó č é ý ž ý č é š č é š Ž Ž é č é č Ž č ý š ý ý é š é ý š ý ů é č Š ů ó ž ý č é é Š é Ž é é é č é Ž ň é ž

Ž ý é š ě ř š ě ý ý š ě ů é ý ě ě ě č é š ě ý é é č éž ě č ý ý č é ř č ě ř é ř é ř ě ě ř ě č Ž ř ř ý č č ř é č ř é ř ě ě ř ě č Ž ř ř ý č ě Ú ů č é ř é

ď ě ň ý ú ý š ě Ó ý ť Ť ý ě ýé ň š ÓÁ ý ú é ň ě ě é ť š Ň š ý Ť ě ě ě é ú š ě šť ó ěý Ň ý ó ý ě ý ě é ť š ě é é š ě ú ě ě ú ú ď šě ý ž ý ě ž š ě é ě Ý

ž ř ž ůž ř ř ď ž ř ů ř ř ř ř ů ž ř ů ů ů ů ó ú ú ř ř ř ů ř ž ů ř ž ůž ř ž ř ž ž ř ř ž ř ž ř ů ú ř ů ů ž

ÍÔÖÓ Ø Þ ÑÒ Ó Ô Ò Ù Æ ÑÝ Ð Ñ Ø ÒØÓ Ö Ø Ò Þ ÑÒ Ô Ò Ó Ò Ó Ó Ð Ù ÑÒÓ ú ÚÓ Ò õ ØÙ º ÈÓÞÓÖÙ Ô õ Ù Ô õ Ô Ô Ú Ø Ð Ò õ Ó ÞÔÖ ÚÓ º ÅÓ Ù ÔÓ ÓÚ Ø ß Ö ØÓ Ò Ñ ß ÔÓ

s09 U = u(r)ρ4πr 2 dr. r c

Ž ť ř ň Ó ř Č ň Ť ť ť ů ť ť

Ù Ò ß õø Ø Ñ Ù Ñººº ºººÒ Ô Ñ Ô ÑÖ Þ Ú Ö Ò ÔÓÐÓÚ ÒÝ Ù Ò Ý Ó ÓÒ Ù Ô ÔÖ ÚÙ ØÓ ÓØÓ Þ ØÙº È ÚÓ Ò ØÓ Úõ Þ Ò ÐÓ Ø ØÓ ÈÖÓ ÐÙúÙ ÒÝ ÓÒ Þ ÑÝ Þ Ø Ù Ö Ú ÐÑ Ù Þ Òµ

Ý Ť ň Ť Ť Ó Ť Ú ď Ú ř Ž Ť Ť Ť Á Ď Ť Ť ů Ď ř Ť ů Ď Ť ď ď ť Ť ď

Č Ž ú ú ú Š ú Š ú ú ó ú Č ú ú ú Č Ů ú ň ú ú Ě ú ú

ž ú ú ý š ž ý ý ů ž ů ž ý ů š š ů ž ž ž ý Ú Ú Ú ň ž ý Š ý š ž ž ý š ú ý

 ÚÐ Ú Ò Ñººº ººº Ý Ú Ú ÒÙ Ñ Ò Ñ ÔÖ Ú Ø Ð Ñ Ð Ó ÒÓÙ Ø Ò Ø ÞÒ Ñ Ø ÖÓ ÒÓÙº ÈÖ Ú Ù Ñ ß Ú ÔÖÓ Ñ Ñ Ø Ò õ Ø Þ ÒÓÚÒ ººº Â Ò Ø Ò Ø ØÙÐ ÔÖ Ú Úº ÝØ Þ Ø Ñ Ò Ô Ò

š č šú ň š š Ž č Ž š č ůž ň š ůž ů Í ž č č č ň č Ž Ž Ž Ž šú š ů š č š Ž Ž Ž š č č šú Ž ů Ž ž č Ž ň ú š Ž Ž š Ž

½ Ú Ò Ô ØÒ Ø õ Ø Þ ØÙ Ø Ö Ñ ØÙ Ú Ñ ÔÖÓ Ú Þ ØÝ ÖÓ Ý Ò Ô Ð Ò ÑÓ ÚÝÑÝ Ð Ø ÐÓÙ Ò Ò Ô ÔÖÓ Ø ÒØÓ ÚÓ Ò ß Ô õ Ò ÓÔ Ò ÚÝ Ö Ø Ø Ò Ò Ú Ó Ò õ Þ Ò Ñ Ø ÚÓÚ Ø ÔÖÚÒ Ð

Transkript:

ÔÐ ØÖÓ ÓÚ Ó Ô Ð Ù Ondřej Bojar bojar@ufal.mff.cuni.cz Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze 18. říjen 2010 Aplikace strojového překladu

Ç ÔÖ Þ ÒØ Projekt IS Od jazyka ke znalostem a sématickému webu Úvod do strojového překladu: Motivace Hrubé rozdělení metod. Formální popis přirozeného jazyka. Obtížnost překladu. Dva přístupy ke strojovému překladu: Frázový (mj. ÚFAL, Google). Stromečkový (mj. ÚFAL). Závěrem: Přínos projektu Informační společnost pro pracoviště. 18. říjen 2010 Aplikace strojového překladu 1

ÞÝ ÞÒ ÐÓ Ø Ñ Ç Û Ù ¾¼¼ ¹¾¼¼ µ Ñ Ø ÑÙ Hlavní řešitel: prof. RNDr. Jan Hajič, Dr. Cíl: vytvořit podmínky pro integraci znalostí popsaných ve volném, nestrukturovaném textu do obecných systémů znalostí využívajících jak strukturovaná, tak nestrukturovaná data, a to podle potřeb konkrétní aplikace. Projekt umožní implementovat systémy, které: dokážou analyzovat volný text a výsledek uložit ve strukturované podobě, umožní překládat z jednoho jazyka do druhého na základě obsahu. 18. říjen 2010 Aplikace strojového překladu 2

ËØÖÓ ÓÚ Ô Ð Ð Ú Strojový překlad (machine translation, MT) je zajímavý akademicky, Hřiště pro testování mnoha dílčích nástrojů zpracování jazyka. Test užitečnosti překladu přes hloubkový rozbor. komerčně, EU utrácí ročně 1000000000 eur za překlady. USA investuje do překladu pro účely (kontra)rozvědky. i pro uživatele: Umožňuje využít texty z webu bez ohledu na zdrojový jazyk. 18. říjen 2010 Aplikace strojového překladu 3

È ØÙÔÝ ØÖÓ ÓÚ ÑÙ Ô Ð Ù interlingva hloubková syntax povrchová syntax morfologická rovina frázový překlad angličtina čeština generuj povrchovou realizaci linearizuj strom Čím víc vstup rozeberu, tím snazší by měla být fáze transferu. Hypotetická interlingva zachycuje čistý význam. Statistické systémy se natrénují samy podle ukázek. Pravidlové systémy ručně píší lingvisté-programátoři. 18. říjen 2010 Aplikace strojového překladu 4

ÓÖÑ ÐÒ ÔÓÔ Ø ÒÝ Analytická rovina (povrchová syntax): Morfologická rovina: Slovo Lema Morfologická značka zákony zákon NNIP1-----A---- zákony zákon NNIP4-----A---- zákony zákon NNIP5-----A---- zákony zákon NNIP7-----A---- udělejte udělat Vi-P---2--A---- udělejte udělat Vi-P---3--A---4 pro pro-1 RR--4---------- lidi člověk NNMP1-----A---- lidi člověk NNMP4-----A---- lidi člověk NNMP5-----A---- PRED OBJ AUXP ADV #36 Zákony udělejte pro lidi Tektogramatická rovina (hloubková syntax): PRED PAT ACT BEN #36 zákon Pl udělat imp Vy člověk Pl,pro 18. říjen 2010 Aplikace strojového překladu 5

Ô Ð Ø ö Víceznačnost a význam slov. ÈÖÓ Spal celou Petkevičovu přednášku. Cílový slovní tvar. 7 pádů, 3 čísla a 4 rody kombinatorická exploze variant výstupu. Pořádek slov. Pro aj čj malý problém, opačně nutno normalizovat. Negace. Nemám žádné námitky. Udělalo se mi špatně. Neudělalo se mi dobře. Zájmena: Give me... The red one. Tu červenou./ten červený. Idiomatická spojení: kick the bucket = natáhnout bačkory 18. říjen 2010 Aplikace strojového překladu 6

Ö ÞÓÚ Ô Ð. faster even moving re they, around time This Nyní zareagovaly dokonce ještě rychleji. This time around = Nyní they re moving = zareagovaly even = dokonce ještě... =... This time around, they re moving = Nyní zareagovaly even faster = dokonce ještě rychleji... =... Trénovací data: paralelní korpus (česká věta = anglická věta) automatické zarovnání slov (české slovo anglické slovo) Při samotném překladu hledáme: takovou segmentaci vstupní věty na úseky ( fráze ) a takové překlady frází aby byl výstup co nejpravděpodobnější. 18. říjen 2010 Aplikace strojového překladu 7

ËÝÒØ Ø Ô Ð ØÖÓÑݺºº # Asociace uvedla, že domácí poptávka v září stoupla. # The association said domestic demand grew in September 18. říjen 2010 Aplikace strojového překladu 8

ºººÖÓÞÐÓö Ñ Ò ØÖÓÑ Ýººº # Asociace uvedla, že domácí poptávka v září stoupla. # The association said domestic demand grew in September 18. říjen 2010 Aplikace strojového překladu 9

Pred cs ººº ÔÓ Ö Ñ ÐÓÚÒ ØÖÓÑ óº Sb cs uvedla, že Pred cs = Sb en said Pred en Pred en Sb cs asociace = Sb cs = Adj cs poptávka Adj cs = domácí Sb en The association Adj en demand Adj en domestic Sb en 18. říjen 2010 Aplikace strojového překladu 10

ÞÓÚ Ú º ÝÒØ Ø Ô Ð Frázový překlad volí primitivní řešení: Ö Větu nerozebírá, jen opisuje známé podposloupnosti slov. Spoléhá na dostatek dat. V základní variantě neumí ani skloňovat, pokud tvar neviděl. Často produkuje negramatické věty, rád zahodí negaci. Syntaktický překlad: Garantuje existenci větného rozboru výstupu naděje gramatičnosti. Explicitně zpřístupňuje závislosti mezi významovými jednotkami věty. Naráží na chyby v kaskádě nástrojů (morf.+synt. analýza). Naráží na negramatický vstup (cokoli, co v trénovacích stromech nebylo). Syntaktický překlad je těžší, má však potenciál řešit těžší problémy. 18. říjen 2010 Aplikace strojového překladu 11

ÃØ Ö Ô ØÙÔ Ú Ø Þ Æ Ú Ñ º Frázový Hloubkový Oficiální WMT10: Seřaďte hypotézy od nejlepší po nejhorší. Shody povoleny. > ostatní 45.0 44.1 49.1 49.4 >= ostatní 65.6 60.1 70.4 62.1 Neoficiální WMT10: Člověk zkusil výstup MT opravit bez znalosti originálu. Je to dobrý překlad? (%) 40 34 55 43 Neoficiální: MT přeložil krátký text. Dokážete správně zodpovědět kontrolní otázky? % správných odpovědí 73.6 80.6 78.7 80.2 Google PC Trans. Pravidelné soutěže (http://www.statmt.org/wmt10/). 18. říjen 2010 Aplikace strojového překladu 12

È ÒÓ ÔÖÓ ØÙ ÔÖÓ ÔÖ ÓÚ Ø cca 90 publikací, 7 obhájených disertací studentů z projektu. Navazující projekty: EuroMatrix(Plus) (2007-2012) http://www.euromatrixplus.net/ Strojový překlad mezi všemi jazyky EU. Faust (2010-2013) http://www.faust-fp7.eu/ Strojový překlad zapojující korektury od uživatelů. Khresmoi (2010-2014) http://www.khresmoi.eu/ Vícejazyčná extrakce informací z lékařských textů a vyšetření. META-NET (2010-2013) http://www.meta-net.eu/ Platforma projektů pro vybudování technologického základu evropské mnohojazyčné společnosti. 18. říjen 2010 Aplikace strojového překladu 13

Ù Þ ÔÓÞÓÖÒÓ Ø Další podrobnosti a odkazy: http://ufal.mff.cuni.cz/ 18. říjen 2010 Aplikace strojového překladu 14