model arabské morfologie Otakar Smrž

Podobné dokumenty
Výsledky dosažené v roce 2007



Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech

NÁZEV ROČNÍKOVÉ PRÁCE ročníková práce

SOFTWARE PRO ANALÝZU LABORATORNÍCH MĚŘENÍ Z FYZIKY

ČESKÁ TECHNICKÁ NORMA

Efektivní hledání nejkratších cest v sítích hromadné přepravy osob

2 Základy práce v matematickém programu Sage

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Žák se seznámí se základními pojmy morfologie tvarosloví, ohebnost, význam slov.

Zařazení materiálu: Šablona: Sada: Inovace a zkvalitnění výuky v oblasti přírodních věd (V/2) Autor materiálu: Pavel Polák

Faktorované překladové modely. Základní informace

Introduction to Navision 4.00 Jaromír Skorkovský, MS., PhD.

ZÁVAZNÉ POKYNY PRO VYPRACOVÁNÍ BAKALÁŘSKÉ, DIPLOMOVÉ A DISERTAČNÍ PRÁCE

Lokalizace QGIS, GRASS

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

CZ.1.07/1.5.00/

Výuka IVT na 1. stupni

Natural Language Toolkit

Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/

internetové stránky municipality


Autorské právo & Open data

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

NLP & strojové učení

Ceník leden

Název školy STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace

Technologie city logistiky

Ceník únor

Tvorba webu v HTML. Redakční systém. CMS Joomla! Co je Joomla

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Open Journal Systems na ČVUT. Věra Pilecká (ÚK ČVUT)

CHARAKTERISTIKA PROJEKTU

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. Jak citovat. Zpracovala: Mgr. Ilona Trtíková ÚSTŘEDNÍ KNIHOVNA ČVUT. - Prosinec

Pořadové číslo: Název vzdělávacího programu: Počítač ve výuce matematiky

Aerodynamické zdroje hluku -kruhové klapky. Ing. Miroslav Kučera, Ph.D.

Širokopásmový bezdrátový směrovač 300Mb/s BR 6428nS Průvodce rychlou instalací Verze 1.0 / Prosinec, 2010

Střední průmyslová škola Ostrov ROČNÍKOVÁ PRÁCE. Webové stránky na téma škola. Třída. Školní rok 2014/2015 Daniel Snášel


NEREALISTICKÉ ZOBRAZENÍ

CZ.1.07/1.5.00/

Bezdrátový mikroadaptér N300 USB (N300MA)

TECHNOLOGICKÝ LIST č. 58

zejména synonymie a antonymie, s odpovídajícím popisem gramatických vlastností

Autorské právo & open data

Ceník listopad

Výzva k podání nabídky

INVESTIČNÍ POBÍDKY A STRUKTURÁLNÍ FONDY EU V KONTEXTU ROZVOJE REGIONU SEVEROVÝCHOD

Slovníky a morfologická analýza

Ochrana software. Katedra softwarového inženýrství Fakulta informačních technologií ČVUT Alžběta Krausová, 2011

Web of Science. Bibliotheca Academica

Textové editory. Ing. Luděk Richter

Perception Motivated Hybrid Approach to Tone Mapping

Universal Dependencies and non-native Czech

pátek, 31. května 13

Číslo projektu: CZ.1.07/1.4.00/ Název DUM: Model atomu Číslo DUM: III/2/FY/2/2/2 Vzdělávací předmět: Fyzika Tematická oblast: Elektrické a

Systém pro poloautomatické propojení textů se zdroji

CZ.1.07/1.5.00/

Interaktivní mapa učeben PŘF UP

AquaLingua. Uživatelský manuál

On the Structure of Constituent Negation in Czech

SCIENTIFIC REFLECTION OF SECURITY SCIENCE

Úvod do Linuxu SŠSI Tábor 1

Animace ve WPF. Filip Gažák. Ing. Václav Novák, CSc. Školní rok:

UNIVERZITA PARDUBICE FAKULTA ELEKTROTECHNIKY A INFORMATIKY Martin Lauterbach

Licenční smlouvy, licenční ujednání

Výuka IVT na 1. stupni

SYSTÉM PRO AUTOMATICKÉ OVĚŘOVÁNÍ ZNALOSTÍ

SOUHRNNÝ PŘEHLED DOKUMENTACE. List of documents

Osnova. GIOP a IIOP IDL IOR POA. IDL Klient Server. 2 Historie. 3 Princip a základní pojmy. 4 Implementace. 5 Aplikace CORBA

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

Kinematická metoda výpočtu reakcí staticky určitých soustav

Interakce mezi uživatelem a počítačem. Human-Computer Interaction

Petr Kadlec Uvedení české verze licencí Creative Commons DigiLab AVU v Praze,

Digitální učební materiál

Seznam publikací, Ing. Josef Půta, Ph.D.

SYLABUS MODUL BUSINESS MODELOVÁNÍ. Doc. RNDr. Vladimír Krajčík, Ph.D.

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Ústav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program

Na základě této normy oborové rady výše uvedených doktorských studijních programů stanovují tuto závaznou strukturu pro disertační práce: 1

SOFTWARE NA ZPRACOVÁNÍ MRAČEN BODŮ Z LASEROVÉHO SKENOVÁNÍ. Martin Štroner, Bronislav Koska 1

DF FA Novinky v Simotion Scout

OPATŘENÍ DĚKANA č. 4/2013 k tvorbě publikací a evidenci výsledků vědy, výzkumu, inovací a další tvůrčí činnosti. Čl.

Řeč. u osob se sluchovým postižením. Mgr. MgA. Mariana Koutská

Nástroje pro tvorbu anglického textu

ZAŘAZENÍ PUBLIKACE DO

ČESKÁ TECHNICKÁ NORMA

Interface délkových a hmotnostních měřidel do informačního sytému pro podporu kvality

Pracovní list č. 14 Microsoft Word 2010 jazykové nástroje, reference I Jazykové nástroje

Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT

BankKlient. Interface pro ú etní systémy. Verze 9.50

CZ.1.07/1.5.00/

Otevřená data veřejné správy

Druhy energie a jejich vlastnosti

Autorské právo v akademické sféře v praxi

PŘÍLOHA 4. Rýmařovsko

Pokyny pro autory. (Times, 14, tučně, kapitálky) (Times, 10, tučně, kurzívou) (Times, 10, normálně)

Lingvistická terminologie

2 Tvarotvorná analýza 3 Základní slovotvorný vztah fundace fundace


Transkript:

Počítačový systém ElixirFM model arabské morfologie Otakar Smrž dzamedzam@yahoo.com Džám-e Džam jazyková škola Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 1 / 6

ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6

ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Inflect ohýbání slov podle různých gramatických kategorií Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6

ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Inflect ohýbání slov podle různých gramatických kategorií Derive odvozování maṣdarů a příčestí ze sloves a naopak Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6

ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Inflect ohýbání slov podle různých gramatických kategorií Derive odvozování maṣdarů a příčestí ze sloves a naopak Resolve rozbor slovních tvarů vyskytujících se v běžném textu Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6

Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6

Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6

Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun kořen "k t b" vzorec FiCAL << "un" Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6

Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun kořen "k t b" vzorec FiCAL << "un" "al-la-silkiyu" al-lā-silkīyu Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6

Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun kořen "k t b" vzorec FiCAL << "un" "al-la-silkiyu" al-lā-silkīyu kořen "s l k" vzorec al > la > FiCL < Iy << "u" Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6

> "s l k" < [ FaCaL verb [ "proceed", "behave" ] imperf FCuL, FiCL noun [ "wire", "thread" ] plural HaFCAL, FiCL < Iy adj [ "wire", "by wire" ], la > FiCL < Iy adj [ "wireless", "radio" ], FuCUL noun [ "behavior", "conduct" ], FuCUL < Iy adj [ "behavioral" ], MaFCaL noun [ "road", "method" ] plural MaFACiL ] Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 4 / 6

> "s l k" < [ FaCaL verb [ "proceed", "behave" ] imperf FCuL, FiCL noun [ "wire", "thread" ] plural HaFCAL, FiCL < Iy adj [ "wire", "by wire" ], la > FiCL < Iy adj [ "wireless", "radio" ], FuCUL noun [ "behavior", "conduct" ], FuCUL < Iy adj [ "behavioral" ], MaFCaL noun [ "road", "method" ] plural MaFACiL ] proceed, behave wire, thread wire, by wire wireless, radio I(u) salak ( aslāk ) silk silkīy lā-silkīy behavior, conduct behavioral road, method sulūk sulūkīy maslak (masāliku ) Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 4 / 6

Reference ElixirFM včetně lexikonu a řada dalších nástrojů pro zpracování arabštiny jsou dostupné jako open-source software publikovaný pod licencí GNU General Public License: http://sourceforge.net/projects/elixir-fm/ http://sourceforge.net/projects/encode-arabic/ Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 5 / 6

Reference ElixirFM včetně lexikonu a řada dalších nástrojů pro zpracování arabštiny jsou dostupné jako open-source software publikovaný pod licencí GNU General Public License: http://sourceforge.net/projects/elixir-fm/ http://sourceforge.net/projects/encode-arabic/ ElixirFM Online Interface je jen jedna z možných uživatelských aplikací celého systému: http://quest.ms.mff.cuni.cz/elixir/ http://ufal.mff.cuni.cz/padt/online/ Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 5 / 6

Buckwalter, Tim. Buckwalter Arabic Morphological Analyzer 1.0. LDC2002L49, ISBN 1-58563-257-0. 2002 Forsberg, Markus and Aarne Ranta. Functional Morphology. Proceedings of ICFP 2004, pages 213 223. ACM Press. 2004 Lagally, Klaus. ArabT E X: Typesetting Arabic and Hebrew, User Manual Version 4.00. Technical Report 2004/03, Fakultät Informatik, Universität Stuttgart. 2004 Smrž, Otakar. Functional Arabic Morphology. Formal System and Implementation. Ph.D. thesis, Charles University in Prague. 2007 Smrž, Otakar et al. Prague Arabic Dependency Treebank: A Word on the Million Words. LREC 2008 Workshop on Arabic and Local Languages. 2008 Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 6 / 6