Počítačový systém ElixirFM model arabské morfologie Otakar Smrž dzamedzam@yahoo.com Džám-e Džam jazyková škola Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 1 / 6
ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6
ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Inflect ohýbání slov podle různých gramatických kategorií Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6
ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Inflect ohýbání slov podle různých gramatických kategorií Derive odvozování maṣdarů a příčestí ze sloves a naopak Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6
ElixirFM Lookup vyhledávání ve slovníku podle základního tvaru arabských slov, podle arabských kořenů, i podle anglického překladu Inflect ohýbání slov podle různých gramatických kategorií Derive odvozování maṣdarů a příčestí ze sloves a naopak Resolve rozbor slovních tvarů vyskytujících se v běžném textu Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 2 / 6
Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6
Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6
Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun kořen "k t b" vzorec FiCAL << "un" Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6
Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun kořen "k t b" vzorec FiCAL << "un" "al-la-silkiyu" al-lā-silkīyu Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6
Slovní tvary jsou reprezentovány abstraktním způsobem, který zachycuje vnitřní strukturu slova. Tento zápis je možno dále převést jak do původního pravopisu, tak do fonologického přepisu. "kitabun" kitābun kořen "k t b" vzorec FiCAL << "un" "al-la-silkiyu" al-lā-silkīyu kořen "s l k" vzorec al > la > FiCL < Iy << "u" Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 3 / 6
> "s l k" < [ FaCaL verb [ "proceed", "behave" ] imperf FCuL, FiCL noun [ "wire", "thread" ] plural HaFCAL, FiCL < Iy adj [ "wire", "by wire" ], la > FiCL < Iy adj [ "wireless", "radio" ], FuCUL noun [ "behavior", "conduct" ], FuCUL < Iy adj [ "behavioral" ], MaFCaL noun [ "road", "method" ] plural MaFACiL ] Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 4 / 6
> "s l k" < [ FaCaL verb [ "proceed", "behave" ] imperf FCuL, FiCL noun [ "wire", "thread" ] plural HaFCAL, FiCL < Iy adj [ "wire", "by wire" ], la > FiCL < Iy adj [ "wireless", "radio" ], FuCUL noun [ "behavior", "conduct" ], FuCUL < Iy adj [ "behavioral" ], MaFCaL noun [ "road", "method" ] plural MaFACiL ] proceed, behave wire, thread wire, by wire wireless, radio I(u) salak ( aslāk ) silk silkīy lā-silkīy behavior, conduct behavioral road, method sulūk sulūkīy maslak (masāliku ) Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 4 / 6
Reference ElixirFM včetně lexikonu a řada dalších nástrojů pro zpracování arabštiny jsou dostupné jako open-source software publikovaný pod licencí GNU General Public License: http://sourceforge.net/projects/elixir-fm/ http://sourceforge.net/projects/encode-arabic/ Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 5 / 6
Reference ElixirFM včetně lexikonu a řada dalších nástrojů pro zpracování arabštiny jsou dostupné jako open-source software publikovaný pod licencí GNU General Public License: http://sourceforge.net/projects/elixir-fm/ http://sourceforge.net/projects/encode-arabic/ ElixirFM Online Interface je jen jedna z možných uživatelských aplikací celého systému: http://quest.ms.mff.cuni.cz/elixir/ http://ufal.mff.cuni.cz/padt/online/ Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 5 / 6
Buckwalter, Tim. Buckwalter Arabic Morphological Analyzer 1.0. LDC2002L49, ISBN 1-58563-257-0. 2002 Forsberg, Markus and Aarne Ranta. Functional Morphology. Proceedings of ICFP 2004, pages 213 223. ACM Press. 2004 Lagally, Klaus. ArabT E X: Typesetting Arabic and Hebrew, User Manual Version 4.00. Technical Report 2004/03, Fakultät Informatik, Universität Stuttgart. 2004 Smrž, Otakar. Functional Arabic Morphology. Formal System and Implementation. Ph.D. thesis, Charles University in Prague. 2007 Smrž, Otakar et al. Prague Arabic Dependency Treebank: A Word on the Million Words. LREC 2008 Workshop on Arabic and Local Languages. 2008 Otakar Smrž (Džám-e Džam) Počítačový systém ElixirFM Praha, 12. prosince 2009 6 / 6