Akviziční korpusy. Alexandr Rosen. Korpusový seminář. Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze
|
|
- Robert Dostál
- před 7 lety
- Počet zobrazení:
Transkript
1 Akviziční korpusy Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze Korpusový seminář 17. března 2016 Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 1 / 68
2 Osnova 1 Akviziční korpusy a jejich anotace 2 Learner Corpora of Czech: Merlin and CzeSL 3 Error Annotation of CzeSL 4 An automatically annotated corpus CzeSL-SGT 5 Searching the corpus 6 Theoretical issues Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 2 / 68
3 Osnova Akviziční korpusy a jejich anotace 1 Akviziční korpusy a jejich anotace 2 Learner Corpora of Czech: Merlin and CzeSL 3 Error Annotation of CzeSL 4 An automatically annotated corpus CzeSL-SGT 5 Searching the corpus 6 Theoretical issues Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 3 / 68
4 Akviziční korpusy a jejich anotace Akviziční korpusy Pro studium osvojování a výuky mateřského i cizího (druhého) jazyka Doklady o užívání jazyka mluvčími, kteří si jazyk (dosud) neosvojili na úrovni dospělého rodilého mluvčího Psané i mluvené Zaměřené na rodilé i nerodilé mluvčí Někdy s chybovou anotací, která vyznačuje odchylky od běžného úzu nebo normy Někdy longitudinální nebo kvazilongitudinální ČNK: SCHOLA2010, SKRIPT2012, CzeSL-plain, CzeSL-SGT /?type=2&theater Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 4 / 68
5 Akviziční korpusy a jejich anotace Žákovské korpusy (learner corpora) Obsahují texty nerodilých mluvčích, kteří se daný jazyk učí. Většinou psané školní práce, často v rámci zkoušky, někdy i mluvené žákovské korpusy. Důraz na metadata: věk, mateřský jazyk, úroveň znalosti cílového jazyka apod. Od 1990 jako materiál pro slovníky určené studentům angličtiny (např. Longman Learner Corpus) 2002: International Corpus of Learner English (ICLE) Univerzita v Nové Lovani Pro autory učebnic, metodology, jazykovědce Odchylky od úzu/standardu lze opravovat a určit typ chyby Odchylky mohou být na více rovinách současně Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 5 / 68
6 Akviziční korpusy a jejich anotace Korpus M slov L1 L2 Úroveň Médium Anotace ICLE 3 26 en pokr. psaný část. CLC en vše psaný část. LINDSEI en pokr. mluv. část. PELCRA 0.5 pl en vše psaný část. USE 1.2 sv en pokr. psaný ne HKUST 25 zh en pokr. psaný část. CHUNGDAHM 131 ko en vše psaný část. JEFLL 0.7 jp en zač. psaný část. MELD 1 16 en pokr. psaný ne MICASE 1.8 růz. en pokr. mluv. ne NICT JLE 2 jp en vše mluv. část. FALKO de pokr. psaný část. FRIDA 0.2 růz. fr stř.-pokr. mluv. část. FLLOC 2 en fr vše mluv. ne PiKUST sl pokr. psaný ano ASU 0.5 růz. no pokr. psaný ne TUFS 0.6 růz. jp vše psaný ne M znaků Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 6 / 68
7 Akviziční korpusy a jejich anotace Using a learner corpus To describe levels of progress in learners interlanguage To identify an optimal order and method of teaching grammar To research L1 influence To distinguish universal errors from errors due to learner s L1 To identify overuse and underuse of linguistic items in learner language To identify features responsible for the foreign sound Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 7 / 68
8 Akviziční korpusy a jejich anotace Annotation of Learner Corpora Learner corpora can be annotated in two independent ways: Linguistic annotation Lemmatization, morphological tagging, syntactic structure, etc. On the original text or on the corrected text Usually automatic or semiautomatic Error annotation Correcting and/or categorizing errors Diverse annotation systems Usually manual Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 8 / 68
9 Capturing errors Akviziční korpusy a jejich anotace 1. Implicit errors are identified and corrected Pros: faster training of annotators faster process of annotation Cons: results hard to search and analyze 2. Explicit errors are identified and categorized Error categories (tags) reflect a specific theory Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 9 / 68
10 Akviziční korpusy a jejich anotace A sample (manual) error annotation CzeSL 2 incor fw wbd incorrect form incorinfl M inflection error T1 incorbase M stem error T1 incorother A other T1 foreign word, neologism, unidentifiable fwfab M newly created Czech word T1 fwnc M foreign word T1 flex M inflection of fw T1 word-boundary error wbdpre M separate prefix, attached preposition T1 wbdcomp M incorrectly separated/joined composites T1 wbdother M other word-boundary errors T1 styl colloquial, bookish, regional expression stylcoll M colloquial expression T1,T2 stylother M bookish, regional, slang expression T1,T2 stylmark M filler T2 problem M problem T1,T2 2 [Štindlová et al.(2013), Rosen et al.(2014a)] Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 10 / 68
11 Akviziční korpusy a jejich anotace agr M agreement error T2 dep M structural error T2 ref M pronominal reference error T2 vbx M complex verb error T2 cvf A analytical verb form error T2 mod A modal verb error T2 vnp A copula T2 rflx M reflexive form error T2 neg M negation error T2 odd A extra word T2 miss A missing word T2 wo A word-order errror T2 lex M lexical and idiomatic error T2 use M incorrect use of a category T2 sec M secondary error T2 disr M word salad T2 Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 11 / 68
12 Akviziční korpusy a jejich anotace Automatic annotation? For many native languages, reasonably reliable annotation tools are available. Non-native language is often annotated manually, but this is not realistic for larger volumes. Can methods and tools developed for native language help? Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 12 / 68
13 Akviziční korpusy a jejich anotace Automatic annotation of learner corpora NLP for learner language: 3 tutoring systems (Intelligent Computer-Assisted Language Learning ICALL) 4 automated scoring in language testing analysis and annotation of learner corpora Linguistic annotation: lemmatization, tagging, (shallow) parsing 5 Error annotation 3 [Meurers(2013)] 4 [Dickinson & Herring(2008)] 5 [Nagata et al.(2011), Dickinson & Ragheb(2009), Krivanek & Meurers(2014)] Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 13 / 68
14 Osnova Learner Corpora of Czech: Merlin and CzeSL 1 Akviziční korpusy a jejich anotace 2 Learner Corpora of Czech: Merlin and CzeSL 3 Error Annotation of CzeSL 4 An automatically annotated corpus CzeSL-SGT 5 Searching the corpus 6 Theoretical issues Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 14 / 68
15 Merlin Learner Corpora of Czech: Merlin and CzeSL Learner corpus of Czech, German, and Italian 6 To build a platform matching CEFR levels with language phenomena specific to the level Funded by the EU Lifelong Learning Programme, Czech: 64.5K words, CEFR levels A1 C1 Tagged, parsed, on-line searchable 6 [Boyd et al.(2014)], Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 15 / 68
16 Learner Corpora of Czech: Merlin and CzeSL AKCES Acquisition corpora of Czech 7 An umbrella project, various funding Faculty of Arts, Charles University in Prague Project head: Karel Šebesta, Institute of Czech Language and Theory of Communication Groups: Native learners Learners growing up in socially excluded communities, mostly with Romani background Non-native learners Written/spoken language 7 [Šebesta(2012)], Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 16 / 68
17 Learner Corpora of Czech: Merlin and CzeSL Searchable: CNC ITCL Downloadable: LINDAT License Creative Commons BY-(NC-)ND 3.0 Native learners, elementary and secondary school Speech: SCHOLA 2010 AKCES 2 (1M tokens) Essays: SKRIPT 2012 AKCES 1 (0.7M tokens), SKRIPT-SGT in prep., also Roma learners Roma learners Speech: ROMi 1.0 (1.5M words) Essays: AKCES 4 (300K words) Non-native learners (essays) CzeSL-plain AKCES 3 also Roma and native (2.3M tokens) CzeSL-SGT AKCES 5 automatic annotation (1.1M tokens) CzeSL-MAN manual annotation (288K/48K tokens, SeLaQ beta) Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 17 / 68
18 Learner Corpora of Czech: Merlin and CzeSL The CzeSL corpus Czech as a Second Language Approx. 1 MW, transcribed hand-written essays L1 groups: Slavic: Russian, Ukrainian, Polish,... Other Indo-European: German, English, French,... Non-Indo-European: Vietnamese, Chinese, Arabic,... All levels of proficiency according to CEFR Metadata on the learner and the task (30 items) Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 18 / 68
19 Learner Corpora of Czech: Merlin and CzeSL Sizes and proportions Texts 8.6K Sentences 111K Words 958K Tokens 1,148K Different authors 1,965 Different native languages 54 Proficiency levels A1 C2 Age 9 76 Women/Men 5/3 KW Words per text Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 19 / 68
20 Learner Corpora of Czech: Merlin and CzeSL Language groups and proficiency levels 8 CEFR (Czech) L1 group Slavic IndEur non-indeur? Total A A A A B B C C ? Total More statistics on Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 20 / 68
21 Osnova Error Annotation of CzeSL 1 Akviziční korpusy a jejich anotace 2 Learner Corpora of Czech: Merlin and CzeSL 3 Error Annotation of CzeSL 4 An automatically annotated corpus CzeSL-SGT 5 Searching the corpus 6 Theoretical issues Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 21 / 68
22 Error Annotation of CzeSL Workflow Acquisition Transcription Proofreading Conversion to PML Error annotation Revision Adjudication Postprocessing Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 22 / 68
23 Strategy Error Annotation of CzeSL Minimal correction Capture only grammatical and lexical characteristics of non-native language Relative to Literary Czech Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 23 / 68
24 Error Annotation of CzeSL Error Annotation of a Flective Language Problems Inflection (nouns: 15 basic paradigms, subparadigms, subsub...) Derivation, agreement, word-order reflecting information structure, etc. Solution Multilevel annotation scheme Combining manual and automatic annotation Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 24 / 68
25 Error Annotation of CzeSL Error Annotation of a Flective Language Problems Inflection (nouns: 15 basic paradigms, subparadigms, subsub...) Derivation, agreement, word-order reflecting information structure, etc. Solution Multilevel annotation scheme Combining manual and automatic annotation Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 24 / 68
26
27 <li>viktor je mladý pan z Polska Ruska. Studuje {češtinu}<in> ve škole, protože ne umí psat a čist spravně. Bydlí na koleje vedle školy, má jednu sestru Irenu, která se učí na univerzite u profesora Smutneveselého. Bohužel, Viktor není dobrym student, protože spí na lekci, ale jeho sestra {piše všechno -> všechno piše} a vyborně rozumí českeho profesora Smutneveselého {a brzo delá domací ukol}<in>. Večeře Irena jde na prohaska spolu z kamaradem, ale její bratr dělá nic. Jeho čeština je špatná, vím, že se vratit ve Polsko Ruskou a tam budí studovat u pomalu myt podlahy. <li>kamarad Ireny je {A a}meričan a chytry můž. On miluje Irenu a chce se vzít na ní. protože ona je hezká, taky chytra, rozumí ho a umí vyborný vařit.
28 <li>viktor je mladý pan z Polska Ruska. Studuje {češtinu}<in> ve škole, protože ne umí psat a čist spravně. Bydlí na koleje vedle školy, má jednu sestru Irenu, která se učí na univerzite u profesora Smutneveselého. Bohužel, Viktor není dobrym student, protože spí na lekci, ale jeho sestra {piše všechno -> všechno piše} a vyborně rozumí českeho profesora Smutneveselého {a brzo delá domací ukol}<in>. Večeře Irena jde na prohaska spolu z kamaradem, ale její bratr dělá nic. Jeho čeština je špatná, vím, že se vratit ve Polsko Ruskou a tam budí studovat u pomalu myt podlahy. <li>kamarad Ireny je {A a}meričan a chytry můž. On miluje Irenu a chce se vzít na ní. protože ona je hezká, taky chytra, rozumí ho a umí vyborný vařit.
29 <li>viktor je mladý pan z Polska Ruska. Studuje {češtinu}<in> ve škole, protože ne umí psat a čist spravně. Bydlí na koleje vedle školy, má jednu sestru Irenu, která se učí na univerzite u profesora Smutneveselého. Bohužel, Viktor není dobrym student, protože spí na lekci, ale jeho sestra {piše všechno -> všechno piše} a vyborně rozumí českeho profesora Smutneveselého {a brzo delá domací ukol}<in>. Večeře Irena jde na prohaska spolu z kamaradem, ale její bratr dělá nic. Jeho čeština je špatná, vím, že se vratit ve Polsko Ruskou a tam budí studovat u pomalu myt podlahy. <li>kamarad Ireny je {A a}meričan a chytry můž. On miluje Irenu a chce se vzít na ní. protože ona je hezká, taky chytra, rozumí ho a umí vyborný vařit.
30 Error Annotation of CzeSL Multilevel Annotation Scheme Level 0 Original text (transcribed, self-corrections inlined) Level 1 Corrections disregarding word context Spelling, form of stems and endings Result: sequence of existing Czech forms Level 2 Remaining errors: syntactic, lexical, word-order, style, referential, negation,... Result: grammatically correct sentence Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 29 / 68
31 Error Annotation of CzeSL Bojal jsme se že ona se ne bude libila slavnou prahu, proto to bylo velmí vadí pro mně. Bál jsem se, že se jí nebude líbit slavná Praha, protože to by mi velmi vadilo. I was affraid that she would not like the famous city of Prague, because I would be very unhappy about it. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 30 / 68
32 Error Annotation of CzeSL Bojal jsme se že ona se ne bude libila slavnou prahu, proto to bylo velmí vadí pro mně. Bál jsem se, že se jí nebude líbit slavná Praha, protože to by mi velmi vadilo. I was affraid that she would not like the famous city of Prague, because I would be very unhappy about it. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 30 / 68
33 Bojal *feared jsme aux incorinfl Bál jsme agr rflx Bál jsem se, I was afraid že ona se ne bude libila slavnou prahu,
34 proto to bylo velmí vadí pro mně. že ona se ne bude libila slavnou prahu, that she rflx not will *like famous Prague, wbdpre incorbase že ona se nebude líbila slavnou Prahu, dep vbx agr,sec dep že se jí nebude líbit slavná Praha, that she would not like the famous city of Prague,
35 proto to bylo velmí vadí pro mně. therefore it was *very resent for me. incorbase proto to bylo velmi vadí pro mně. lex vbx dep protože to by mi velmi vadilo. because I would be very unhappy about it.
36
37 Osnova An automatically annotated corpus CzeSL-SGT 1 Akviziční korpusy a jejich anotace 2 Learner Corpora of Czech: Merlin and CzeSL 3 Error Annotation of CzeSL 4 An automatically annotated corpus CzeSL-SGT 5 Searching the corpus 6 Theoretical issues Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 35 / 68
38 An automatically annotated corpus CzeSL-SGT The CzeSL-SGT corpus: Czech as a Second Language with Spelling, Grammar and Tags Transcriptions of essays written by non-native speakers of Czech in Extends the foreign part of CzeSL-plain by texts collected in 2013 Transcription markup discarded With metadata about the text and the author With automatic linguistic and error annotation correction tagging and lemmatization error labels Searchable from the interface of the Czech National Corpus: Downloadable from the LINDAT data repository (AKCES 5): Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 36 / 68
39 An automatically annotated corpus CzeSL-SGT Annotation If possible, each word form is tagged by a standard tagger 10 with: word class morphological categories base form (lemmas) Forms detected as incorrect are corrected by a stochastic spelling and grammar checker, targeting even some real word errors 11 The corrected text is re-tagged Original and corrected forms are compared and error labels, based on applicable formal criteria, are assigned 12 All the annotation is assigned automatically 10 [Votrubec(2006)] 11 [Richter(2010), Richter et al.(2012)] 12 [Jelínek et al.(2012)] Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 37 / 68
40 An automatically annotated corpus CzeSL-SGT The tools: morphological analyzer + tagger Morče 13 Standard tool, reported results on native text 95 96% Trained on native texts (Prague Dependency Treebank) 14 A rule-based module deteriorates the result on learner texts Success varies by text 13 [Votrubec(2006)] 14 [PZK(2005)] Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 38 / 68
41 An automatically annotated corpus CzeSL-SGT The tools: Spell-checker Korektor 15 Combines rule-based morphology with a stochastic model Modes: spell-checker, proof-reader, diacritics assigner Trained on native texts (Prague Dependency Treebank) 16 Produces ranked suggestions with a correction type: spelling or grammar Suggestions for single words only, proposing single words again 15 [Richter et al.(2012)] 16 [PZK(2005)] Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 39 / 68
42 An automatically annotated corpus CzeSL-SGT Annotation of a sample sentence with spelling errors (1) Tén pes míluje svécho kamarada člověka. Ten pes miluje svého kamaráda člověka. That dog loves his friend the man. word lemma tag word1 lemma1 tag1 gs err Tén Tén X@ Ten ten PDYS1 S Quant1 pes pes NNMS1 pes pes NNMS1 míluje míluje X@ miluje milovat VB-S-3P S Quant1 svécho svécho X@ svého svůj P8MS4 S Voiced kamarada kamarada X@ kamaráda kamarád NNMS4 S Quant0 - - Z: - - Z: člověka člověk NNMS2 člověka člověk NNMS4.. Z:-.. Z: Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 40 / 68
43 An automatically annotated corpus CzeSL-SGT Annotation of a sample sentence with real-word errors (2) Nejakij muž spí v postele. Nějakej muž spí v posteli. Some guy is sleeping in the bed. word lemma tag word1 lemma1 tag1 gs err Nejakij Nejakij X@ Nějakej nějaký PZYS1-6 S Caron0 muž muž NNMS1 muž muž NNMS1 spí spát VB-S---3P spí spát VB-S---3P v v RR--4 v v RR--6 postele postel NNFP4 posteli postel NNFS6 G SingCh.. Z:.. Z: Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 41 / 68
44 An automatically annotated corpus CzeSL-SGT Formal error tags Error type Error description Example Cap0 capitalization: incor. lower case evropě/evropě; štědrý/štědrý Cap1 capitalization: incor. upper case Staré/staré; Rodině/rodině Vcd0 voicing assimilation: incor. voiced stratíme/ztratíme; nabítku/nabídku Vcd1 voicing assimilation: incor. vcless zbalit/sbalit; nigdo/nikdo VcdFin0 word-final voicing: incor. voiceless kdyš/když; vztach/vztah VcdFin1 word-final voicing: incor. voiced přez/přes; pag/pak Vcd voicing: other errors protoše/protože; hodili/chodili Palat0 missing palatalization (k,g,h,ch) amerikě/americe; matkě/matce Je0 je/ě: incorrect ě ubjehlo/uběhlo; Nejvjetší /Největší Je1 je/ě: incorrect je vjeděl/věděl; vjeci/věci Mne0 mě/mně: incorrect mě zapoměla/zapomněla Mne1 mě/mně: incor. mně, mňe, mňě mněla/měla; rozumněli/rozuměli ProtJ0 protethic j: missing j sem/jsem; menoval/jmenoval ProtJ1 protethic j: extra j jse/se; jmé/mé ProtV1 protethic v: extra v vosm/osm; vopravdu/opravdu EpentE0 e epenthesis: missing e domček/domeček EpentE1 e epenthesis: extra e rozeběhl/rozběhl; účety/účty Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 42 / 68
45 An automatically annotated corpus CzeSL-SGT Metadata Most texts are equipped with metadata about the author and the text. 15 items about the author: sex age L1 CEFR level of proficiency in Czech duration and method of study length of stay in Czechia knowledge of Czech among family members... Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 43 / 68
46 An automatically annotated corpus CzeSL-SGT Metadata, cont d 15 items about the text: date time limit word count topic genre dictionary/textbook allowed exam?... Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 44 / 68
47 An automatically annotated corpus CzeSL-SGT Anonymization The texts are anonymized by replacing personal names with appropriate forms of Adam and Eva. Names of smaller places (streets, villages, small towns) and other potentially sensitive data are replaced by QQQ. Unreadable characters or words are transcribed as XXX. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 45 / 68
48 An automatically annotated corpus CzeSL-SGT Evaluation of the automatic correction Korektor The sample: 67 texts, 9373 tokens, 7995 words Evaluated on a manually and doubly annotated subset of CzeSL Using corrections where both annotators agree (97% on T1, 91% on T2) Ill-formed tokens: total (= unknown to MA): 918 with identical corrections on T1: 786 Results for ill-formed tokens: diacritics assigner only: 70% proof-reader: 80% diacritics assigner followed by proof-reader 82% a a [Štindlová et al.(2012)] Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 46 / 68
49 Osnova Searching the corpus 1 Akviziční korpusy a jejich anotace 2 Learner Corpora of Czech: Merlin and CzeSL 3 Error Annotation of CzeSL 4 An automatically annotated corpus CzeSL-SGT 5 Searching the corpus 6 Theoretical issues Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 47 / 68
50 Searching the corpus Dynamic attributes Dynamic attributes are derived from some positions of tag and tag1. Useful in queries: To access individual morphological categories To stipulate identity of categories across mutiple forms to require grammatical concord To compare values of a category for the original and corrected forms k, k1 word class (position 1 of the tag) s, s1 detailed word class (position 2 of the tag) g, g1 gender (position 3 of the tag) n, n1 number (position 4 of the tag) c, c1 case (position 5 of the tag) p, p1 person (position 8 of the tag) Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 48 / 68
51 Searching the corpus Comparing annotation of original and corrected forms Global conditions in a CQL query 1:[] 2:[] & 1.lemma = 2.lemma 1:[] 2:[] & 1.lemma = 2.word 1:[] & 1.lemma!= 1.lemma1 1:[] & 1.c!= 1.c1 Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 49 / 68
52
53 Osnova Theoretical issues 1 Akviziční korpusy a jejich anotace 2 Learner Corpora of Czech: Merlin and CzeSL 3 Error Annotation of CzeSL 4 An automatically annotated corpus CzeSL-SGT 5 Searching the corpus 6 Theoretical issues Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 51 / 68
54 Theoretical issues Theoretical issues of annotating learner language The absence of automatic methods and tools targeting non-native language is not caused only by the computational complexity of the task and the absence of data resources, e.g. for machine learning applications. There is a more fundamental issue of largely missing concepts and schemes to describe non-standard linguistic phenomena. An option: non-standard phenomena modelled as mismatches between different dimensions of a word class classification [Díaz-Negrillo et al.(2010), Rosen et al.(2014b), Rosen(2014)] Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 52 / 68
55 Theoretical issues Word classes in 3D Each word form has three word classes: inflectional (morphology) word as a sequence of morphs to deal with ill-formed morphs or wrongly concatenated morphs properties: form, lemma, paradigm lexical (stem) word as a bundle of morphemes (grammatical, lexical) categories interpreted within the local context of isolated word forms properties: form, lemma, paradigm, case, number, gender, person,... syntactic (distribution) word as a syntactic constituent categories interpreted in the syntactic context properties: case, number, gender, person,... Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 53 / 68
56 Theoretical issues Types of mismatches: inflectional lexical = syntactic to model phenomena involving morphology (stems, inflection, derivation), including distinction between a problem in stem and inflection: vidím leva ip:lev-leva, xp:lev-lva ( I see a lion ) novoroční předsevzení il:předsevzení, xl:předsevzetí ( New Year s resolution ) inflectional = lexical syntactic to model phenomena involving morphosyntax (agreement, government): vidím lev xnom, sacc ( I see a lion NOM ) pomáhat rodinu xacc, sdat ( help the family ACC ) Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 54 / 68
57 Theoretical issues Word classes in standard language can differ across dimensions, but only specific combinations are available: který iadj,xprn,snoun ( which ) Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 55 / 68
58 Theoretical issues Examples Morphology květiny kvétou ip:kvést-kvétou ( flowers bloom ) učitelka bí žáky ip:bít-bí ( the teacher beats pupils ) po jednem roku ip:jeden-jednem ( after one year ) Praha libi se mi moc ip:libit-libi, xl:líbit ( Prague I like a lot ) skuzím il:skuzit, xl:zkusit ( I ll try ) mamiňkou il:mamiňka, xl:maminka ( [with] maminka ) Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 56 / 68
59 Theoretical issues Morphosyntactic categories Chtěla bych bydlet v nějakém evropském zemi. sfem ( I d like to live in some European MASC country FEM ) na univerzitě Karlova sloc (at Charles NOM University ) skončit magistr sacc ( finish Master NOM ) potřebuju mnoho sil a snah xsg ( need much strength and efforts ) nemusila jsem převzít odpovědnost za něco sneg ( didn t have to accept responsibility for something ) Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 57 / 68
60 Thanks to... Theoretical issues... other members of the team, esp.: Barbora Štindlová, Jirka Hana, Tomáš Jelínek, Svatava Škodová, Karel Šebesta, Vladimír Petkevič, Pavel Procházka, Hana Skoumalová, Milena Hnátková, Jan Štěpánek, Zuzanna Bedřichová, Kateřina Šormová, Kateřina Lundáková, Dagmar Toufarová... the sponsors: The European Social Fund and the Czech government: Education for Competitiveness Innovation in Education in the Field of Czech as a Second Language (CZ.1.07/2.2.00/ ) Large Research, Development and Innovation Infrastructures: The Czech National Corpus (LM ) PRVOUK, the research funding programme at Charles University: P10 Linguistics, Acquisition and Development of Linguistic and Communicative Competence in Selected Communities of the Czech Republic Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 58 / 68
61 Theoretical issues... and you! Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 59 / 68
62 References I Theoretical issues Boyd, A., Hana, J., Nicolas, L., Meurers, D., Wisniewski, K., Abel, A., Schöne, K., Štindlová, B., & Vettori, C. (2014). The MERLIN corpus: Learner language and the CEFR. In N. Calzolari, K. Choukri, T. Declerck, H. Loftsson, B. Maegaard, J. Mariani, A. Moreno, J. Odijk, and S. Piperidis, editors, Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC 14), Reykjavik, Iceland. European Language Resources Association (ELRA). Dickinson, M. & Herring, J. (2008). Developing online ICALL exercises for Russian. In The 3rd Workshop on Innovative Use of NLP for Building Educational Applications (ACL08-NLP-Education), pages 1 9, Columbus, OH. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 60 / 68
63 References II Theoretical issues Dickinson, M. & Ragheb, M. (2009). Dependency annotation for learner corpora. In Proceedings of the Eighth Workshop on Treebanks and Linguistic Theories TLT8. Díaz-Negrillo, A., Meurers, D., Valera, S., & Wunsch, H. (2010). Towards interlanguage POS annotation for effective learner corpora in SLA and FLT. Language Forum, 36(1 2), Special Issue on Corpus Linguistics for Teaching and Learning. In Honour of John Sinclair. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 61 / 68
64 References III Theoretical issues Jelínek, T., Štindlová, B., Rosen, A., & Hana, J. (2012). Combining manual and automatic annotation of a learner corpus. In P. Sojka, A. Horák, I. Kopeček, and K. Pala, editors, Text, Speech and Dialogue Proceedings of the 15th International Conference TSD 2012, number 7499 in Lecture Notes in Computer Science, pages Springer. Krivanek, J. & Meurers, D. (2014). Comparing rule-based and data-driven dependency parsing of learner language. In E. H. Kim Gerdes and L. Wanner, editors, Dependency Theory, Frontiers in AI and Applications. IOS Press, Amsterdam. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 62 / 68
65 References IV Theoretical issues Meurers, D. (2013). Natural language processing and language learning. In C. A. Chapelle, editor, Encyclopedia of Applied Linguistics, pages Blackwell. Nagata, R., Whittaker, E., & Sheinman, V. (2011). Creating a manually error-tagged and shallow-parsed learner corpus. In Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies - Volume 1, HLT 11, pages , Stroudsburg, PA, USA. Association for Computational Linguistics. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 63 / 68
66 References V Theoretical issues PZK (2005). Pražský závislostní korpus. Ústav formální a aplikované lingvistiky MFF UK, Praha. Verze 2.0, Richter, M. (2010). An Advanced Spell Checker of Czech. Master s thesis, Faculty of Mathematics and Physics, Charles University, Prague. Richter, M., Straňák, P., & Rosen, A. (2012). Korektor a system for contextual spell-checking and diacritics completion. In Proceedings of COLING 2012: Posters, pages , Mumbai, India. The COLING 2012 Organizing Committee. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 64 / 68
67 References VI Theoretical issues Rosen, A. (2014). A 3D taxonomy of word classes at work. In L. Veselovská and M. Janebová, editors, Complex Visibles Out There. Proceedings of the Olomouc Linguistics Colloquium 2014: Language Use and Linguistic Structure, volume 4 of Olomouc Modern Language Series, pages , Olomouc. Palacký University. Rosen, A., Hana, J., Štindlová, B., & Feldman, A. (2014a). Evaluating and automating the annotation of a learner corpus. Language Resources and Evaluation Special Issue: Resources for language learning, 48(1), Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 65 / 68
68 References VII Theoretical issues Rosen, A., Štindlová, B., Škodová, S., & Hana, J. (2014b). Using a cross-classifying taxonomy of non-standard forms to analyze non-native Czech. In SLE th Annual Meeting of the Societas Linguistica Europaea, Workshop on Interlanguage Annotation, Poznań, Poland. Adam Mickiewicz University. Votrubec, J. (2006). Morphological tagging based on averaged perceptron. In WDS 06 Proceedings of Contributed Papers, pages , Praha, Czechia. Matfyzpress, Charles University. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 66 / 68
69 References VIII Theoretical issues Šebesta, K. (2012). Learner corpora and Czech language. In I. Semrádová, editor, Intercultural Inspirations for Language Education. Spaces for understanding., pages Univerzita Hradec Králové, Hradec Králové. Štindlová, B., Rosen, A., Hana, J., & Škodová, S. (2012). CzeSL an error tagged corpus of Czech as a second language. In P. Pęzik, editor, Corpus Data across Languages and Disciplines, volume 28 of Łódź Studies in Language, pages 21 32, Frankfurt am Main. Peter Lang. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 67 / 68
70 References IX Theoretical issues Štindlová, B., Škodová, S., Hana, J., & Rosen, A. (2013). A learner corpus of Czech: current state and future directions. In S. Granger, G. Gilquin, and F. Meunier, editors, Twenty Years of Learner Corpus Research: Looking back, Moving ahead, Corpora and Language in Use Proceedings 1, Louvain-la-Neuve. Presses Universitaires de Louvain. Alexandr Rosen (ÚTKL FF UK) Akviziční korpusy Seminář ÚČNK 68 / 68
Building an Error-tagged Learner Corpus of Czech
Building an Error-tagged Learner Corpus of Czech Jirka Hana, Alexandr Rosen & Barbora Štindlová Charles University, Prague & Technical University, Liberec Institute of Formal and Applied Linguistics Seminar
Syntactic annotation of a second-language learner corpus
Syntactic annotation of a second-language Jirka Hana & Barbora Hladká Charles University Prague ICBLT 2018 CzeSL Corpus of L2 Czech ICBLT 2018 2 CzeSL Czech as a Second Language Part of AKCES Acquisition
Universal Dependencies and non-native Czech
Universal Dependencies and non-native Czech Jirka Hana & Barbora Hladká Charles University Prague TLT 2018 CzeSL Czech as a Second Language Texts written by non-native speakers of Czech CzeSL-man subcorpus
CzeSL-SGT korpus češtiny nerodilých mluvčích s automaticky provedenou anotací
CzeSL-SGT korpus češtiny nerodilých mluvčích s automaticky provedenou anotací Žákovský korpus CzeSL-SGT (Czech as a Second Language with Spelling, Grammar and Tags) obsahuje přepisy písemných prací nerodilých
Anotace žákovského korpusu. Alena Poncarová Žďárek, Listopad 2011
Anotace žákovského korpusu Alena Poncarová Žďárek, Listopad 2011 Obsah příspěvku Žákovský korpus CzeSL Akviziční korpusy Anotace korpusu CzeSL přepisy anotace Evaluace 2 Žákovský korpus CzeSL projekt AKCES
New error annotation of Czech learner corpora. Tomáš Jelínek, Faculty of Arts, Charles University, Prague
New error annotation of Czech learner corpora Tomáš Jelínek, Faculty of Arts, Charles University, Prague Outline Motivation CzeSL corpus Annotating errors by levels of language description Brat annotation
USING VIDEO IN PRE-SET AND IN-SET TEACHER TRAINING
USING VIDEO IN PRE-SET AND IN-SET TEACHER TRAINING Eva Minaříková Institute for Research in School Education, Faculty of Education, Masaryk University Structure of the presentation What can we as teachers
VŠEOBECNÁ TÉMATA PRO SOU Mgr. Dita Hejlová
VŠEOBECNÁ TÉMATA PRO SOU Mgr. Dita Hejlová VZDĚLÁVÁNÍ V ČR VY_32_INOVACE_AH_3_03 OPVK 1.5 EU peníze středním školám CZ.1.07/1.500/34.0116 Modernizace výuky na učilišti Název školy Název šablony Předmět
On the Structure of Constituent Negation in Czech
On the Structure of Constituent Negation in Czech Kateřina Veselovská veselovska@ufal.mff.cuni.cz Institute of Formal and Applied Linguistics Faculty of Mathematics and Physics Charles University in Prague
Základní škola Marjánka
Základní škola Marjánka Historie školy The school history Roku 1910 začíná v budově na Marjánce vyučování v pěti postupných ročnících s pěti paralelními třídami. The Marjanka elementary school was established
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost. Projekt MŠMT ČR Číslo projektu Název projektu školy Klíčová aktivita III/2 EU PENÍZE ŠKOLÁM CZ.1.07/1.4.00/21.2146
SSOS_AJ_3.18 British education
Číslo a název projektu Číslo a název šablony DUM číslo a název CZ.1.07/1.5.00/34.0378 Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT SSOS_AJ_3.18
CZ.1.07/1.5.00/
Projekt: Příjemce: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova 3, 371 60 České Budějovice
Compression of a Dictionary
Compression of a Dictionary Jan Lánský, Michal Žemlička zizelevak@matfyz.cz michal.zemlicka@mff.cuni.cz Dept. of Software Engineering Faculty of Mathematics and Physics Charles University Synopsis Introduction
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.
Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost. Projekt MŠMT ČR Číslo projektu Název projektu školy Klíčová aktivita III/2 EU PENÍZE ŠKOLÁM CZ.1.07/1.4.00/21.2146
SSOS_AJ_3.17 Czech education
Číslo a název projektu Číslo a název šablony DUM číslo a název CZ.1.07/1.5.00/34.0378 Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT SSOS_AJ_3.17
Just write down your most recent and important education. Remember that sometimes less is more some people may be considered overqualified.
CURRICULUM VITAE - EDUCATION Jindřich Bláha Výukový materiál zpracován v rámci projektu EU peníze školám Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Bc. Jindřich Bláha. Dostupné z Metodického
Korpusová lingvistika a počítačové zpracování přirozeného jazyka
Korpusová lingvistika a počítačové zpracování přirozeného jazyka Vladimír Petkevič & Alexandr Rosen Ústav teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy v Praze Korpusový seminář
Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.
- University I would like to enroll at a university. Stating that you want to enroll I want to apply for course. Stating that you want to apply for a course an undergraduate a postgraduate a PhD a full-time
Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.
- University Rád/a bych se zapsal/a na vysoké škole. Stating that you want to enroll Rád/a bych se zapsal/a na. Stating that you want to apply for a course bakalářské studium postgraduální studium doktorské
VY_32_INOVACE_06_Předpřítomný čas_03. Škola: Základní škola Slušovice, okres Zlín, příspěvková organizace
VY_32_INOVACE_06_Předpřítomný čas_03 Autor: Růžena Krupičková Škola: Základní škola Slušovice, okres Zlín, příspěvková organizace Název projektu: Zkvalitnění ICT ve slušovské škole Číslo projektu: CZ.1.07/1.4.00/21.2400
Číslo projektu: CZ.1.07/1.5.00/34.0036 Název projektu: Inovace a individualizace výuky
Číslo projektu: CZ.1.07/1.5.00/34.0036 Název projektu: Inovace a individualizace výuky Autor: Mgr. Libuše Matulová Název materiálu: Education Označení materiálu: VY_32_INOVACE_MAT27 Datum vytvoření: 10.10.2013
GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA
GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA What is an FTP client and how to use it? FTP (File transport protocol) - A protocol used to transfer your printing data files to the MAFRAPRINT
VY_22_INOVACE_60 MODAL VERBS CAN, MUST
VY_22_INOVACE_60 MODAL VERBS CAN, MUST Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor: Anglický jazyk Ročník: 9. MODAL VERBS CAN, MUST, SHOULD 1/ Connect the verbs to their future forms.
Aktuální trendy ve výuce a testování cizích jazyků v akademickém prostředí
Jazykové centrum Aktuální trendy ve výuce a testování cizích jazyků v akademickém prostředí 15. 1. 2018 Projekt Zvýšení kvality vzdělávání a jeho relevance pro potřeby trhu práce CZ.02.2.69/0.0/16_015/0002362
WORKSHEET 1: LINEAR EQUATION 1
WORKSHEET 1: LINEAR EQUATION 1 1. Write down the arithmetical problem according the dictation: 2. Translate the English words, you can use a dictionary: equations to solve solve inverse operation variable
Czech Republic. EDUCAnet. Střední odborná škola Pardubice, s.r.o.
Czech Republic EDUCAnet Střední odborná škola Pardubice, s.r.o. ACCESS TO MODERN TECHNOLOGIES Do modern technologies influence our behavior? Of course in positive and negative way as well Modern technologies
1, Žáci dostanou 5 klíčových slov a snaží se na jejich základě odhadnout, o čem bude následující cvičení.
Moje hlavní město Londýn řešení: 1, Žáci dostanou 5 klíčových slov a snaží se na jejich základě odhadnout, o čem bude následující cvičení. Klíčová slova: capital, double decker bus, the River Thames, driving
CZ.1.07/1.5.00/
Číslo projektu CZ.1.07/1.5.00/34.0499 Název školy Název materiálu Autor Tematický okruh Ročník Soukromá střední odborná škola Frýdek-Místek, s.r.o. VY_32_INOVACE_354_AJ_34 Mgr. Pavla Matýsková Anglický
Course description. Course credit prior to NO Counted into average NO Winter semester 0 / - 0 / - 0 / - Timetable Language of instruction
Course description Course abbreviation: KAL/CAE2 Page: 1 / 8 Course name: English - Preparation for The CAE 2 Academic Year: 2015/2016 Printed: 16.06.2016 22:02 Department/Unit / KAL / CAE2 Academic Year
Strukturovaný životopis
Strukturovaný životopis Mgr. Magdaléna Rysová Osobní informace E-mail: magdalena.rysova@post.cz WWW: https://ufal.mff.cuni.cz/magdalena-rysova Vzdělání od 2012 FF UK v Praze: doktorské studium, obor Český
Dynamic Development of Vocabulary Richness of Text. Miroslav Kubát & Radek Čech University of Ostrava Czech Republic
Dynamic Development of Vocabulary Richness of Text Miroslav Kubát & Radek Čech University of Ostrava Czech Republic Aim To analyze a dynamic development of vocabulary richness from a methodological point
Tabulka 1 Stav členské základny SK Praga Vysočany k roku 2015 Tabulka 2 Výše členských příspěvků v SK Praga Vysočany Tabulka 3 Přehled finanční
Příloha I Seznam tabulek Tabulka 1 Stav členské základny SK Praga Vysočany k roku 2015 Tabulka 2 Výše členských příspěvků v SK Praga Vysočany Tabulka 3 Přehled finanční odměny pro rozhodčí platný od roku
Gymnázium, Brno, Slovanské nám. 7, SCHEME OF WORK Mathematics SCHEME OF WORK. cz
SCHEME OF WORK Subject: Mathematics Year: first grade, 1.X School year:../ List of topisc # Topics Time period Introduction, repetition September 1. Number sets October 2. Rigtht-angled triangle October,
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech
Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech Kateřina Veselovská ÚFAL MFF UK veselovska@ufal.mff.cuni.cz
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Anglický jazyk
EEA and Norway Grants. Norské fondy a fondy EHP
EEA Scholarship Programme & Bilateral Scholarship Programme The programme offers various options for scholarship funding of international institutional cooperation projects and mobilities among the Czech
Co vím o Ázerbájdžánu?
Ministerstvo mládeže a sportu Ázerbájdžánské republiky Ministerstvo zahraničních věcí Ázerbájdžánské republiky Velvyslanectví Ázerbájdžánské republiky v Praze ve spolupráci s Centrem ázerbájdžánských a
CZ.1.07/1.5.00/
Projekt: Příjemce: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova 3, 371 60 České Budějovice
Gymnázium, Brno, Slovanské nám. 7 WORKBOOK. Mathematics. Teacher: Student:
WORKBOOK Subject: Teacher: Student: Mathematics.... School year:../ Conic section The conic sections are the nondegenerate curves generated by the intersections of a plane with one or two nappes of a cone.
The state of literature courses in undergraduate and graduate English language teacher training programmes across Slovakia
The state of in undergraduate and graduate English language teacher training programmes across Slovakia Dagmar Blight University Contents Language teacher training research Faculties providing EL teacher
SEZNAM PŘÍLOH. Příloha 1 Dotazník Tartu, Estonsko (anglická verze) Příloha 2 Dotazník Praha, ČR (česká verze)... 91
SEZNAM PŘÍLOH Příloha 1 Dotazník Tartu, Estonsko (anglická verze)... 90 Příloha 2 Dotazník Praha, ČR (česká verze)... 91 Příloha 3 Emailové dotazy, vedení fakult TÜ... 92 Příloha 4 Emailové dotazy na vedení
Bibliometric probes into the world of scientific publishing: Economics first
Bibliometric probes into the world of scientific publishing: Economics first Daniel Münich VŠE, Nov 7, 2017 Publication space Field coverage of WoS Source: Henk F. Moed, Citation Analysis in Research Evaluation,
Digitální učební materiál
Digitální učební materiál Projekt Šablona Tématická oblast DUM č. CZ.1.07/1.5.00/34.0415 Inovujeme, inovujeme III/2 Inovace a zkvalitnění výuky prostřednictvím ICT (DUM) Anglický jazyk pro obor podnikání
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Anglický jazyk
MEDIA RESEARCH RATINGS
READERS OF MF DNES MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie vydavatelů)
MEDIA RESEARCH RATINGS
READERS OF MF DNES MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie vydavatelů)
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Anglický jazyk
Výuka odborného předmětu z elektrotechniky na SPŠ Strojní a Elektrotechnické
Jihočeská univerzita v Českých Budějovicích Pedagogická fakulta Oddělení celoživotního vzdělávání Závěrečná práce Výuka odborného předmětu z elektrotechniky na SPŠ Strojní a Elektrotechnické Vypracoval:
Air Quality Improvement Plans 2019 update Analytical part. Ondřej Vlček, Jana Ďoubalová, Zdeňka Chromcová, Hana Škáchová
Air Quality Improvement Plans 2019 update Analytical part Ondřej Vlček, Jana Ďoubalová, Zdeňka Chromcová, Hana Škáchová vlcek@chmi.cz Task specification by MoE: What were the reasons of limit exceedances
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Anglický jazyk
CZ.1.07/1.5.00/
Projekt: Příjemce: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova 3, 371 60 České Budějovice
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Design and implementation of algorithms for adaptive control of stationary robots Marcel Vytečka 1, Karel Zídek 2 Abstrakt Článek
MEDIA RESEARCH RATINGS
READERS OF MF DNES MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie vydavatelů)
Střední odborná škola stavební a Střední odborné učiliště stavební Rybitví
Střední odborná škola stavební a Střední odborné učiliště stavební Rybitví Vzdělávací oblast: Vzdělávání a komunikace v cizím jazyce Název: Rozdíl v používání as/ like Autor: Mgr.Tompos Monika Datum, třída:
MEDIA RESEARCH RATINGS
READERS OF MF DNES MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie vydavatelů)
Research infrastructure in the rhythm of BLUES. More time and money for entrepreneurs
Research infrastructure in the rhythm of BLUES More time and money for entrepreneurs 1 I. What is it? II. How does it work? III. References Where to find out more? IV. What is it good for? 2 I. What is
STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace
Název školy STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace Číslo a název projektu: CZ.1.07/1.5.00/34.0880 Digitální učební materiály www.skolalipa.cz
Course description. Second Romance language 2 Printed: :05. Course name: Academic Year 2015/2016
Course description Course abbreviation: KRP/DRJ2 Page: 1 / 5 Course name: Second Romance language 2 Academic Year: 2015/2016 Printed: 15.01.2017 11:05 Department/Unit / KRP / DRJ2 Title Second Romance
Název školy STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace
Název školy STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace Číslo a název projektu: CZ.1.07/1.5.00/34.0880 Digitální učební materiály www.skolalipa.cz
Střední průmyslová škola stavební Pardubice
Střední průmyslová škola stavební Pardubice Vzdělávací oblast: Vzdělávání a komunikace v cizím jazyce Název: Slovesná vazba I am used to + ing a I get used to + ing. Autor: Svatoňová Zuzana Datum, třída:
. 1 st International School of Ostrava - mezinárodní gymnázium, s. r. o., Gregorova 2582/3, Ostrava. IZO: Forma vzdělávání: denní
. 1 st International School of Ostrava - mezinárodní gymnázium, s. r. o., Gregorova 2582/3, 702 00 Ostrava IZO: 150 077 009 Forma vzdělávání: denní Kritéria pro I. kolo přijímacího řízení pro školní rok
The Czech education system, school
The Czech education system, school Pracovní list Číslo projektu Číslo materiálu Autor Tematický celek CZ.1.07/1.5.00/34.0266 VY_32_INOVACE_ZeE_AJ_4OA,E,L_10 Mgr. Eva Zemanová Anglický jazyk využívání on-line
místo, kde se rodí nápady
místo, kde se rodí nápady a private european network of information centres on materials and innovative products. Created in 2001 in Paris, it provides members with a large selection of specific, reproducible
II_ _Listening Pracovní list č. 2.doc II_ _Listening Pracovní list č. 3.doc II_ _Listening Řešení 1,2.doc
Název školy: ZŠ Brno, Měšťanská 21, Brno -Tuřany Název práce: Listening Pořadové číslo: II_2-01-06 Předmět: Anglický jazyk Třída: 9. AC Téma hodiny: Problémy Vyučující: Mgr. Milena Polášková Cíl hodiny:
ŽÁDOST O UZNÁNÍ ZAHRANIČNÍHO VYSOKOŠKOLSKÉHO VZDĚLÁNÍ A KVALIFIKACE APPLICATION FOR THE RECOGNITION OF FOREIGN EDUCATION IN THE CZECH REPUBLIC
Otisk podacího razítka VŠE Vysoká škola ekonomická v Praze PRÁVNÍ ODDĚLENÍ nám. W. Churchilla 4 Praha 3 130 67 ŽÁDOST O UZNÁNÍ ZAHRANIČNÍHO VYSOKOŠKOLSKÉHO VZDĚLÁNÍ A KVALIFIKACE APPLICATION FOR THE RECOGNITION
Digitální učební materiál
Digitální učební materiál Projekt Šablona Tématická oblast DUM č. CZ.1.07/1.5.00/34.0415 Inovujeme, inovujeme III/2 Inovace a zkvalitnění výuky prostřednictvím ICT (DUM) Anglický jazyk pro obor podnikání
Zjistit, jak žáci zvládli učivo prvního pololetí. Pomůcky: Psací potřeby Zdroje: vlastní. III_2-05_54 Half term test, 6yr - řešení
Název školy: ZŠ Brno, Měšťanská 21, Brno-Tuřany Název práce: Half term test, 6yr Pořadové číslo: III_2-05_54 Předmět: Anglický jazyk Třída: 6. B Téma hodiny: Pololetní písemná práce Vyučující: Ing. Olga
MEDIA RESEARCH RATINGS
READERS OF MF DNES MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie vydavatelů)
Content Language level Page. Mind map Education All levels 2. Go for it. We use this expression to encourage someone to do something they want.
Study newsletter 2015, week 40 Content Language level Page Phrase of the week Go for it All levels 1 Mind map Education All levels 2 Czenglish Stressed vs. in stress Pre-intermediate (B1-) Advanced (C1)
EU peníze středním školám digitální učební materiál
EU peníze středním školám digitální učební materiál Číslo projektu: Číslo a název šablony klíčové aktivity: Tematická oblast, název DUMu: Autor: CZ.1.07/1.5.00/34.0515 III/2 Inovace a zkvalitnění výuky
CZ.1.07/1.5.00/
Projekt: Příjemce: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova 3, 371 60 České Budějovice
MEDIA RESEARCH RATINGS
READERS OF MF DNES MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie vydavatelů)
Britské společenství národů. Historie Spojeného království Velké Británie a Severního Irska ročník gymnázia (vyšší stupeň)
Název vzdělávacího materiálu: Číslo vzdělávacího materiálu: Autor vzdělávací materiálu: Období, ve kterém byl vzdělávací materiál vytvořen: Vzdělávací oblast: Vzdělávací obor: Vzdělávací předmět: Tematická
User manual SŘHV Online WEB interface for CUSTOMERS June 2017 version 14 VÍTKOVICE STEEL, a.s. vitkovicesteel.com
1/ 11 User manual SŘHV Online WEB interface for CUSTOMERS June 2017 version 14 2/ 11 Contents 1. MINIMUM SYSTEM REQUIREMENTS... 3 2. SŘHV ON-LINE WEB INTERFACE... 4 3. LOGGING INTO SŘHV... 4 4. CONTRACT
MEDIA RESEARCH RATINGS
READERS OF MF DNES MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie vydavatelů)
Dobrovolná bezdětnost v evropských zemích Estonsku, Polsku a ČR
MASARYKOVA UNIVERZITA V BRNĚ Fakulta sociálních studií Katedra sociologie Dobrovolná bezdětnost v evropských zemích Estonsku, Polsku a ČR Bakalářská diplomová práce Vypracovala: Kateřina Jurčová Vedoucí
Klepnutím lze upravit styl předlohy. nadpisů. nadpisů.
1/ 13 Klepnutím lze upravit styl předlohy Klepnutím lze upravit styl předlohy www.splab.cz Soft biometric traits in de identification process Hair Jiri Prinosil Jiri Mekyska Zdenek Smekal 2/ 13 Klepnutím
Zaměřen na rozvojové země Práce na rozvojových projektech, poznávání kultury, výuka angličtiny,
NA STÁŽ S AIESEC ROZVOJOVÉ STÁŽE Zaměřen na rozvojové země Práce na rozvojových projektech, poznávání kultury, výuka angličtiny, Podmínky: Znalost angličtiny na komunikativní úrovni Být studentem VŠ nebo
VYSOKÁ ŠKOLA HOTELOVÁ V PRAZE 8, SPOL.S R.O.
VYSOKÁ ŠKOLA HOTELOVÁ V PRAZE 8, SPOL.S R.O. Bc. Markéta Turicová Profesní příprava pracovníků pro obor hotelnictví Diplomová práce 2014 Profesní příprava pracovníků pro obor hotelnictví Diplomová práce
Život v zahraničí Studium
- Univerzita Rád/a bych se zapsal/a na vysoké škole. Uvést, že se chcete zapsat Rád/a bych se zapsal/a na. Uvést, že se chcete přihlásit na předmět bakalářské studium postgraduální studium doktorské studium
READERS OF MAGAZÍN DNES + TV
READERS OF MAGAZÍN + MEDIA RESEARCH RATINGS National media ratings research in the Czech Republic jointly requested by the publishers of dailies and magazines associated in the Publisher s Union (Unie
Risk management in the rhythm of BLUES. Více času a peněz pro podnikatele
Risk management in the rhythm of BLUES Více času a peněz pro podnikatele 1 I. What is it? II. How does it work? III. How to find out more? IV. What is it good for? 2 I. What is it? BLUES Brain Logistics
Mechanika Teplice, výrobní družstvo, závod Děčín TACHOGRAFY. Číslo Servisní Informace Mechanika: 5-2013
Mechanika Teplice, výrobní družstvo, závod Děčín TACHOGRAFY Servisní Informace Datum vydání: 20.2.2013 Určeno pro : AMS, registrované subj.pro montáž st.měř. Na základě SI VDO č./datum: Není Mechanika
Dynamic programming. Optimal binary search tree
The complexity of different algorithms varies: O(n), Ω(n ), Θ(n log (n)), Dynamic programming Optimal binary search tree Různé algoritmy mají různou složitost: O(n), Ω(n ), Θ(n log (n)), The complexity
Theme 6. Money Grammar: word order; questions
Theme 6 Money Grammar: word order; questions Čas potřebný k prostudování učiva lekce: 8 vyučujících hodin Čas potřebný k ověření učiva lekce: 45 minut KLÍNSKÝ P., MÜNCH O., CHROMÁ D., Ekonomika, EDUKO
BRNO KOMPLEXNÍ DOPRAVNÍ ANALÝZA
MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA GEOGRAFICKÝ ÚSTAV BRNO KOMPLEXNÍ DOPRAVNÍ ANALÝZA Diplomová práce Jan Kučera Vedoucí práce: Mgr. Daniel Seidenglanz, Ph.D. Brno 2013 Bibliografický záznam Autor:
Projekt: ŠKOLA RADOSTI, ŠKOLA KVALITY Registrační číslo projektu: CZ.1.07/1.4.00/21.3688 EU PENÍZE ŠKOLÁM
ZÁKLADNÍ ŠKOLA OLOMOUC příspěvková organizace MOZARTOVA 48, 779 00 OLOMOUC tel.: 585 427 142, 775 116 442; fax: 585 422 713 email: kundrum@centrum.cz; www.zs-mozartova.cz Projekt: ŠKOLA RADOSTI, ŠKOLA
Vliv metody vyšetřování tvaru brusného kotouče na výslednou přesnost obrobku
Vliv metody vyšetřování tvaru brusného kotouče na výslednou přesnost obrobku Aneta Milsimerová Fakulta strojní, Západočeská univerzita Plzeň, 306 14 Plzeň. Česká republika. E-mail: anetam@kto.zcu.cz Hlavním
AJ 3_16_Prague.notebook. December 20, 2013. 1.úvodní strana
1.úvodní strana 1 PRAGUE AJ 3 Konverzační témata DUM č. 16 oktáva osmiletého gymnázia Mgr. Jitka Freundová Gymnázium Sušice Tento materiál byl vytvořen v rámci projektu Gymnázium Sušice Brána vzdělávání
Digitální učební materiály www.skolalipa.cz
Název školy Číslo projektu Název projektu Klíčová aktivita Dostupné z: Označení materiálu: Typ materiálu: Předmět, ročník, obor: Tematická oblast: Téma: STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ,
Biotechnology in the Czech Republic where we are?
Biotechnology in the Czech Republic where we are? Martin Bunček Technology Agency of the Czech Republic České Budějovice 20th September 2016 great past sad present promising future * long tradition in
SPOLUPRÁCE - KOORDINÁTOR/KA ZAHRANIČNÍCH KURZŮ
Volná místa KOORDINÁTOR/KA JAZYKOVÉ VÝUKY A OBCHODU (Plzeň) Koordinátor/ka je pravá ruka naší manažerky pobočky, se kterou rád/a a ochotně spolupracuje a sdílí úspěchy. Je člověk, který: je systematický
PART 2 - SPECIAL WHOLESALE OFFER OF PLANTS SPRING 2016 NEWS MAY 2016 SUCCULENT SPECIAL WHOLESALE ASSORTMENT
PART 2 - SPECIAL WHOLESALE OFFER OF PLANTS SPRING 2016 NEWS MAY 2016 SUCCULENT SPECIAL WHOLESALE ASSORTMENT Dear Friends We will now be able to buy from us succulent plants at very good wholesale price.
1 st International School Ostrava-mezinárodní gymnázium, s.r.o. Gregorova 2582/3, 702 00 Ostrava. IZO: 150 077 009 Forma vzdělávání: denní
1 st International School Ostrava-mezinárodní gymnázium, s.r.o. Gregorova 2582/3, 702 00 Ostrava IZO: 150 077 009 Forma vzdělávání: denní Kritéria pro IV. kolo přijímacího řízení pro školní rok 2015/2016
Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT
Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM Číslo projektu: CZ.1.07/1.5.00/34.0536 Název projektu školy: Výuka s ICT na SŠ obchodní České Budějovice Šablona
Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT
Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM Číslo projektu: CZ.1.07/1.5.00/34.0536 Název projektu školy: Výuka s ICT na SŠ obchodní České Budějovice Šablona
Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115
Číslo projektu: Číslo šablony: Název materiálu: Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115 CZ.1.07/1.5.00/34.0410 II/2 Parts of a computer IT English Ročník: Identifikace materiálu: Jméno
The Over-Head Cam (OHC) Valve Train Computer Model
The Over-Head Cam (OHC) Valve Train Computer Model Radek Tichanek, David Fremut Robert Cihak Josef Bozek Research Center of Engine and Content Introduction Work Objectives Model Description Cam Design
Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT
Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM Číslo projektu: CZ.1.07/1.5.00/34.0536 Název projektu školy: Výuka s ICT na SŠ obchodní České Budějovice Šablona