Specializovaný korpus BANÁT a jeho využití

Podobné dokumenty
K slovosledu mluvené češtiny v rumunském Bígru

Specializované korpusy mluveného jazyka - jejich tvorba a využití

Kumulace předložek nejen v banátské češtině

Validita korpusu ORAL2013. Mgr. Jan Chromý, Ph.D.

2. Korpusový portál a volně dostupné nástroje

KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!

Obsah. Úvodní poznámka 11 Německý jazyk, spisovná řeč a nářečí 13 Pomůcky ke studiu němčiny 15

SADA VY_32_INOVACE_CJ1

Český jazyk a literatura - jazyková výchova

Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA

Aktuální členění výpovědi a slovosled

Depfix: Jak dělat strojový překlad lépe než Google Translate

VĚTNÉ ČLENY. Mgr. Jiří Ondra Procvičení základních pojmů a kategorií z oblasti české skladby. Zdokonalování jazykových vědomostí a dovedností

Korpusová lingvistika 2. Mgr. Dana Hlaváčková, Ph.D. CJBB105

Modul NE2-1. Osnova: Arbeitsbuch. Ismaning: Max Hueber, s. ISBN

ŽÁKOVSKÝ KORPUS MERLIN: JAZYKOVÉ ÚROVNĚ A TROJJAZYČNÁ CHYBOVÁ ANOTACE

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

Název materiálu: Jazykové rozbory

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

Základní škola ve Vamberku. Tematický plán učiva ČESKÝ JAZYK PRO 9. ROČNÍK. Václav Strážnický 2012/13

KAMARÁDI V OLOMOUCI. Beneš Petr Kotasová Hana Kubičný Lukáš Man Lukáš Petrůjová Tereza Vacková Kristýna Varga Jan Wzatková Kateřina Zedníková Karolína

Korpusová lingvistika a počítačová lexikografie. Od 60. let 20. st.

Anglický jazyk pro 6. ročník

Mgr. Petr Čadek, Mgr. Karel Šulc, Bc. Lukáš Javůrek, Hana Solarová

Vyučovací předmět ruský jazyk vychází ze vzdělávacího oboru Další cizí jazyk, který je součástí vzdělávací oblasti Jazyk a jazyková komunikace.

II. Nástroje a metody, kterými ověřujeme plnění cílů

Mgr. Jaroslava Kholová. Období tvorby Listopad- prosinec Střední vzdělání s MZ, nástavbové studium, 2. ročník. oblast

Školní vzdělávací program

FONETIKA A FONOLOGIE II.

učebnice, cvičebnice, CD-Rom, počítačová učebna, dataprojektor, interaktivní tabule, mapy anglicky mluvících zemí, slovník

obecná lingvistika LING Ústav obecné lingvistiky Filozofická fakulta Univerzity Karlovy

Český jazyk - Jazyková výchova

Workshop o paralelním korpusu InterCorp

Specifikace požadavků pro školní část přijímací zkoušky (anglický jazyk) Šestiletý obor vzdělávání

ZŠ ÚnO, Bratří Čapků 1332

Učebnice, cvičebnice, CD-Rom, počítačová učebna, dataprojektor, interaktivní tabule, mapy anglicky mluvících zemí

Dataprojektor, jazykové příručky, pracovní listy

Moravské gymnázium Brno s.r.o. Hana Blaudeová. Ročník 2. Datum tvorby Anotace. -prezentace určena pro učitele

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Volitelný španělský jazyk

Chytal tlouště na višni

Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Vyučovací předmět: Český jazyk a literatura Ročník: 6.

K parazitickým slovům v české slovní zásobě

Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/ Typy slovosledu z hlediska pořadí větných členů

RUSKÝ JAZYK ročník Charakteristika vyučovacího předmětu. Obsahové, časové a organizační vymezení

A2M31RAT- Řečové aplikace v telekomunikacích

Příloha č. 13 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

TEMATICKÝ PLÁN 6. ročník

Anotace žákovského korpusu. Alena Poncarová Žďárek, Listopad 2011

Si představ, by mě zajímalo, ti to ukážu: Jednoslabičné začátky syntaktických segmentů v mluvené češtině 1

Český jazyk a literatura

Učebnice, cvičebnice, CD-Rom, audio CD a DVD, počítačová učebna, dataprojektor, mapy anglicky mluvících zemí, slovník, interaktivní tabule

Vyučovací předmět Německý jazyk Týdenní hodinová dotace 3 hodiny Ročník

současný neformální mluvený jazyk (komunikace v rodině nebo mezi přáteli), včetně propojení přepisu se zvukem;

Učebnice, počítač, dataprojektor, interaktivní tabule, plány měst, mapy, smartphone, slovníky

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony

Přípravné kurzy k nové maturitě německý jazyk /vyšší úroveň/ Obsahem každé lekce bude nácvik:

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Multidimenzionální analýza češtiny. Pilotní studie

Mezipředmětové vztahy Jazyk a jazyková komunikace Cizí jazyk Anglický jazyk

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Metodická příručka Kurz Němčiny Blended Learning

Univerzita Palackého v Olomouci. Filozofická fakulta. Katedra bohemistiky. Slovosled a aktuální členění větné v učebnicích češtiny pro cizince

Věta jednoduchá v češtině

Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Předmět: ANGLICKÝ JAZYK Ročník: 9.

Předmět: ANGLICKÝ JAZYK Ročník: 6.

Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova

Anglický jazyk. 9. ročník. Poslech s porozuměním

Paralelní korpusy. 0/2 Z, zimní semestr 2006/2007. Alexandr Rosen

RVP ZV Kód. ŠVP Školní očekávané výstupy. ŠVP Učivo. RVP ZV Očekávané výstupy. Obsah RVP ZV

Předmět: Německý jazyk Beste Freunde 2 Ročník: 8.

TEMATICKÝ PLÁN. Literatura: Český jazyk - Z. Krausová, R. Teršová, Fraus 2012, pracovní sešit Český jazyk pro 6. ročník - V.

Předmět: Český jazyk a literatura

Olympiáda v českém jazyce 45. ročník, 2018/2019

Český jazyk ve 4. ročníku

Ročník: 5. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby

Volitelný český jazyk

STUDIJNÍ OPORA K DISCIPLÍNĚ KORPUSOVÁ LINGVISTIKA. Katedra českého jazyka a literatury Pedagogické fakulty Univerzity Palackého

Učivo RVP Učivo ŠVP Zařazení PT Integrace. fonetika. Základní poučení o výslovnosti, větné melodii, intonaci a slovním přízvuku. Pohyblivý přízvuk.

Učebnice, cvičebnice, CD-Rom, počítačová učebna, dataprojektor, interaktivní tabule, mapy anglicky mluvících zemí, slovník

Předmět - Český jazyk a literatura Ročník: 5. RVP - ZV Výstup Učivo Průřezová témata

6.1 I.stupeň. Vzdělávací oblast: Cizí jazyk Vyučovací předmět: ANGLICKÝ JAZYK. Charakteristika vyučovacího předmětu 1.

Systém českých hlásek

Juxtapozice z do v Arabštině

1 Substantiva. 2 Adjektiva. Obsah. Lekce Obsah Cvičení

Univerzita Karlova v Praze Filozofická fakulta. Bakalářská práce Karolína Vyskočilová

Téma 5 : Přijímací pohovor do zaměstnání.

Interference s mluvenými jazyky. Mgr. Lucie Štefková

ve strojovém překladu

NÁVRHY TEMATICKÝCH PLÁNŮ. 1. ročník Počet hodin

Psaní textů (PSATE) Úvodní seminář. Zpracování bibliografického údaje. Parafráze odborného textu.

Školní vzdělávací program Základní školy a mateřské školy Sdružení

WEBOVÉ KORPUSY ARANEA A VÍCEJAZYČNÉ KOLOKAČNÍ PROFILY

Český jazyk a literatura Mluvené projevy

Eva Lehečková 28. workshop Ţďárek Litoměřice

Univerzita Karlova v Praze. Filozofická fakulta. Ústav bohemistických studií. čeština pro cizince. Diplomová práce. Anastasia Tartakovskaya

Autor: Mgr. Lucie Baliharová. Téma: Spojovací výrazy v souvětí

Zápis z 8. řádného jednání Sekce SDRUK pro RF ze dne

Kurz č PhDr. Hana Peterková. Skladba. Souvětí podřadné Souvětí souřadné

Transkript:

Specializovaný korpus BANÁT a jeho využití Klára Dvořáková, Zuzana Komrsková a Karolína Vyskočilová klara.dvorakova@ujc.cas.cz zuzana.komrskova@ff.cuni.cz karolina.vyskocilova@ff.cuni.cz Korpusová lingvistika Praha 2016, 17. září 2016

Obsah příspěvku specializovaný korpus BANÁT uskutečněné studie případová studie - příklonky o příklonkách data problémy při anotaci a příklady výsledky

Specializovaný korpus BANÁT sběr 2011, 2014, 2015, 2016 folkloristická pravidla přepisu (ORAL), Transciber dnes přes 65 hodin materiálu (+ starší) 30 mluvčích BANÁT2016 320 644 pozic (cca 1/5 mluvčí z ČR) přepis a zvuková stopa oddělené promluvy banátských a českých mluvčí Vnitřní grant (2015-2016): Rozšíření a anotace korpusu banátské češtiny BANÁT

Studie srovnání se stavem v češtině na našem území dokumentovaným v předchozím výzkumu např. genitiv záporový a partitivní přívlastek shodný až za NP neurčitý člen - jeden před NP zesílený zápor nic a nikerak příklonky na 1. pozici

Případová studie - příklonky starší studie předsouvání příklonek na 1. pozici (Haiderová 2007: 90, Salzmann 1984:105, Viková 1994: 34) často zmiňované téma i ve srovnání s mluvenou češtinou první výzkum založený pouze na oanotovaných datech z BANÁTU z r. 2012 a ORALU 2006 a 2008 druhý ruční analýza na nových datech (BANÁT2014, ORAL2013)

O příklonkách 1 většinou jednoslabičné výrazy nenesou přízvuk kladou se obvykle za první přízvučný výraz výpovědi, tj. na druhou pozici stále nestálé stálé: spojka -li tvary slovesa být: jsem, je, bys, by zvratná zájmena se, si tvary zájmen: mě, mi, tě, ti, ho, mu, jí kondicionálové byl

O příklonkách 2 příklonka může následovat za: slovem Eva se dívá na televizi. frází Proud teplého vzduchu na okraji balkánské tlakové výše se dostává do střední Evropy. větou Kde Sokrates skutečně zemřel, se zřejmě nikdy nedovíme. větným člen rozvitým vedlejší větou přívlastkovou Cestující, který nemá platný cestovní doklad, se vystavuje nebezpečí, že bude pokutován. podřadicí spojkou či některou souřadicí spojkou Jana řekla, že se brzy vrátí. Už se Pavel rozhodl, nebo si to ještě rozmyslí? větným členem a vsuvce po něm následující Peněz to o něm bylo všeobecně známo si nevážil.

Data korpusy BANAT2016 (320 644 pozic) subkorpus jihozápadočeské a středočeské oblasti z ORAL2013 (1 031 197 pozic) tvary slov si, ti a ho 300 náhodných vzorků BANÁT2016 ORAL2013 ipm ipm si 3 376 10 528 8 826 8 558 ti 587 1 830 1 634 1 584 ho 902 2 813 1 720 1 667

Problémy pauzy A: kořala.. ta ti.. mrtví tělo.. B: mrtví? A: no to jako eee.. ti uspí von ti neudělá nic... ti neudělá nic nerozluštitelný kontext A: a ty už máš chuť eště na ňáký pivo? B: jo. --- si klidně.. jestli teda něco máme. více příklonek za sebou sem ti to řikala bych ti to dala homonymie

Příklady I. tak Olina tady vlasně to je štyry roky. co tady s tou. ségrou bydlely. si myslim. tak ňák.. nebo možná eště míň. (1) II. tak si dej čokoládku (2) III. řikala sem hele. eee. vejde se ti tam hodně věcí (2) IV. na těch zámkách vidíš jako.. ti ukazujou. jak jak to tady vypadalo (1) V. A: dědku zhasni to.. B: mmm mmm mmm A: sem ti to řikala... ať to ne.. nepoustíš (1) VI. právě on neodjel do Ameriky já si myslím že třeba ňák zmoudří. (2)

Výsledky si BANÁT ORAL vyřazeno 1 2 1. pozice 20 19 jiná pozice 279 279 p-value 1 ti BANÁT ORAL vyřazeno 6 10 1. pozice 8 12 jiná pozice 286 278 p-value 0.3722 ho BANÁT ORAL vyřazeno 12 1 1. pozice 13 6 pozice 275 293 p-value 0.1041

Diskuse mezi daty z ORALu a BANÁTU není rozdíl frekvence jevu není tak velká, jak by se mohlo na první pohled zdát do budoucna zpracovat větší vzorek zahrnout i psaný jazyk, zaměřit se zejména na psanou mluvenou češtinu (beletrie, emaily a chat apod.)

Děkujeme za pozornost. klara.dvorakova@ujc.cas.cz zuzana.komrskova@ff.cuni.cz karolina.vyskocilova@ff.cuni.cz Tento výstup vznikl v rámci projektu Mezilidská komunikace v interdisciplinární perspektivě podprojektu Rozšíření a anotace korpusu banátské češtiny BANÁT řešeného na Filozofické fakultě Univerzity Karlovy v Praze z prostředků Specifického vysokoškolského výzkumu na rok 2015.

Bibliografie Benešová, L. Křen, M. Waclawičová, M.: ORAL2013: reprezentativní korpus neformální mluvené češtiny. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: http://www.korpus.cz Vyskočilová, K: BANÁT2016: korpus mluvené banátské češtiny. Praha 2016. Dostupný z WWW: http://www.korpus.cz Haiderová, Karolina, 2007. Jazyk české menšiny v rumunském Banátu: obce Gerník a Svatá Helena. Olomouc. Diplomová práce, FF UPOL. Hoffmannová, J. - Richterová, O.: Si představ, by mě zajímalo, ti to ukážu: Jednoslabičné začátky syntaktických segmentů v mluvené češtině. In Časopis pro moderní filologii 97, 2015, č. 1, s. 9-20. Salzmann, Zdeněk, 1984. Some observations on the Czech spoken by the villagers of Ravensca in the Southern Romanin Banat. Melbourne Slavonic Studies. roč. 18, s. 65 118. Uhlířová, Ludmila: Knížka o slovosledu. Praha: Academia, 1987. Viková, Vilma, 1994. Bígerská čeština: nástin jazykové monografie české vesnice v Rumunsku. Praha. Diplomová práce, FF UK. Vyskočilová, Karolína: Syntaktická analýza projevů českých mluvčích v rumunském Banátu. Praha, bakalářská práce na FF UK, 2012. Vyskočilová, Karolína: Tvorba specializovaného korpusu banátské češtiny a jazyková analýza vybraných jevů. Praha, diplomová práce, FF UK, 2014. Vyskočilová, Karolína: Czech language minority in the South Western Romanian Banat. In: O. Garcia Otheguy (ed), Multilingualism and Minorities in the Czech Sociolinguistic Space. International Journal of the Sociology of Language. Berlin, Boston: De Gruyter Mouton, 2016, s. 145 167.