Pragmatický lematizátor českých slov

Rozměr: px
Začít zobrazení ze stránky:

Download "Pragmatický lematizátor českých slov"

Transkript

1

2 Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Katedra informačního a znalostního inženýrství Studijní program: Aplikovaná informatika Obor: Podniková informatika Pragmatický lematizátor českých slov DIPLOMOVÁ PRÁCE Student: Bc. Matěj Vacek Vedoucí: doc. RNDr. Petr Strossa, CSc. 2014

3 Prohlášení Prohlašuji, že jsem vypracoval samostatně diplomovou práci na téma Pragmatický lematizátor českých slov. Použitou literaturu a další podkladové materiály uvádím v přiloženém seznamu literatury. V Praze dne 31. listopadu podpis diplomanta

4 Poděkování Rád bych poděkoval doc. RNDr. Petru Strossovi, CSc. za vedení mé diplomové práce, cenné rady a odborný dohled. Děkuji také PhDr. Marii Rút Křížkové za odborné rady a pomoc při gramatické kontrole práce. V neposlední řadě děkuji své rodině, která mi byla oporou po celou dobu vytváření této práce.

5 Abstrakt Tato práce se zabývá lemmatizací podstatných a přídavných jmen na základě morfologie českého jazyka. Cílem práce je vytvořit lemmatizátor, který bude lemmatizovat slova s úspěšností alespoň 90%. Zároveň by měl být lemmatizátor co nejjednodušší, tj. měl by mít co nejméně pravidel. Lemmatizátor bude vytvářen pro oblast realitních inzerátů na prodej domů. V práci budou analyzovány specifika této oblasti a lemmatizátor bude přizpůsoben této oblasti, tak aby při lemmatizaci vytvářel co nejlepší výsledky. Lemmatizátor byl vytvořen v jazyce Java. Bylo použito velmi málo pravidel (pouze tři typy) a celkově byl lemmatizátor úspěšný v 96,4% případech. Klíčová slova: lemma, český jazyk, morfologie, realitní inzeráty

6 Abstract This thesis is focused on lemmatizing of nouns and adjectives. It is based on morphology of Czech language. The goal is to create a lemmatizer which can stem words with success rate 90% (at least). At the same time the lemmatizer should be very easy, it should consist as little rules as possible. Lemmatizer will be created to work with real estate adverts, especially houses for sale. In this thesis there will be made an analysis of specific characters of this area. Lemmatizer will be created according to results of this analysis. Lemmatizer was written in Java. Only three types of rules were used and generally the lemmatizer created correct stems in 96.4% of all words. Keywords: lemma, Czech language, morphology, real estate advert

7 Obsah Přehled použitých zkratek... 4 Seznam tabulek... 5 Seznam obrázků... 5 Úvod Zpracování dokumentu Intelektuální indexování Zdrojová data Lexikální analýza Stop-slova Lemmatizace Vážení termínů Tezaurus Charakteristika českého jazyka Typologická klasifikace jazyků Morfologická typologie Dělení a informační obsah slovních druhů Charakteristika slovních druhů Frekvence výskytu slovních druhů Homonymie Lexikální homonymie Morfologická homonymie Významná a nevýznamná slova Úplná a částečná homonyma Lemmatizace

8 3.1. Algoritmy Brute Force algoritmy Suffix stripping Lemmatizační algoritmy Stochastické algoritmy Analýza N-gramů Hybridní algoritmy Under-stemming a over-stemming Jednoprůchodový a rekurzivní lemmatizátor Vyhledávání informací Aplikační část Komponenty použité pro vývoj Java IntelliJ IDEA Open CSV knihovna Omezení a specifika vstupních textů Lemmatizace Omezení Parametry vstupního souboru Úprava vstupu Stop-slova Nepravidelná a dvoupísmenná slova Průběh lemmatizace Lemmatizace přídavných jmen Lemmatizace podstatných jmen

9 Lemmatizace ostatních slovních druhů Výstup Typ lemmatizátoru Výsledky a zhodnocení řešení Velikost výběrového souboru Počet pravidel, přípon a koncovek Úprava výstupního souboru Označení slovních druhů Označení korektních lemmat Způsob vyhodnocení korektních lemmat Korektní lemma pro substantiva a adjektiva Korektní lemma pro pronomia, numeralia a verba Korektní lemma pro adverbia Korektní lemma pro ostatní slovní druhy Zavlečená homonymie Velikost csv souborů Úspěšnost lemmatizátoru Zhodnocení výsledků Závěr Použitá literatura Příloha A

10 Přehled použitých zkratek JIT Just In Time JVM Java Virtual Machine API Application Programming Interface SE Standard Edition 4

11 Seznam tabulek Tabulka 1: Výskyt slovních druhů Tabulka 2: Výskyt slovních druhů s podstatnou informací Tabulka 3: Označení slovních druhů Tabulka 4: Výsledky lemmatizace Seznam obrázků Obrázek 1: Přehled slovních druhů

12 Úvod Vyhledávání informací je jedním z charakteristických rysů dnešní doby. V souvislosti s rozmachem internetu a se stále větší dostupností této technologie i na odlehlejších místech nabývá tato technologie stále většího významu. Nicméně pokud člověk hledá určitou informaci a chce využít např. fulltextový vyhledávač, musí formulovat dotaz, který bude následně vyhledávačem zpracován. Aby mohl vyhledávač porovnat zadaný dotaz a informace obsažené v databázi dokumentů, musí mít algoritmus, který převede slova v různých tvarech na určitý formalizovaný tvar. Následně na základě porovnání formalizovaných tvarů dotazu a takto upraveného dokumentu vrací vyhledávač určité výsledky. Cílem této diplomové práce je vytvořit lemmatizátor, tedy program, který bude upravovat slova na určitá lemmata, tedy formalizované tvary slov. Protože se jedná o velmi složitou a obsáhlou problematiku, bude lemmatizace omezena pouze na podstatná a přídavná jména. Vstupem pro lemmatizátor budou realitní inzeráty týkající se prodeje nemovitostí, konkrétně pak domů. Ty mají určité specifické vlastnosti. Velmi často jsou v nich používána přídavná jména, neboť inzerce realit je ze své podstaty popisná. Snaží se právě pomocí přídavných jmen co nejlépe představit čtenáři prodávanou nemovitost. Protože se jedná o texty určené pro běžnou část populace, nevyskytují se v textech složité nebo málo užívané gramatické konstrukce. Lemmatizátor by měl být co nejjednodušší, ideálně by měl pracovat především na principu odebírání přípon a koncovek. Ty budou specifikovány na základě morfologie českého jazyka. Lemmata vytvořená tímto způsobem mohou být i umělá, tj. že bude vytvořen neexistující tvar daného slova. Podstatné je, aby bylo stejné lemma vytvořeno pro všechny tvary daného slova a aby bylo dané lemma unikátní a nedocházelo k vytváření homonymie. Úspěšnost lemmatizátoru by vzhledem k nastaveným omezením měla být poměrně vysoká. Nekorektně by mělo být vytvořeno maximálně jedno lemma z deseti, úspěšnost lemmatizace by měla být minimálně 90%. V rámci této práce bude nejprve analyzován celý postup zpracování dokumentu, od indexování až po vážení termínů. V další kapitole bude provedena morfologická analýza českého 6

13 jazyka, především pak podstatných a přídavných jmen. Také je zapotřebí určit, které slovní druhy jsou z hlediska informační hodnoty podstatné. Ve třetí kapitole bude popsán proces lemmatizace včetně analýzy různých typů algoritmů, které jsou k lemmatizaci používány. Popis vytvořeného lemmatizátoru bude uveden ve čtvrté kapitole této práce. Stručně bude zmíněn programovací jazyk i prostředí použité pro vývoj lemmatizátoru. Detailně bude popsána konstrukce algoritmu, jeho omezení, samotný průběh lemmatizace i konkrétní pravidla pro lemmatizaci podstatných a přídavných jmen. V poslední kapitole budou vyhodnoceny výsledky lemmatizátoru. Popsány budou jak souhrnné výsledky, tak i informace o lemmatizaci jednotlivých slovních druhů. Také bude představen počet použitých pravidel a počet výjimečných slov uložených v externích souborech. 7

14 1. Zpracování dokumentu K tomu, aby bylo dosaženo výsledku v podobě indexovaného dokumentu, ve kterém je možné vyhledávat a porovnávat relevantnost vybraného dokumentu s jinými dokumenty, je nezbytné projít několika kroky. V jejich průběhu se nejprve dokument načte a rozdělí na jednotlivá slova. Poté se odstraní výrazy, které nejsou podstatné z informačního hlediska a nemá význam je uchovávat ani pro přesnější, ani pro úplnější výsledek vyhledávání. Následně se provede lemmatizace, která má za cíl převést slova vyskytující se v různých tvarech na jejich základní tvar. Po tomto kroku je k dispozici seznam relevantních slov a je zapotřebí provést výběr takových, která jsou klíčová a charakterizují daný dokument a jednotlivá slova seřadit dle jejich významnosti. Teprve v tento okamžik je dokument připraven k zařazení do katalogu, ve kterém uživatel může vyhledávat Intelektuální indexování Intelektuální indexování je možné definovat jako proces indexace realizovaný pomocí intelektuálních postupů ve všech jeho fázích, tj. při výběru relevantních výrazů z textu v přirozeném jazyce a přiřazování termínů řízeného slovníku. 1 Definice automatického indexování je pochopitelně odlišná, neboť se jedná o proces indexace realizovaný pomocí automatických postupů ve všech jeho fázích, tj. při výběru relevantních výrazů z textu v přirozeném jazyce a přiřazování termínů řízeného slovníku. 2 Automatické indexování se potýká s celou řadou problémů, které jsou uvedeny v této práci. Intelektuální indexování tyto problémy nemá a je považováno za kvalitnější. Jeho nevýhodou však je, že se do indexování promítají zkušenosti a znalosti člověka, který indexování provádí. Také se mohou objevit chyby způsobené špatným soustředěním nebo únavou. 3 Automatické indexování je však ve srovnání s intelektuálním indexováním principiálně rychlejší. To se projevuje i na nákladech spojených s touto činností, které jsou nižší než 1 BLAŽEK, Jakub. Srovnání automatické a intelektuální indexace. InFlow [online] [cit ]. Dostupné z: 2 KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online] [cit ]. Praha : Národní knihovna České republiky, Dostupné z: 3 BLAŽEK, Jakub. Srovnání automatické a intelektuální indexace. InFlow [online] [cit ]. Dostupné z: 8

15 u intelektuálního procesu. Navíc (z technických důvodů) umožňuje přiřazení mnohem většího počtu klíčových slov a tím pádem vytvoření rozsáhlejšího (širšího) selekčního obrazu. I přesto, že výsledky intelektuálního indexování jsou lepší, rozvoj automatického indexování neustále probíhá a jeho zlepšování zmenšuje rozdíly mezi kvalitou výsledku. Navíc vzhledem k množství textových dokumentů a časové náročnosti intelektuálního indexování není jiná možnost než využívat indexování automatické. V některých případech se využívá kombinované (hybridní) indexování, kdy pomocí automatického indexování vznikne návrh, který je potom člověkem upraven Zdrojová data Dokument, který se objeví na vstupu zpracování, může mít různou formu. Pro účely této práce budeme uvažovat pouze o dokumentech textových (nebudou tedy uvažovány dokumenty ani jeho části, které jsou zvukové, obrazové, audiovizuální a další, ani jejich převod do textové formy). Zdrojový text může mít různé formátování (nadpisy, zvýraznění textu ). Tyto informace by sice mohly usnadnit lemmatizaci a výběr klíčových slov, neboť lze předpokládat, že slova uvedená v nadpisu nebo jinak zvýrazněná v textu mají vyšší informační hodnotu, ale v rámci této práce nebude prováděna analýza formátování textu a na všechna slova tak bude pohlíženo stejně. Text ve vstupním dokumentu může být v různých jazycích, ať už přirozených nebo umělých. Jak vyplývá z ostatních kapitol, vstupní text bude omezen pouze na český jazyk ve spisovné formě Lexikální analýza Jednou z fází zpracování dokumentu je lexikální analýza. Ta identifikuje jednotlivá slova a sousloví v plném textu dokumentu. 4 Jedná se o velmi důležitou část zpracování dokumentů, neboť výsledky této analýzy mohou do velké míry ovlivnit celkový výsledek procesu. Již ve fázi lexikální analýzy se totiž identifikují slovní spojení, která mají ze své podstaty výrazně vyšší selektivní sílu než jednotlivá slova. 4 SCHWARZ, Josef. Současný stav a trendy automatické indexace dokumentů : přehledová studie [online]. Praha, Dostupný z: 9

16 K rozdělení textu na slova se nejčastěji používá mezera. Pokud se vyskytne více mezer za sebou, jsou obvykle ostatní mezery ignorovány. Dělení pomocí mezer však není dostačující. Jako další pomocné znaky při analýze slouží tečka, která označuje konec věty. (Dalšími znaky, které mohou označovat konec věty, jsou otazník a vykřičník.) Je však třeba zohlednit také zkratky, které v sobě obvykle mívají obsažené tečky, a přitom se o konec věty nejedná. V takovém případě mohou částečně pomoci velká písmena, která se vyskytují na začátku každé věty, ale nemusí se vyskytovat po každé zkratce. Tečku na konci věty však nemusí být nutné vždy správně rozpoznat. Pokud je využito pouze indexování jednotlivými slovy, pak jejich příslušnost k jednotlivým větám není pro indexování důležitá. Velká písmena mohou kromě začátku věty pomoci při analýze vlastních jmen a názvů. V českém jazyce existují podrobná pravidla, kdy se píše v názvu velké a kdy malé písmeno. Bližší informace o těchto podmínkách jsou v publikaci Pravidla českého pravopisu. 5 Dalšími znaky, které je nutné brát na zřetel, jsou pomlčka a spojovník (příp. rozdělovník). Pomlčka je obvykle z obou stran oddělena mezerou. Může být použita místo čárek a oddělovat od sebe různé části věty. Také se využívá při psaní intervalů. 6 Spojovník/rozdělovník spojuje dva výrazy a není oddělen mezerou (ani z jedné strany). Používá se např. k rozdělení slova, pokud přesahuje řádek, nebo ke spojení složených výrazů. Pokud se v textu vyskytne rozdělovník, který dělí slovo na dva různé řádky, měl by být odstraněn a rozdělené slovo spojeno v jedno. Pokud se spojovník objeví na konci řádku, musíme ho napsat i na začátek řádku následujícího. 7 Pomlčka a spojovník by měly být v textu odlišené (spojovník je kratší, pomlčka delší). Pokud to rozlišené není, jedná se o chybu textu a ten tak není v souladu s pravidly českého pravopisu, kde jsou jednotlivé znaky rozlišeny a definovány. 8 Speciálním problémem při lexikální analýze jsou číslice. Ty jsou sice nositelem významné informace (viz kapitola Dělení a informační obsah slovních druhů), nicméně samy o sobě mohou významně snížit přesnost vyhledávání. Například při výskytu určitého letopočtu je 5 Pravidla českého pravopisu. Vyd. 2. Praha: Academia, 2005, 391 s. ISBN X. 6 Nejčastější chyby a jak se jim vyhnout. TypografieNaPočítači [online] [cit ]. Dostupné z: 7 TAHOVSKÝ, Pavel. Spojovník a pomlčka Jak na to. KorekturaČeštiny.cz [online] [cit ]. Dostupné z: 8 Pravidla českého pravopisu. Vyd. 2. Praha: Academia, 2005, 391 s. ISBN X. 10

17 nutné tento letopočet spojit s událostí, ke které se váže, neboť jinak bude při výsledcích vyhledávání zobrazeno mnoho výsledků, které se sice váží k danému roku, ale ze zcela jiného důvodu. Při analýze číslic je tedy zapotřebí rozhodnout, zda bude dané číslo uchováno samostatně (stejně jako ostatní slova), nebo bude spojeno s jiným slovem. Poslední možností je číslo z analýzy úplně vypustit (čímž však může dojít ke ztrátě důležité informace, a proto je třeba tento krok dělat s potřebnou opatrností). 9 Samostatnou kapitolu by vyžadovala analýza sousloví. Ta mají sice značně vyšší selektivní sílu, nicméně jejich analýza (statistická, syntaktická, normalizace, pomocné slovní druhy) je složitá a přesahuje rámec této práce. 10 Navíc tato analýza není nezbytným krokem v rámci indexování. I bez identifikace slovních spojení lze dosáhnout kvalitních výsledků v procesu indexování Stop-slova V každém textu se vyskytují slova, která nejsou nositelem důležité informace (viz kapitola Dělení a informační obsah slovních druhů). Tato slova je vhodné z indexování vynechat a snížit tím tak šum, který při indexování vzniká. I přesto se však (z důvodu rychlosti a objemu dat) můžeme setkat s tím, že jeden z největších internetových vyhledávačů Google.com indexuje stránky celé včetně předložek, spojek a dalších nevýznamných slov. 11 Pokud chceme vybraná slova vynechat, musí existovat algoritmus nebo slovník, který je schopen daná slova určit. Jednou z možností je použití tzv. negativního slovníku. Ten obsahuje seznam slov, která nejsou nositelem informace a neměla by být indexována. Zde je však třeba dávat pozor na případnou homonymii některých slov (předložka při a třetí, čtvrtý a šestý pád slova pře, viz kapitola Homonymie). Další možností je využití analýzy textu a na základě určitých pravidel vybrat slova, která budou označena jako stop-slova a vyřazena. To může být provedeno na základě frekvenční analýzy, kdy slovo s velkou frekvencí výskytu je s určitou pravděpodobností právě stop-slovo. 9 SCHWARZ, Josef. Současný stav a trendy automatické indexace dokumentů: přehledová studie. Národní knihovna České republiky [online]. Praha, říjen 2002 [cit ]. Dostupné z: 10 SCHWARZ, Josef. Současný stav a trendy automatické indexace dokumentů: přehledová studie. Národní knihovna České republiky [online]. Praha, říjen 2002 [cit ]. Dostupné z: 11 Jak na bezproblémovou indexaci google 1. Cn130.com [online] [cit ]. Dostupné z: 11

18 Zde je však třeba eliminovat možnou chybu, kdy by bylo vyřazeno klíčové slovo, které se často vyskytuje a výstižně charakterizuje dokument. Další možností je analýza na základě délky slov. Extrémně krátká slova (složená např. ze dvou znaků) obvykle mohou být označena jako stop-slova. Při použití tohoto postupu by ale měl existovat slovník, ve kterém budou naopak slova, která jsou extrémně krátká, ale přesto jsou nositeli informace a měla by být ponechána pro další zpracování Lemmatizace Lemmatizace je proces, jehož výstupem je normalizovaná forma slova. Tato činnost je v rámci této práce velmi podstatná, a proto je jí věnována samostatná kapitola Lemmatizace Vážení termínů Poslední fází zpracování dokumentu je přiřazení váhy (významnosti) jednotlivým lemma, případně určení klíčových slov. Tento krok vychází z poznatku, že různá slova jsou schopna různou mírou charakterizovat obsah vybraného dokumentu (mají různou selektivní sílu). Selektivní síla slouží pro stanovení míry, do jaké jsou schopny indexační termíny efektivně vyhledávat dokumenty. Nízká hodnota znamená malou selektivní sílu, vysoká hodnota znamená vysokou selektivní sílu. 13 Selektivní sílu je možné vyjádřit pomocí vztahu: N vyjadřuje počet dokumentů v databázi, n(t) počet dokumentů, které jsou charakterizovány znakem t, w(t) selektivní sílu znaku t. 14 Je možné využít různá kritéria (nebo i jejich kombinaci) k určení váhy jednotlivých slov. Na základě poznatků o českém jazyce je možné preferovat určité slovní druhy jako slova s větší 12 SCHWARZ, Josef. Současný stav a trendy automatické indexace dokumentů: přehledová studie. Národní knihovna České republiky [online]. Praha, říjen 2002 [cit ]. Dostupné z: 13 KŠÁRA, Martin. Extrakce informací z lékařských textů [online]. Praha, 2008 [cit ]. Dostupné z: Diplomová práce. České vysoké učení technické, Fakulta elektrotechnická. Vedoucí práce Ing. Monika Žáková. 14 STROSSA, Petr. Zpracování informačních fondů. 2., přeprac. a rozš. vyd. Praha: Vysoká škola ekonomická, 2000, 175 s. ISBN

19 váhou. Podstatná a přídavná jména mají největší váhu, ostatní slovní druhy mají váhu buď menší, nebo jsou úplně vynechaná (viz kapitola Stop-slova). 15 Dalším kritériem je frekvence a místo výskytu vybraného termínu. Čím častěji se slovo v dokumentu vyskytuje, tím relevantnější a váženější by mělo být. Tato podmínka se samozřejmě netýká stop-slov (viz kapitola Stop-slova). Výskyt určitého slova v nadpisu, názvu nebo třeba v abstraktu dokumentu zvyšuje jeho váhu. Pro použití tohoto kritéria však musí být při analýze určena alespoň částečná struktura dokumentu, aby bylo možné rozeznat, co je název dokumentu, co je nadpis atd. Zajímavé je také zjistit, jak často se slovo objevuje v charakteristikách jiných dokumentů. Pokud je určitý termín často používaný, bude sice charakterizovat vybraný dokument, nicméně jeho selektivní síla bude nízká. Naopak slovo, které se u ostatních dokumentů nevyskytuje, bude mít vysokou selektivní sílu. Pokud je jeho hodnota extrémně vysoká, je nutné prozkoumat, zda se nejedná o velmi odborné nebo specifické slovo a zda by nebylo vhodnější nahradit ho jiným, obecnějším výrazem Tezaurus Pojem tezaurus označuje slovník (nebo slovní zásobu), které obsahují seznam synonym k hledanému výrazu. 17 Tezaurus může být řazen buď abecedně, nebo využívat tzv. hnízdového řazení. Tento způsob byl využit i ve slovníku Tezaurus jazyka českého (Klégr, Aleš), který je rozdělen na 885 kategorií (hnízd). Toto dělení dle významu usnadňuje nalezení pojmů, kterými lze určitý význam vyjádřit. Hledání je však nutné rozdělit na dvě části nejprve v rejstříku a až poté ve vlastním slovníku. 18 Obvykle se však nejedná pouze o seznam výrazů a jejich synonym. Nejvýznamnějším rozšířením z hlediska indexování je zachycení vztahů mezi výrazy. Díky tomu je možné při indexování nahrazovat nebo doplňovat určitá slova (např. se širším nebo naopak užším 15 KŠÁRA, Martin. Extrakce informací z lékařských textů [online]. Praha, 2008 [cit ]. Dostupné z: Diplomová práce. České vysoké učení technické, Fakulta elektrotechnická. Vedoucí práce Ing. Monika Žáková. 16 SCHWARZ, Josef. Současné trendy v selekčních jazycích. [online] [cit ]. Dostupné z: is.muni.cz/el/1421/jaro2007/vikma05/um/tsj1.ppt 17 Pojem tezaurus. ABZ slovník cizích slov [online] [cit ]. Dostupné z: 18 KLÉGR, Aleš. Tezaurus jazyka českého: slovník českých slov a frází souznačných, blízkých a příbuzných. Vyd. 1. Praha: NLN, Nakladatelství Lidové noviny, 2007, 1189 s. ISBN

20 významem). Stejně tak lze využít strukturu výrazů k lepšímu sestavení dotazu a k jeho upřesnění HELLEBRAND, David. Nalezení slovních kořenů v češtině. Brno, Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií, Ústav informačních systémů. Vedoucí práce Ing. Petr Chmelař. 14

21 2. Charakteristika českého jazyka Jestliže je cílem této práce vytvořit lemmatizátor, který bude určitým způsobem využívat gramatická pravidla českého jazyka, je nejprve nutné porozumět způsobu, jakým je jazyk používán. U každého jazyka jsou patrné rozdíly mezi ústní a písemnou formou. V rámci této diplomové práce se zaměřím pouze na jazyk psaný. Ten lze považovat za přesnější a úplnější formu používání jazyka. V mluvené podobě se totiž některé hlásky zaměňují za jiné (z důvodu snazší výslovnosti) a některé hlásky nebo i celé slabiky jsou buď úplně vynechávány, nebo v proudu slov zanikají. Zvukovými vlastnostmi jazyka, výslovností jednotlivých hlásek a jejich funkcí se podrobně zabývá vědní disciplína zvaná fonologie. 20 Jazyk (nejen český) se obvykle liší podle geografické oblasti, kde se používá. Na takto vzniklá nářečí pak nelze aplikovat všechna pravidla jako na spisovnou formu jazyka, protože se mohou měnit různé vlastnosti jazyka. V češtině se mohou měnit některé afixy, ale i celá slova Typologická klasifikace jazyků Obecně je možné dělit jazyky do různých skupin podle odlišných hledisek. Při dělení se využívá vlastností jazyka, které jsou pro něho charakteristické a které v daném jazyce převažují. Nelze však vyloučit výskyt prvků i z jiné skupiny jazyků (jsou však zastoupeny poměrně méně než prvky skupiny, do které je jazyk zařazen). Zařazení jazyka se také může měnit díky přirozenému vývoji, kdy se v konkrétním jazyku začíná objevovat stále více prvků jiné jazykové skupiny. Typologií, podle kterých lze klasifikovat jazyky, je více, např. fonologická (zabývá se přízvukem, slabikami) nebo syntaktická (předmětem zkoumání je slovosled), pro potřeby této diplomové práce je však nejpodstatnější typologie morfologická KARLÍK, Petr, Marek NEKULA a Jana PLESKALOVÁ. Encyklopedický slovník češtiny. Praha: Lidové noviny, 2002, 604 s. ISBN X. 21 ČERMÁK, František. Jazyk a jazykověda: přehled a slovníky. Vyd. 3., dopl. Praha: Karolinum, 2001, 340 s. Učební texty Univerzity Karlovy v Praze. ISBN

22 Morfologická typologie Dělení jazyků dle morfologické typologie je založeno na základních vlastnostech gramatické stavby. Podle toho, do které skupiny je jazyk zařazen, je následně zapotřebí zvolit vhodný způsob lemmatizace. Rozdělení je obvykle prováděno do těchto skupin: 22 syntetické o flexivní o introflexivní o aglutinační o polysyntetické analytické Analytické jazyky, nazývané též izolační (někdy je tato skupina ještě dále dělená na jazyky analytické a amorfní, což není z hlediska zaměření této práce podstatné), nepoužívají ve svém stavebním jazykovém systému předpony, přípony ani koncovky. Gramatika je tvořena především pomocnými slovy (např. předložkami) a pořadím slov ve větě. Důležitou roli hrají příslovce. Představiteli této jazykové skupiny jsou barmština, vietnamština a z určitého hlediska také angličtina. 23 Mezi polysyntetické jazyky patří čínština, turečtina nebo finština. Tyto jazyky jsou založené na složených slovech, která vznikají spojením různých plnovýznamových slov. Tuto charakteristiku lze vysledovat i u některých slov v českém jazyce (např. uměleckoprůmyslový). 24 Aglutinační jazyky využívají ve velké míře předpony a přípony spojené s kořenem jiného slova. V jednom slově se může vyskytovat i více afixů najednou. Na rozdíl od flexivních jazyků však jeden afix vyjadřuje obvykle pouze jeden gramatický tvar. Navíc každý gramatický tvar je vždy vyjádřen stejným afixem. Jazyky zařazené do této skupiny jsou korejština, japonština nebo maďarština. 25 Introflexivní jazyky jsou charakteristické změnou hlásek přímo v kořeni slova. Tento jev lze pozorovat v afroasijských jazycích, ale částečně se vyskytuje i v jazycích germánských (např. 22 ČERMÁK, František. Jazyk a jazykověda: přehled a slovníky. Vyd. 3., dopl. Praha: Karolinum, 2001, 340 s. Učební texty Univerzity Karlovy v Praze. ISBN ČERNÝ, Jiří. vod do studia jazyka. 1. vyd. Olomouc: Rubico, 1998, 248 s. ISBN ERHART, Adolf. vod do jazykovědy. Brno: Masarykova Univerzita, 2001, 200 s. 25 POKORNÝ, Jan a Juraj HANULIAK. Lingvistická antropologie: jazyk, mysl a kultura. 1. vyd. Praha: Grada, 2010, 346 s. ISBN

23 der Bruder bratr, die Brüder bratři) nebo v jazyce českém (druhý pád jednotného čísla od slova nůž je nože). 26 Flexivní jazyky se vyznačují bohatým využíváním afixů, skloňováním a časováním. Do této skupiny jazyků patří většina slovanských jazyků včetně češtiny, a je tak z hlediska této práce nejzajímavější. Na rozdíl od aglutinačních jazyků, kde jsou přípony ke slovu připojeny, mohou ve flexivních jazycích přípony se slovem splývat, což ztěžuje jejich následnou identifikaci. Pokud je zapotřebí vyjádřit více gramatických kategorií najednou, ve flexivních jazycích není pevně daný počet afixů, a tak se může vyskytnout pouze jeden afix vyjadřující několik gramatických kategorií (na rozdíl od aglutinačních jazyků, kde každou gramatickou kategorii představuje právě jeden afix). Zároveň s tím však flexivní jazyky mají i opačnou verzi tohoto pravidla, kdy je jedna gramatická kategorie vyjádřena různými afixy podle slova, ke kterému se váže (toto pravidlo je opět v kontrastu s aglutinačními jazyky). Poslední, avšak neméně důležitou vlastností flexivních jazyků je možná změna kořene slova podle gramatické kategorie Dělení a informační obsah slovních druhů Český jazyk obsahuje celkem deset slovních druhů. Zařazení slov ve větě do jednotlivých slovních druhů je podstatné pro určení toho, zda dané slovo může nést podstatnou informaci nebo ne. Při správném určení slovního druhu je také možné určit, co vše lze se slovem dělat (tj. zda se jedná o slovo ohebné nebo neohebné a zda je možné ho skloňovat, časovat nebo stupňovat). 26 POKORNÝ, Jan a Juraj HANULIAK. Lingvistická antropologie: jazyk, mysl a kultura. 1. vyd. Praha: Grada, 2010, 346 s. ISBN KARLÍK, Petr, Marek NEKULA a Jana PLESKALOVÁ. Encyklopedický slovník češtiny. Praha: Lidové noviny, 2002, 604 s. ISBN X. 17

24 Za slovní druhy, které mohou nést hlavní informaci, lze považovat prvních šest slovních druhů, tj. podstatná jména, přídavná jména, zájmena, číslovky, slovesa a příslovce. Zbylé čtyři druhy (předložky, spojky, částice a citoslovce) se nepovažují za nositele podstatné informace. Dělení na ohebné a neohebné slovní druhy odpovídá předchozímu dělení, neboť předložky, spojky, částice a citoslovce jsou neohebné, ostatní jsou ohebné. V rámci ohebných slovních druhů je ještě nutné odlišit slovesa, která lze časovat, příslovce, která lze stupňovat, ostatní slovní druhy je možné skloňovat. Přehled jednotlivých slovních druhů je uveden na obrázku Přehled slovních druhů. Slovní druhy Ohebné Neohebné Skloňované Časované Stupňované Předložky Podstatná jména Přídavná jména Slovesa Příslovce Spojky Zájmena Číslovky Částice Citoslovce Obrázek 1: Přehled slovních druhů Zdroj: Autor I přesto, že zájmena patří mezi nositele hlavní informace, obvykle není možné jejich potenciál využít. Odkazují totiž sice na určitý konkrétní termín, ale nepřímo, např. odkazem na jiné jméno. Pokud by měla být odhalena informace ukrytá v zájmenu, musela by být provedena analýza, na jaké jméno zájmeno odkazuje. Tato obtížná disciplína je však mimo rozsah této práce. 18

25 Charakteristika slovních druhů V rámci této práce bude probíhat pouze lemmatizace podstatných a přídavných jmen. Proto budou detailněji popsány tyto dva slovní druhy. Popis ostatních slovních druhů bude o něco stručnější. Tato podkapitola bude využita v praktické části této práce, kde budou jednotlivé vlastnosti slovních druhů aplikovány ve vytvořeném lemmatizátoru. Podstatná jména Podstatná jména označují činnosti a stavy a dále názvy zvířat, věcí a osob. Tyto názvy mohou být buď vlastní, nebo obecné. Obecná jména jsou taková, která nepopisují konkrétní osobu nebo věc, např. strom. Vlastní jména jsou taková, která označují konkrétní osobu (osobní jména), nebo popisují určité zvíře nebo určité místo (místní, zeměpisná jména). Většina podstatných jmen je odvozených. Odvození probíhá za pomoci předpon a přípon, skládáním slov, nebo naopak jejich zkracováním. 28 Podstatná jména se dělí na životná (označují osoby a zvířata) a neživotná. Mluvnicky se však tento rozdíl projevuje pouze u substantiv mužského rodu. V některých případech mohou mít neživá podstatná jména v mužském rodě (především v prvním pádě množného čísla) tvar životný i neživotný (např. koníčci a koníčky). 29 Každé podstatné jméno patří do jednoho ze tří rodů, a to buď mužského, ženského nebo středního. Pokud se jedná o osoby nebo zvířata, obvykle je mluvnický rod shodný s rodem přirozeným. Středním rodem je pak možné označovat oba přirozené rody (např. kuře, dítě). U věcí se rod řídí zpravidla zakončením podstatného jména. 30 Substantiva mají obvykle jednotné a množné číslo. Některá z nich mají pouze číslo jednotné. Mezi ně patří podstatná jména popisující vlastnosti a děje (např. mladost, píle), podstatná jména hromadná (např. kamení, listí, obyvatelstvo) a podstatná jména látková (např. krev, mouka). V českém jazyce se vyskytují i substantiva, která mají pouze tvary množného čísla, tzv. pomnožná (např. dveře, ústa) HAVRÁNEK, Bohuslav a Alois JEDLIČKA. Česká mluvnice. Praha: Státní pedagogické nakladatelství, 1960, 561 s. 29 KOMÁREK, Miroslav, Jan KOŘENSKÝ a Jan PETR. Mluvnice češtiny 2: Tvarosloví. Praha: Academia, 1986, 536 s. 30 tamtéž 31 HAVRÁNEK, Bohuslav a Alois JEDLIČKA. Česká mluvnice. Praha: Státní pedagogické nakladatelství, 1960, 561 s. 19

26 Skloňování podstatných jmen se vyjadřuje pomocí různých pádů. Český jazyk jich má sedm. Skloňování se dělí podle rodu daného slova a následně podle prvního pádu jednotného čísla, příp. druhého pádu jednotného čísla (pokud první pád jednotného čísla nemá koncovku). Mužský rod obsahuje vzory pán, hrad, muž, stroj, předseda a soudce, ženský rod žena, růže, píseň a kost a střední rod město, moře, kuře a stavení. Některé z těchto vzorů mají ještě podvzory, která se využívají pouze v některých pádech určitých slov (např. podvzor les vzoru hrad, podvzor sluha vzoru předseda). 32 Přídavná jména Přídavná jména jsou slova, která upřesňují význam podstatných jmen nebo popisují jejich vlastnosti. Většina přídavných jmen je vytvořena odvozením od jiných slovních druhů, v menšině pak stojí adjektiva neodvozená. V případě odvozených slov se obvykle k základu původního slova připojují přípony, méně často předpony. V nízkém zastoupení lze také nalézt přídavná jména vytvořená skládáním. Odvozená přídavná jména mohou vzniknout vytvořením slova od základu podstatného jména (bolest bolestný), slovesa (léčit léčivý) nebo i od jiného přídavného jména (veliký velikánský). Neodvozená přídavná jména nejčastěji vyjadřují vlastnost popisovaného slova v užším smyslu (tvrdý, zlý). 33 Adjektiva je možné dělit ještě jiným, pro lemmatizaci vhodnějším způsobem. Podle morfologické stavby lze rozlišit dlouhé a krátké tvary přídavných jmen. Mezi adjektiva s dlouhými tvary patří přídavná jména tvrdého podtypu A (skloňují se podle vzoru mladý) a měkkého podtypu B (podle vzoru jarní). Krátké tvary jsou typické pro přídavná jména jmenná a individuálně přivlastňovací (skloňují se podle vzorů otcův a matčin). Skloňování jednotlivých typů adjektiv je popsané především pomocí přípon a koncovek. Jejich detailní popis je možné najít v knihách specializovaných na morfologii českého jazyka. Mezi nejčastější přípony přídavných jmen patří ní (jarní), ný (smutný), ský a cký (elektrický), ový (kachlový), ecí (zvířecí) nebo pouze í (psí) KOMÁREK, Miroslav, Jan KOŘENSKÝ a Jan PETR. Mluvnice češtiny 2: Tvarosloví. Praha: Academia, 1986, 536 s. 33 HAVRÁNEK, Bohuslav a Alois JEDLIČKA. Česká mluvnice. Praha: Státní pedagogické nakladatelství, 1960, 561 s. 34 KOMÁREK, Miroslav, Jan KOŘENSKÝ a Jan PETR. Mluvnice češtiny 2: Tvarosloví. Praha: Academia, 1986, 536 s. 20

27 Charakteristickou vlastností přídavných jmen je stupňování. K němu dochází pouze u adjektiv podtypu A a B. Zájmena Název tohoto slovního druhu je odvozen od skutečnosti, že tento slovní druh se využívá za jména (= místo jmen). Z toho je patrné, že se jedná o slova, která se používají jako zastupující výrazy za příslušná podstatná a přídavná jména. Zájmena vyjadřují vztah mluvčího k určité nebo neurčité osobě, vlastnosti nebo věci. Svými tvary specifikují pád a číslo, některá i mluvnický rod. 35 Zájmena se dělí na sedm základních skupin, a to zájmena osobní (a zvratná), přivlastňovací, ukazovací, tázací, vztažná, neurčitá a záporná. Podle tvaru je možné určit pád a číslo, až na výjimky, jako jsou zájmena kdo, co nebo každý, která mají význam a tvar pouze jednotného čísla. Další výjimkou je zvratné zájmeno sebe, jehož tvary jsou ve všech pádech i v obou číslech stejné. Některá zájmena specifikují i rod podstatného jména, na které odkazují. Nazývají se rodová a u mužského rodu vyjadřují i životnost a neživotnost (např. ti, ty, ten, ta, to ). Skloňování těchto zájmen může být buď zájmenné (vzory ten a náš), nebo se řídí podle skloňování přídavných jmen (podle vzorů mladý a jarní). Zájmena bezrodá mají vlastní způsob skloňování. 36 Číslovky Číslovky mají již ze svého názvu povahu číselného slova. Označují pořadí, počet apod. Podle jejich významu se dělí na základní, řadové, druhové, násobné a neurčité. 37 Morfologie číslovek je velmi různorodá, neboť vychází z podstatných jmen, z přídavných jmen i z příslovcí. Minoritní část číslovek navíc přejímá určité morfologické vlastnosti zájmen. Navíc jsou jednotlivé gramatické prostředky (pád, číslo, rod a životnost) mezi číslovkami zastoupeny nerovnoměrně. U některých z nich některá kategorie zcela chybí (častěji číslo a životnost, řidčeji rod), nebo kategorie je zastoupena, ale nevýrazně. Číslovky jsou většinou 35 HAVRÁNEK, Bohuslav a Alois JEDLIČKA. Česká mluvnice. Praha: Státní pedagogické nakladatelství, 1960, 561 s. 36 tamtéž 37 tamtéž 21

28 slova sklonná (i když někdy neúplně), nicméně pokud jsou plně odvozena od příslovcí, řadí se mezi slova nesklonná. 38 Aby měly číslovky pro příjemce informace vypovídající hodnotu, je nezbytné jejich spojení s jiným slovním druhem, jehož počet nebo pořadí vyjadřují. Slovesa Slovesa jsou slova, která nesou informaci o ději, který je přisuzován podmětu v dané větě. Popisují buď činnost podmětu (běžím), jeho stav (žiji), změnu jeho stavu (stárnu), nebo děj obecně bez vztahu k podmětu (sněží). Méně často se mohou slovesa vázat také k předmětu. 39 Dělení sloves je poměrně obsáhlé vzhledem k velkému množství různých typů. Protože cílem této práce není vytvoření lemmatizátoru pro slovesa, bude jejich popis pouze povrchní. U sloves se rozeznávají následující kategorie: osoba, číslo, čas, slovesný způsob, slovesný rod a vid. Některé kategorie (např. slovesný rod) nemusí být rozlišený u všech sloves. Dalším způsobem dělení sloves je vyjádření pomocí jednoduchého nebo složeného tvaru. Pro lemmatizaci je velmi významným dělícím kritériem významovost. Slovesa se podle toho dělí na plnovýznamová, pomocná a sponová. Dle vidu se tento slovní druh dělí na slova dokonavá a nedokonavá, podle slovesného rodu na činná a trpná. 40 Příslovce Prvním zmíněným slovním druhem, který není ohebný, jsou příslovce. Jejich funkcí je přibližování různých okolností nebo označování míry předmětu. Tento slovní druh se dělí na příslovce času, způsobu, míry, místa a příčiny. 41 Pokud se ve větě vyskytují jako přívlastek, jsou svázány s podstatným jménem. Pokud jsou to příslovečná určení, jsou spojena s jinými příslovci, přídavnými jmény nebo se slovesy. 38 KOMÁREK, Miroslav, Jan KOŘENSKÝ a Jan PETR. Mluvnice češtiny 2: Tvarosloví. Praha: Academia, 1986, 536 s. 39 HAVRÁNEK, Bohuslav a Alois JEDLIČKA. Česká mluvnice. Praha: Státní pedagogické nakladatelství, 1960, 561 s. 40 tamtéž 41 KOMÁREK, Miroslav, Jan KOŘENSKÝ a Jan PETR. Mluvnice češtiny 2: Tvarosloví. Praha: Academia, 1986, 536 s. 22

29 Většina příslovcí je odvozena od přídavných jmen, a to pomocí přípony ě (nebo e), méně často pak příponami y nebo o. 42 Předložky Předložky jsou slova, která (stejně jako příslovce) určují okolnosti, jako jsou např. místo nebo čas. Dělí se na předložky vlastní a nevlastní. Rozdíl mezi nimi spočívá v tom, že vlastní předložky mají pouze význam předložek (např. v, pro, do), zatímco nevlastní předložky mohou mít i význam jiného slovního druhu, obvykle příslovce nebo podstatného jména (např. kolem, místo). Předložky se dále dělí na neslabičné (v, s, k) a slabičné (nad, pod, do). 43 Každá předložka, bez ohledu na předchozí dělení, se pojí s určitým pádem, a to buď s jedním, nebo s několika. 44 Spojky Spojky spojují jednotlivé věty nebo větné členy v jeden celek a zároveň vyjadřují poměr mezi těmito členy (větami). Samy o sobě však nejsou větnými členy. Pokud je poměr mezi větami spojenými spojkou souřadný, jedná se o spojky souřadicí, pokud se jedná o poměr řídící (s podřadným připojením), nazývají se spojky podřadicí. 45 Zmíněné dělení je podstatné i z hlediska psaní čárek před spojkami, nicméně při lemmatizaci jsou interpunkční znaky nahrazovány. Z hlediska cíle této práce se tedy nejedná o významné informace. Částice Částice jsou také neohebným slovním druhem, který se využívá k uvozování samostatné věty. U použité věty (případně i větného členu) vyjadřují odstín nebo citové zabarvení, nebo mohou určovat charakter věty (např. zvolání, rozkaz). Samy o sobě nejsou větnými členy KOMÁREK, Miroslav, Jan KOŘENSKÝ a Jan PETR. Mluvnice češtiny 2: Tvarosloví. Praha: Academia, 1986, 536 s. 43 HAVRÁNEK, Bohuslav a Alois JEDLIČKA. Česká mluvnice. Praha: Státní pedagogické nakladatelství, 1960, 561 s. 44 tamtéž 45 tamtéž 46 tamtéž 23

30 Citoslovce Citoslovce jsou posledním popisovaným slovním druhem. Vyjadřují city a nálady mluvčího a označují hlasy a zvuky. Jejich výskyt v realitních inzerátech je vzhledem k jejich charakteru naprosto ojedinělý Frekvence výskytu slovních druhů V textu se slovní druhy vyskytují v různé frekvenci. Pro český jazyk existuje několik frekvenčních slovníků, které se zabývaly frekvencí výskytu jednotlivých slov v textu (ČERMÁK, František a kol.: Frekvenční slovník češtiny; Jelínek, Jaroslav, Josef V. Bečka a Marie Těšitelová: Frekvence slov, slovních druhů a tvarů v českém jazyce). Pro lemmatizaci není až tak významný výskyt jednotlivých slov. Zajímavějším ukazatelem je výskyt jednotlivých slovních druhů. Ten je uveden v následující tabulce Výskyt slovních druhů. Pořadí Slovní druh Frekvence výskytu 1. Podstatná jména 27,77 % 2. Slovesa 18,15 % 3. Přídavná jména 11,16 % 4. Zájmena 10,91 % 5. Příslovce 10,29 % 6. Předložky 10,12 % 7. Spojky 9,78 % 8. Číslovky 1,61 % 9. Citoslovce 0,21 % Tabulka 1: Výskyt slovních druhů Zdroj: Jelínek, Jaroslav, Josef V. Bečka a Marie Těšitelová: Frekvence slov, slovních druhů a tvarů v českém jazyce Z uvedené tabulky je zřejmé, že pro lemmatizaci jsou nejpodstatnější podstatná jména, následovaná slovesy a přídavnými jmény. Pokud by se úspěšně vyřadily slovní druhy, které nenesou podstatnou informaci (viz kapitola Dělení a informační obsah slovních druhů) a byla by přepočtena frekvence výskytu zbylých slovních druhů, vznikne následující tabulka 24

31 Pořadí Slovní druh Frekvence výskytu 1. Podstatná jména 34,76 % 2. Slovesa 22,72 % 3. Přídavná jména 13,97 % 4. Zájmena 13,66 % 5. Příslovce 12,88 % 6. Číslovky 2,01 % Tabulka 2: Výskyt slovních druhů s podstatnou informací Zdroj: Autor Z této tabulky vyplývá, že podstatná a přídavná jména společně tvoří téměř polovinu všech slov (48,73%) a jsou pro lemmatizaci velmi významná. Frekvence výskytu sloves je sice také vysoká (dokonce vyšší než přídavných jmen), nicméně pro lemmatizaci jsou zajímavá pouze slovesa plnovýznamová, která netvoří většinu z uvedeného procenta výskytu Homonymie Při vytváření lemmatizátoru českého jazyka je zapotřebí zohlednit tzv. homonymii, tj. jev, který se v českém jazyce vyskytuje a bohužel tím lemmatizaci komplikuje. Homonymii je možné definovat jako jev, kdy jedna jazyková forma (např. lexém, morfém) je nositelkou dvou nebo více jazykových funkcí (významů). 48 Praktickým příkladem jsou slova jako los (zvíře nebo loterijní tiket), vlna (na vodní hladině nebo zvířecí srst) nebo kolej (vlaková nebo studentská ubytovna). Víceznačnost se nemusí omezovat pouze na jednotlivá slova, ale může být obsažena i v delších výrazech. Homonymie (obvykle více jejích výskytů najednou) může způsobit, že správný význam slov (nebo i celých vět) lze určit jen na základě analýzy širšího kontextu nebo i na základě předpokladu vzhledem k obsahu okolních vět. Pak je ale nutné počítat i s určitou mírou chybovosti. 47 JELÍNEK, Jaroslav, Josef BEČKA a Marie TĚŠITELOVÁ. Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha: Státní pedagogické nakladatelství, ISBN Diblík, Ondřej a Simona Kukučová Homonymie. Encyklopedie lingvistiky, ed. Kateřina Prokopová. Olomouc: Univerzita Palackého v Olomouci. 25

32 Lexikální homonymie Lexikální homonymii chápeme jako běžný jev lexikálního systému každého národního jazyka. Vyznačuje se identitou psané a mluvené (zvukové) podoby dvou nebo více slov. 49 Obvykle jsou tato homonymní slova v jiném než základním tvaru (např. tancích od slova tank nebo od slova tanec), ale mohou se vyskytovat i v prvním pádě. Příkladem je již zmíněný los. Tento případ je pro lemmatizaci obtížnější, protože je nutné rozhodnout, které tvary se budou generovat (zda bude druhý pád jednotného čísla losa zvíře nebo losu tiket). Je také možné vygenerovat všechny tvary, což však může mít negativní vliv na přesnost vyhledávání Morfologická homonymie Morfologická homonymie je jakákoli totožnost formy ( ) v rámci jednoho, popř. dvou i více tvarových systémů. 51 V praxi se tak může jednat například o problematiku spojenou s koncovkami a skloňováním, kdy jedna koncovka je pro dané slovo platná ve více pádech. Např. slovo žena má stejný tvar v prvním, čtvrtém a pátém pádě množného čísla (ženy). Tento problém je možný alespoň částečně řešit syntaktickou analýzou věty, tedy takovým rozborem, aby byla věta bez gramatických chyb. Tento způsob však nemusí být vždy úspěšný, neboť v některých větách může existovat více korektních interpretací. Např. ve větě Auto míjí autobus. jsou slova auto a autobus v prvním nebo čtvrtém pádě a není možné určit, která interpretace je správná. Podmětem totiž může být auto (a předmětem autobus) i autobus (a předmětem auto) Významná a nevýznamná slova Zajímavým problémem je homonymie, kdy slovo může, ale nemusí nést podstatnou informaci (viz kapitola Dělení a informační obsah slovních druhů). Příkladem takového slova je slovo při. Pokud se jedná o předložku, pak toto slovo nenese hlavní informaci a mělo by být vyřazeno z indexování (zařazeno do seznamu stop-slov, viz kapitola Stop-slova). Může se však jednat i o šestý pád jednotného čísla slova pře. Toto slovo by určitě nemělo být vyřazeno, neboť 49 KARLÍK, Petr, Marek NEKULA a Jana PLESKALOVÁ. Encyklopedický slovník češtiny. Praha: Lidové noviny, 2002, 604 s. ISBN X. 50 STROSSA, Petr. Válka s homonymií. ComputerWorld [online] [cit ]. Dostupné z: 51 TĚŠITELOVÁ, Marie. O morfologické homonymii v češtině. Praha: Academia, 1966, 94 s. ISBN STROSSA, Petr. Válka s homonymií. ComputerWorld [online] [cit ]. Dostupné z: 26

33 je nositelem důležité informace. Rozlišení mezi tím, kdy slovo vyřadit a kdy ne, je však poměrně obtížné. Některé indexační algoritmy dokonce ponechávají všechna rozhodnutí tohoto typu na člověku (indexování tedy není plně automatické a vyžaduje vstup od uživatele) Úplná a částečná homonyma Homonyma je možné dělit na úplná a částečná. Rozdíl mezi nimi spočívá v tom, zda jsou všechny tvary vybraných slov stejné, nebo se z nějakého důvodu odlišují. Slovo vlna (na hladině i zvířecí) má bez ohledu na vybraný význam všechny tvary stejné. Naopak již zmíněný los (zvíře a tiket) má některé tvary různé, protože slovo samotné se liší v životnosti. Tento rozdíl má vliv na komplikovanost indexování a případně i na přesnost vyhledávání STROSSA, Petr. Válka s homonymií. ComputerWorld [online] [cit ]. Dostupné z: 54 Diblík, Ondřej a Simona Kukučová Homonymie. Encyklopedie lingvistiky, ed. Kateřina Prokopová. Olomouc: Univerzita Palackého v Olomouci. 27

34 3. Lemmatizace Lemmatizace je proces, jehož výsledkem by mělo být nalezení normalizované formy slova. 55 Pojem lemmatizace je často zaměňován s termínem stemming. Tyto pojmy sice mají společný základ, ale přesto výstupy těchto procesů mohou být různé. Výsledkem lemmatizace je tzv. lemma, tedy normalizovaná forma daného slova. Ta může, ale nemusí odpovídat kmenu nebo kořenu slova. V rámci zjednodušení této diplomové práce se dokonce může jednat i o tvar slova, který v přirozeném jazyce neexistuje. Výsledkem stemmingu je nalezení stemu, tedy kmenu slova. Tato metoda je používána např. u anglických textů, které jsou z velké části založeny na předponách a příponách, po jejichž odstranění je výsledkem kmen daného slova Algoritmy Při provádění lemmatizace jsou používány algoritmy, které jsou založeny na různých principech. Lemmatizace tak probíhá na základě porovnávání se slovníkem, odstraněním přípon, na základě lemmatizačních algoritmů, stochastických algoritmů nebo kombinací některých z nich Brute Force algoritmy Tento typ algoritmů je založený na využívání slovníku. V překladu by se mohl nazývat algoritmus využívající hrubou sílu. Princip spočívá v obrovské tabulce, kde jsou uvedeny všechny stemy (nebo lemma) a všechny jejich možné tvary. Převedení na správný stem (nebo lemma) pak probíhá přes nalezení slova v tabulce a nahrazením odpovídajícím výrazem v druhém sloupci tabulky HELLEBRAND, David. Nalezení slovních kořenů v češtině. Brno, Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií, Ústav informačních systémů. Vedoucí práce Ing. Petr Chmelař. 56 KARÁSEK, Jan, Pavel ŠANDA, Radim BURGET a Ondřej MORSKÝ. Strojové učení základem pro hybridní lemmatizační algoritmus. Elektro revue [online]. 2012, roč. 2012, 14/5, 10 s. [cit ]. Dostupné z: 28

35 Nevýhodou tohoto algoritmu je velikost slovníku. Je prakticky nemožné vytvořit databázi všech slov a všech jejich tvarů pro určitý jazyk. Kromě problémů s velikostí a výkonem tento princip naráží také na přirozený vývoj jazyka. Slovník by tak musel být neustále aktualizován Suffix stripping Tento typ algoritmu je založen na úplně jiném principu než Brute Force algoritmy. Jejich podstata spočívá v identifikaci přípon, které jsou následně odebrány, a tím se docílí základního tvaru slova. Tato metoda bude použita v praktické části této práce. 58 Problémem této metody mohou být neuspokojivé výsledky v případě nepravidelností nebo změn v kořeni slova. Mezi představitele tohoto typu algoritmů patří Lovinsův nebo Porterův algoritmus Lemmatizační algoritmy Lemmatizační algoritmy jsou (obecně vzato) založeny na předpokladu, že čím více informací je možné zjistit o daném slově ještě před jeho úpravou, tím lepšího výsledku lze dosáhnout. Proto se nejprve snaží určit slovní druh a teprve poté se na slovo aplikují různé algoritmy. Tyto algoritmy mohou být specifické právě pro vybraný slovní druh, ale bývají často podobné jako pravidla v Suffix stripping algoritmech (viz kapitola Suffix stripping) Stochastické algoritmy Stochastické algoritmy jsou postaveny na principu učení se. Obsahují testovací množinu, do které vloží zpracovávané slovo, a na základě určitých pravidel uvnitř této množiny je vrácen kořen slova. Vedle tabulky slov v testovací množině obsahují ještě pravděpodobnostní tabulku, 57 KARÁSEK, Jan, Pavel ŠANDA, Radim BURGET a Ondřej MORSKÝ. Strojové učení základem pro hybridní lemmatizační algoritmus. Elektro revue [online]. 2012, roč. 2012, 14/5, 10 s. [cit ]. Dostupné z: 58 ŠANDA, Pavel. Určení základního tvaru slova. Brno, Dostupné z: Diplomová práce. Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, Ústav telekomunikací. Vedoucí práce Ing. Jan Karásek. 59 tamtéž 60 HELLEBRAND, David. Nalezení slovních kořenů v češtině. Brno, Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií, Ústav informačních systémů. Vedoucí práce Ing. Petr Chmelař. 29

Dataprojektor, kodifikační příručky

Dataprojektor, kodifikační příručky Předmět: Náplň: Třída: Počet hodin: Pomůcky: Český jazyk (CEJ) Jazyková výchova Prima 2 hodiny týdně Dataprojektor, kodifikační příručky Slovní druhy Objasní motivaci pojmenování slovních druhů Vysvětlí

Více

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony Číslo a název projektu Číslo a název šablony DUM číslo a název CZ.1.07/1.5.00/34.0378 Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT SSOS_CJL_5.13

Více

SADA VY_32_INOVACE_CJ1

SADA VY_32_INOVACE_CJ1 SADA VY_32_INOVACE_CJ1 Přehled anotačních tabulek k dvaceti výukovým materiálům vytvořených Mgr. Bronislavou Zezulovou a Mgr. Šárkou Adamcovou. Kontakt na tvůrce těchto DUM: zezulova@szesro.cz a adamcova@szesro.cz

Více

Český jazyk - Jazyková výchova

Český jazyk - Jazyková výchova Prima Zvuková stránka jazyka Stavba slova a pravopis rozlišuje spisovný jazyk, nářečí a obecnou češtinu Jazyk a jeho útvary seznamuje se s jazykovou normou spisovně vyslovuje česká a běžně užívaná cizí

Více

Český jazyk a literatura - jazyková výchova

Český jazyk a literatura - jazyková výchova Využívá znalostí získaných v předešlých ročnících. OPAKOVÁNÍ OPAKOVÁNÍ Vysvětlí pojmy: sl.nadřazené, podřazené a slova souřadná.uvede příklady. Rozpozná sl. jednoznač.a mnohoznačná. V textu vyhledá synonyma,

Více

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA září Žák porovnává významy slov, zvláště slova podobného nebo stejného významu a slova vícevýznamová. Žák dokáže rozlišit mluvnické kategorie podstatných jmen (pád, číslo, rod), rozliší větu jednoduchou

Více

Obsah. Úvodní poznámka 11 Německý jazyk, spisovná řeč a nářečí 13 Pomůcky ke studiu němčiny 15

Obsah. Úvodní poznámka 11 Německý jazyk, spisovná řeč a nářečí 13 Pomůcky ke studiu němčiny 15 Obsah Úvodní poznámka 11 Německý jazyk, spisovná řeč a nářečí 13 Pomůcky ke studiu němčiny 15 VÝSLOVNOST A PRAVOPIS Německá výslovnost 18 Hlavni rozdíly mezi českou a německou výslovnosti 19 Přízvuk 20

Více

Dataprojektor, jazykové příručky, pracovní listy

Dataprojektor, jazykové příručky, pracovní listy Předmět: Náplň: Třída: Počet hodin: Pomůcky: Tvarosloví *) Český jazyk (CEJ) Jazyková výchova Sekunda 2 hodiny týdně Dataprojektor, jazykové příručky, pracovní listy Určuje slovní druhy, své tvrzení vždy

Více

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA Žák porovnává významy slov, zvláště slova podobného nebo stejného významu a slova vícevýznamová O jazyce Opakování učiva 3. ročníku Národní jazyk Naše vlast a národní jazyk Nauka o slově Slova a pojmy,

Více

VY_32_INOVACE_ / IQ cesta

VY_32_INOVACE_ / IQ cesta 1/6 3.2.07.08 Pravidla hry: 1. Hra je určena minimálně pro 2 hráče. 2. Jeden hráč (může se účastnit i hry) bude kontrolovat správnost odpovědí na Listině odpovědí. 3. Každý si vybere figurku jiné barvy

Více

Ročník: 5. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby

Ročník: 5. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby Ročník: 5. Časová dotace: 7 hodin týdně Komunikační a slohová Zážitkové čtení a naslouchání klíčová slova vyhledávací čtení aktivní naslouchání se záznamem slyšeného Žák při hlasitém čtení vhodně využívá

Více

Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova

Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova Vyučovací předmět: Český jazyk a literatura Ročník: 6. Vzdělávací obsah Očekávané výstupy z RVP ZV Školní výstupy Učivo Přesahy a vazby, průřezová témata rozlišuje spisovný jazyk, nářečí a obecnou češtinu

Více

NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA

NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA ČÍSLO SADY III/2 AUTOR/KA Radka Zborníková ČJL - Tvarosloví Slovní druhy číselné označení DUM NÁZEV TŘÍDA ANOTACE PLNĚNÉ VÝSTUPY KLÍČOVÁ SLOVA FORMÁT (pdf,, ) 1. Slovní druhy - přehled, opakování učiva

Více

1. Podstatná jména (substantiva)

1. Podstatná jména (substantiva) 1. Podstatná jména (substantiva) - názvy osob, zvířat, věcí, vlastností, dějů, činností a vztahů - určujeme mluvnické kategorie: PÁD, ČÍSLO, ROD (životnost) + VZOR Druhy podstatných jmen a/ abstraktní

Více

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Žák se seznámí se základními pojmy morfologie tvarosloví, ohebnost, význam slov.

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Žák se seznámí se základními pojmy morfologie tvarosloví, ohebnost, význam slov. Název školy: Číslo a název projektu: Číslo a název šablony klíčové aktivity: Označení materiálu: Typ materiálu: Předmět, ročník, obor: Číslo a název sady: Téma: Jméno a příjmení autora: STŘEDNÍ ODBORNÁ

Více

Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce

Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce 1 JAZYK A JAZYKOVÁ KOMUNIKACE UČEBNÍ OSNOVY 1. 2 Cvičení z českého jazyka Cvičení z českého jazyka 7. ročník 1 hodina 8. ročník 1 hodina 9. ročník 1 hodina Charakteristika Žáci si tento předmět vybírají

Více

Český jazyk v 5. ročníku

Český jazyk v 5. ročníku Český jazyk v 5. ročníku září Jazyková Při hlasitém čtení vhodně využívá modulace souvislé řeči a různá zabarvení hlasu. Po tichém čtení samostatně reprodukuje text. Odliší podstatné a okrajové informace,

Více

Slovní druhy. Ohebné i neohebné

Slovní druhy. Ohebné i neohebné Slovní druhy Ohebné i neohebné Slovní druhy 1. Podstatná jména 2. Přídavná jména 3. Zájmena 4. Číslovky 5. Slovesa 6. Příslovce 7. Předložky 8. Spojky 9. Částice 10. Citoslovce Podstatná jména názvy osob,

Více

KOMUNIKAČNÍ A SLOHOVÁ VÝCHOVA - čtení - praktické plynulé čtení. - naslouchání praktické naslouchání; věcné a pozorné naslouchání.

KOMUNIKAČNÍ A SLOHOVÁ VÝCHOVA - čtení - praktické plynulé čtení. - naslouchání praktické naslouchání; věcné a pozorné naslouchání. - plynule čte v porozuměním text přiměřeného rozsahu a náročnosti KOMUNIKAČNÍ A SLOHOVÁ VÝCHOVA - čtení - praktické plynulé čtení. - porozumí písemným nebo mluveným pokynům přiměřené složitosti - respektuje

Více

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Český jazyk Ročník: 7. Průřezová témata Mezipředmětové vztahy.

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Český jazyk Ročník: 7. Průřezová témata Mezipředmětové vztahy. KOMUKIKAČNÍ A SLOHOVÁ VÝCHOVA Žák - vypravuje ústně i písemně scény z filmu či ukázky z knih, využívá jazykových prostředků vhodných k oživení vypravování,; - popisuje ústně i písemně umělecké dílo, výrobek,

Více

- naslouchání praktické naslouchání; věcné a pozorné naslouchání. - respektování základních forem společenského styku.

- naslouchání praktické naslouchání; věcné a pozorné naslouchání. - respektování základních forem společenského styku. - plynule čte s porozuměním text přiměřeného rozsahu a náročnosti KOMUNIKAČNÍ A SLOHOVÁ VÝCHOVA - čtení - praktické plynulé čtení. OSV (komunikace)- specifické komunikační dovednosti - porozumí písemným

Více

ČESKÝ JAZYK 5. TŘÍDA

ČESKÝ JAZYK 5. TŘÍDA A) Mluvnice 1 - Obecné poučení o jazyce a abeceda a písmo b jak se lidé dorozumívají, funkce řeči c rozlišení prostředků mluveného a psaného projevu 2 - Zvuková stránka jazyka a slabiky a slabikování b

Více

Učební osnovy vyučovacího předmětu český jazyk a literatura se doplňují: 2. stupeň Ročník: sedmý. Tematické okruhy průřezového tématu

Učební osnovy vyučovacího předmětu český jazyk a literatura se doplňují: 2. stupeň Ročník: sedmý. Tematické okruhy průřezového tématu Komunikační a slohová výchova - vypravuje ústně i písemně scény z filmu či ukázky z knih, využívá jazykových prostředků vhodných k oživení vypravování; - popisuje ústně i písemně umělecké dílo, výrobek,

Více

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO Seznam výukových materiálů III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Tematická oblast: Předmět: Vytvořil: Současný český jazyk upevňování a procvičování obtížných gramatických jevů Český jazyk

Více

TEMATICKÝ PLÁN. Literatura: Český jazyk - Z. Krausová, R. Teršová, Fraus 2012, pracovní sešit Český jazyk pro 6. ročník - V.

TEMATICKÝ PLÁN. Literatura: Český jazyk - Z. Krausová, R. Teršová, Fraus 2012, pracovní sešit Český jazyk pro 6. ročník - V. TEMATICKÝ PLÁN Předmět: ČESKÝ JAZYK A LITERATURA Český jazyk - Z. Krausová, R. Teršová, Fraus 2012, pracovní sešit Český jazyk pro 6. ročník - V. Styblík, SPN 1997 UČIVO - MLUVNICE 1. Opakování látky z

Více

Vzdělávací obsah vyučovacího předmětu

Vzdělávací obsah vyučovacího předmětu Vzdělávací obsah vyučovacího předmětu Český jazyk a literatura 5. ročník Zpracovala: Mgr. Helena Ryčlová Komunikační a slohová výchova čte s porozuměním přiměřeně náročné texty potichu i nahlas vymyslí

Více

Český jazyk ve 4. ročníku

Český jazyk ve 4. ročníku Český jazyk ve 4. ročníku září Jazyková Čte s porozuměním přiměřeně náročné texty potichu i nahlas. učebnice strana 3 7 Procvičuje praktické naslouchání při komunikaci s další osobou. pracovní sešit strana

Více

Roční úvodní kurs českého jazyka pro nově příchozí žáky - cizince

Roční úvodní kurs českého jazyka pro nově příchozí žáky - cizince Roční úvodní kurs českého jazyka pro nově příchozí žáky - cizince Cíl kursu: 1/rychlé osvojení češtiny na komunikační úrovni - rozvoj slovní zásoby 2/ pochopení základních pravidel systému jazyka druhy

Více

Školní vzdělávací program Základní školy a mateřské školy Sdružení

Školní vzdělávací program Základní školy a mateřské školy Sdružení Vyučovací předmět: Český jazyk a literatura 3. ročník Měsíc Téma Učivo Očekávaný výstup září říjen OPAKOVÁNÍ Z 2. roč. VĚTA JEDNODUCHÝ PŘÍBĚH OPAKOVÁNÍ Z 2. ročníku PÁROVÉ SOUHLÁSKY ABECEDA JEDNODUCHÝ

Více

TEMATICKÝ PLÁN 6. ročník

TEMATICKÝ PLÁN 6. ročník TEMATICKÝ PLÁN 6. ročník Předmět: ČESKÝ JAZYK A LITERATURA Český jazyk - Z. Krausová, R. Teršová, Fraus 2012, pracovní sešit Český jazyk pro 6. ročník - V. Styblík, SPN 1997 UČIVO - MLUVNICE 1. Opakování

Více

Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA

Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA Vzdělávací oblast: Jazyk a jazyková komunikace Vzdělávací obor (předmět): Český jazyk: jazyková výchova - ročník: PRIMA Téma Učivo Výstupy Kódy Dle RVP Školní (ročníkové) PT KK Podstatná jména: - konkrétní

Více

Ročník: 4. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby

Ročník: 4. Časová dotace: 7 hodin týdně učivo, téma očekávané výstupy klíčové kompetence, mezipředmětové vazby Ročník: 4. Časová dotace: 7 hodin týdně Komunikační a slohová Čtení a naslouchání čtení jako zdroj informací aktivní naslouchání s otázkami Žák čte s porozuměním přiměřeně náročné texty potichu i nahlas.

Více

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA Žák rozlišuje zvukovou a grafickou podobu slova, člení slova na hlásky, odlišuje dlouhé a krátké samohlásky. Žák rozlišuje počet slabik a písmen ve slovech Postupné rozšiřování slovní zásoby Učí se užívat

Více

Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Vyučovací předmět: Český jazyk a literatura Ročník: 6.

Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Vyučovací předmět: Český jazyk a literatura Ročník: 6. Vzdělávací oblast: JAZYK A JAZYKOVÁ KOMUNIKACE Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova - zná pojem mateřský jazyk 1. Čeština jako mateřský jazyk MKV 4.4 - zná základní složky

Více

ČESKÝ JAZYK A LITERATURA 4.ROČNÍK

ČESKÝ JAZYK A LITERATURA 4.ROČNÍK VZDĚLÁVACÍ OBLAST: VZDĚLÁVACÍ OBOR: PŘEDMĚT: JAZYK A JAZYKOVÁ KOMUNIKACE ČESKÝ JAZYK A LITERATURA ČESKÝ JAZYK A LITERATURA 4.ROČNÍK Téma, učivo Rozvíjené kompetence, očekávané výstupy Mezipředmětové vztahy

Více

Přídavná jména Střední průmyslová škola a Obchodní akademie Uherský Brod Český jazyk a literatura

Přídavná jména Střední průmyslová škola a Obchodní akademie Uherský Brod Český jazyk a literatura Přídavná jména Název školy: Střední průmyslová škola a Obchodní akademie Uherský Brod Adresa: Nivnická 1781, 688 01 Uherský Brod Předmět: Český jazyk a literatura Vyučující: Balaštíková Andrea Přídavná

Více

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49. Výukový materiál zpracovaný v rámci projektu Výuka moderně

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49. Výukový materiál zpracovaný v rámci projektu Výuka moderně Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Český jazyk,

Více

Jednoduchá sdělení představování, poděkování, pozdrav, omluva Základní výslovnostní návyky

Jednoduchá sdělení představování, poděkování, pozdrav, omluva Základní výslovnostní návyky Učební osnovy Ruský jazyk PŘEDMĚT: Ruský jazyk Ročník: 7. třída 1 rozumí jednoduchým pokynům a otázkám učitele, které jsou pronášeny pomalu a s pečlivou výslovností, a reaguje na ně 1p je seznámen se zvukovou

Více

http: //pravopisne.cz/2014/11/test-podstatna-jmena-konkretni-a-abstraktni-11/

http: //pravopisne.cz/2014/11/test-podstatna-jmena-konkretni-a-abstraktni-11/ STAVBA SLOVA http://pravopisne.cz/2015/02/test-skladba-slova-12/ http://pravopisne.cz/2014/03/test-hledani-korenu-slov/ Synonyma, antonyma, homonyma http://pravopisne.cz/201 5/03/urcovani-synonym-2-pravoxeso-8/

Více

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ Číslo projektu Číslo a název šablony klíčové aktivity Tématická oblast CZ.1.07/1.5.00/34.0963 II/2 Inovace a zkvalitnění výuky směřující k rozvoji čtenářské a informační

Více

4.9.1. Základy latiny II

4.9.1. Základy latiny II 4.9.1. Základy latiny II Základy latiny jsou dvouletý volitelný předmět, jehož hlavním cílem je poskytnout žákům základní orientaci v systému latinské gramatiky v rozsahu středoškolského učiva a připravit

Více

CZ.1.07/1.5.00/ Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT

CZ.1.07/1.5.00/ Zefektivnění výuky prostřednictvím ICT technologií III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT Autor: Mgr. Alena Hynčicová Tematický celek: Tvarosloví Cílová skupina: první ročník oborů SŠ Anotace: Materiál má podobu pracovního listu s úlohou, pomocí níž si žáci procvičí a zopakují vzory podstatných

Více

ČESKÝ JAZYK 3. ROČNÍK

ČESKÝ JAZYK 3. ROČNÍK VZDĚLÁVACÍ OBLAST: VZDĚLÁVACÍ OBOR: PŘEDMĚT: JAZYK A JAZYKOVÁ KOMUNIKACE ČESKÝ JAZYK A LITERATURA ČESKÝ JAZYK 3. ROČNÍK Téma, učivo Rozvíjené kompetence, očekávané výstupy Mezipředmětové vztahy Aktualizace

Více

Český jazyk a literatura

Český jazyk a literatura 1 Výchovné a vzdělávací strategie Kompetence k učení Kompetence komunikativní Kompetence pracovní Kompetence k řešení problémů Kompetence sociální a personální Kompetence občanské RVP výstupy ŠVP výstupy

Více

Příloha č. 13 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Příloha č. 13 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA Pozná slova vyjmenovaná a slova příbuzná. Aplikuje pravopis, používá přehled. Umí zařadit slova ke vzoru Zná základní pravidlo shody. Určí pád, číslo, rod, vzor u podstatných jmen. Určí osobu, číslo, způsob,

Více

Předmět speciálně pedagogické péče

Předmět speciálně pedagogické péče Předmět speciálně pedagogické péče Přehled podpůrných opatření včetně zajištění předmětů speciálně pedagogické péče (PSPP) je obsažen v Příloze č. 1 k vyhlášce č. 27/2016 Sb. o vzdělávání žáků se speciálními

Více

Předmět: Český jazyk a literatura

Předmět: Český jazyk a literatura 21 sestaví osnovu vyprávění a na jejím základě vytváří krátký mluvený nebo písemný projev s dodržením časové posloupnosti 30 porovnává významy slov, zvláště slova stejného nebo podobného významu a slova

Více

RVP ŠVP UČIVO - samostatně pracuje s Pravidly českého pravopisu, se Slovníkem spisovné češtiny a s dalšími slovníky a příručkami

RVP ŠVP UČIVO - samostatně pracuje s Pravidly českého pravopisu, se Slovníkem spisovné češtiny a s dalšími slovníky a příručkami DODATEK č. 27 PŘEDMĚT: ČESKÝ JAZYK A LITERATURA ROČNÍK: 9. ročník ČESKÝ JAZYK - rozlišuje a příklady v textu dokládá nejdůležitější způsoby obohacování slovní zásoby a zásady tvoření českých slov, rozpoznává

Více

ZŠ ÚnO, Bratří Čapků 1332

ZŠ ÚnO, Bratří Čapků 1332 TS Český jazyk 1 (Pravopis) Terasoft Vyjmenovaná slova doplňování i(í) nebo y(ý), chybné odpovědi jsou vypsány s uvedením správného pravopisu před vlastním testem je možné zvolit písmena, po kterých budou

Více

Učební osnovy vyučovacího předmětu český jazyk a literatura se doplňují: 2. stupeň Ročník: šestý. Tematické okruhy průřezového tématu

Učební osnovy vyučovacího předmětu český jazyk a literatura se doplňují: 2. stupeň Ročník: šestý. Tematické okruhy průřezového tématu Komunikační a slohová výchova - vypravuje ústně i písemně, využívá jazykových prostředků vhodných k oživení vypravování, dodržuje časovou posloupnost, sestavuje osnovu vypravování; - popisuje ústně i písemně

Více

Jazyková výchova Opakování. Věta, souvětí. Význam slov, hlásková podoba slova. Jednoznačná a mnohoznačná slova

Jazyková výchova Opakování. Věta, souvětí. Význam slov, hlásková podoba slova. Jednoznačná a mnohoznačná slova A B C D E F 1 Vzdělávací oblast: Jazyk a jazyková komunikace 2 Vzdělávací obor: Český jazyk a literatura 3 Vyučovací předmět: Český jazyk 4 Ročník: 4. 5 Klíčové kompetence (Dílčí kompetence) 6 Kompetence

Více

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Český jazyk Ročník: 6. Průřezová témata Mezipředmětové vztahy.

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Český jazyk Ročník: 6. Průřezová témata Mezipředmětové vztahy. KOMUKIKAČNÍ A SLOHOVÁ VÝCHOVA Žák - vypravuje ústně i písemně, využívá jazykových prostředků vhodných k oživení vypravování, dodržuje časovou posloupnost, sestavuje osnovu vypravování; - popisuje ústně

Více

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA říjen září Žák rozlišuje zvukovou a grafickou podobu slova, člení slova na hlásky, odlišuje dlouhé a krátké samohlásky. Zvuková stránka jazyka Slovní zásoba a tvoření slov Skladba Sluchové rozlišení hlásek

Více

IV. Gramatika A. Tvarosloví 1. Slovní druhy

IV. Gramatika A. Tvarosloví 1. Slovní druhy IV. Gramatika A. Tvarosloví 1. Slovní druhy Slovní druhy jsou soubory slov vymezené podle hledisek významového, tvaroslovného a skladebního. V podstatě se shodují s kategoriemi, s jejichž pomocí starořecký

Více

Tam, kde anglické příklady neodpovídají českému jazykovému systému, se český překlad neuvádí.

Tam, kde anglické příklady neodpovídají českému jazykovému systému, se český překlad neuvádí. ČESKÁ TECHNICKÁ NORMA ICS 01.020 Listopad 1997 Terminologie - Slovník ČSN ISO 1087 01 0501 Terminology - Vocabulary Terminologie - Vocabulaire Terminologielehre - Begriffe Tato norma je identická s ISO

Více

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT Název školy: Číslo a název projektu: STŘEDNÍ ODBORNÁ ŠKOLA a STŘEDNÍ ODBORNÉ UČILIŠTĚ, Česká Lípa, 28. října 2707, příspěvková organizace CZ.1.07/1.5.00/34.0880 Digitální učební materiály www.skolalipa.cz

Více

JAZYKOVÁ VÝCHOVA. Tvarosloví. Pravopis. Jazyk a jazyková komunikace - Český jazyk - 7. ročník. POZNÁMKY (průřezová témata, mezipředmětové vztahy)

JAZYKOVÁ VÝCHOVA. Tvarosloví. Pravopis. Jazyk a jazyková komunikace - Český jazyk - 7. ročník. POZNÁMKY (průřezová témata, mezipředmětové vztahy) JAZYKOVÁ VÝCHOVA Tvarosloví ž. si uvědomuje rozmanitost jazyka ž. tvoří a vědomě používá spisovné tvary slov ž. pracuje s jazykovými příručkami ž. pracuje s jazykovými texty různého zaměření ž. rozlišuje

Více

Název materiálu SLOVNÍ DRUHY PODSTATNÁ JMÉNA. Metodika. Pořadové číslo III-2-ČJ-III- 1-9.r.

Název materiálu SLOVNÍ DRUHY PODSTATNÁ JMÉNA. Metodika. Pořadové číslo III-2-ČJ-III- 1-9.r. Pořadové číslo 1-9.r. Název materiálu SLOVNÍ DRUHY PODSTATNÁ JMÉNA Autor Použitá literatura a zdroje Fraus 2006, 27-30 s. ISBN 80-7238-536-4 sešit 2006, 20-21 s. ISBN 80-7238-537-2 Metodika Materiál je

Více

Tematický plán pro školní rok 2015/16 Předmět: Český jazyk Vyučující: Mgr. Iveta Jedličková Týdenní dotace hodin: 8 hodin Ročník: pátý

Tematický plán pro školní rok 2015/16 Předmět: Český jazyk Vyučující: Mgr. Iveta Jedličková Týdenní dotace hodin: 8 hodin Ročník: pátý ČASOVÉ OBDOBÍ Září Říjen KONKRÉTNÍ VÝSTUPY KONKRÉTNÍ UČIVO PRŮŘEZOVÁ TÉMATA Umí vyznačit ve slově kořen, předponu, příponu, koncovku Umí vytvořit tvar slova a slovo příbuzné Umí odvodit slova pomocí přípony

Více

Český jazyk a literatura

Český jazyk a literatura Výchovné a vzdělávací strategie Kompetence k učení Kompetence komunikativní Kompetence pracovní Kompetence k řešení problémů Kompetence sociální a personální Kompetence občanské RVP výstupy ŠVP výstupy

Více

Český jazyk Název Ročník Autor

Český jazyk Název Ročník Autor Pomůcka - Slabiky - foto 1. Pomůcka Psací tvary písmen 1. PL - Samohlásky 1. PL Slabiky - slova 1. PL - Souhlásky 1. PL Slova - věty 1. PL Souhlásky m, l, p 1. PL Tvoření slov 1. PL Souhlásky s, j, t 1.

Více

Příklad rozpracování minimální doporučené úrovně pro úpravu. očekávaných výstupů v rámci podpůrných opatření. do učebních osnov vyučovacího předmětu

Příklad rozpracování minimální doporučené úrovně pro úpravu. očekávaných výstupů v rámci podpůrných opatření. do učebních osnov vyučovacího předmětu Příklad rozpracování minimální doporučené úrovně pro úpravu očekávaných výstupů v rámci podpůrných opatření do učebních osnov vyučovacího předmětu ČESKÝ JAZYK A LITERATURA Ukázka byla zpracována s využitím

Více

Specifikace požadavků pro školní část přijímací zkoušky (anglický jazyk) Šestiletý obor vzdělávání

Specifikace požadavků pro školní část přijímací zkoušky (anglický jazyk) Šestiletý obor vzdělávání Specifikace požadavků pro školní část přijímací zkoušky (anglický jazyk) Šestiletý obor vzdělávání rozumí informacím v jednoduchých poslechových textech, jsou-li pronášeny pomalu a zřetelně, rozumí obsahu

Více

Očekávané výstupy z RVP Učivo Přesahy a vazby Dokáže pracovat se základními obecné poučení o jazyce (jazykové příručky)

Očekávané výstupy z RVP Učivo Přesahy a vazby Dokáže pracovat se základními obecné poučení o jazyce (jazykové příručky) Český jazyk a literatura - 6. ročník Dokáže pracovat se základními obecné poučení o jazyce (jazykové příručky) jazykovými příručkami Odliší spisovný a nespisovný jazykový projev Rozpozná nejdůležitější

Více

MLUVNICE. Seznam otázek k závěrečným zkouškám z českého jazyka a literatury v 9. ročníku

MLUVNICE. Seznam otázek k závěrečným zkouškám z českého jazyka a literatury v 9. ročníku Seznam otázek k závěrečným zkouškám z českého jazyka a literatury v 9. ročníku MLUVNICE 1. Jazykové rodiny 2. Útvary národního jazyka 3. Jazykové příručky 4. Slovo a jeho význam 5. Obohacování slovní zásoby

Více

Prezentace učiva o současné češtině ve školních učebnicích Gabriela Lefenda

Prezentace učiva o současné češtině ve školních učebnicích Gabriela Lefenda Prezentace učiva o současné češtině ve školních učebnicích Gabriela Lefenda KATEDRA ČESKÉHO JAZYKA A LITERATURY S DIDAKTIKOU, PdF OU Sledované učebnice: Český jazyk učebnice pro základní školy (2. 5. ročník),

Více

MENSA GYMNÁZIUM, o.p.s. TEMATICKÉ PLÁNY TEMATICKÝ PLÁN (ŠR 2014/15)

MENSA GYMNÁZIUM, o.p.s. TEMATICKÉ PLÁNY TEMATICKÝ PLÁN (ŠR 2014/15) TEMATICKÝ PLÁN (ŠR 2014/15) PŘEDMĚT Český jazyk TŘÍDA/SKUPINA VYUČUJÍCÍ ČASOVÁ DOTACE UČEBNICE (UČEB. MATERIÁLY) - ZÁKLADNÍ POZN. (UČEBNÍ MATERIÁLY DOPLŇKOVÉ aj.) sekunda Mgr. Barbora Maxová 2hod/týden,

Více

Všestranný jazykový rozbor (VJR)

Všestranný jazykový rozbor (VJR) Všestranný jazykový rozbor (VJR) VJR by měl tvořit součást téměř každé vyučovací hodiny a můžeme jej zařadit do kterékoli její části. Nejčastěji se používá při opakovaní a vyvozování nového učiva. Pokud

Více

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ Číslo projektu Číslo a název šablony klíčové aktivity Tématická oblast CZ.1.07/1.5.00/34.0963 II/2 Inovace a zkvalitnění výuky směřující k rozvoji čtenářské a informační

Více

Projekt: Multimediální prezentace vzdělávacích oblastí školního vzdělávacího programu

Projekt: Multimediální prezentace vzdělávacích oblastí školního vzdělávacího programu Projekt: Multimediální prezentace vzdělávacích oblastí školního vzdělávacího programu O B S A H Český jazyk (Mgr. Olga Cudlínová)... 5 Tvoření slov.. 5 Pravopis slova.. 6 Slovní druhy...... 7 Podstatná

Více

RVP ŠVP UČIVO - rozlišuje a příklady v textu dokládá nejdůležitější způsoby obohacování slovní zásoby a zásady tvoření českých slov

RVP ŠVP UČIVO - rozlišuje a příklady v textu dokládá nejdůležitější způsoby obohacování slovní zásoby a zásady tvoření českých slov Dodatek č.17 PŘEDMĚT: ČESKÝ JAZYK A LITERATURA ROČNÍK: 8. ročník ČESKÝ JAZYK - rozlišuje a příklady v textu dokládá nejdůležitější způsoby obohacování slovní zásoby a zásady tvoření českých slov - rozlišuje

Více

Český jazyk a literatura

Český jazyk a literatura 1 Český jazyk a literatura Český jazyk a literatura Výchovné a vzdělávací strategie Kompetence k učení Kompetence komunikativní Kompetence pracovní Kompetence k řešení problémů Kompetence sociální a personální

Více

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA

Příloha č. 4 ČESKÝ JAZYK JAZYKOVÁ VÝCHOVA Žák rozlišuje zvukovou a grafickou podobu slova, člení slova na hlásky, odlišuje dlouhé a krátké samohlásky. Zvuková stránka jazyka Pravopis Slovní zásoba a tvoření slov Skladba Rozlišení hlásek koordinace

Více

2 Lexikální jednotka. 2.1 Obecné kategorie

2 Lexikální jednotka. 2.1 Obecné kategorie 2 Lexikální jednotka 2.1 Obecné kategorie Pojmy vyjádřené lexikálními jednotkami patří k těmto obecným kategoriím: a) Konkrétní entity (nositelé vlastností a dějů) b) Abstraktní entity c) Individuální

Více

Základní škola ve Vamberku. Tematický plán učiva ČESKÝ JAZYK PRO 9. ROČNÍK. Václav Strážnický 2012/13

Základní škola ve Vamberku. Tematický plán učiva ČESKÝ JAZYK PRO 9. ROČNÍK. Václav Strážnický 2012/13 Základní škola ve Vamberku Tematický plán učiva ČESKÝ JAZYK PRO 9. ROČNÍK Václav Strážnický 2012/13 MLUVNICE HODINOVÁ DOTACE TEMATICKÝ CELEK OBSAH ZÁŘÍ CELKEM 8 HODIN 1hodina 5 hodin ÚVOD A OPAKOVÁNÍ UČIVA

Více

Jazyk a jazyková komunikace Seminář z českého jazyka 2. 7.

Jazyk a jazyková komunikace Seminář z českého jazyka 2. 7. VZDĚLÁVACÍ BLAT: Vzdělávací obor: tupeň: Ročník: Jazyk a jazyková komunikace eminář z českého jazyka 2. 7. čekávané výstupy omp e t e n c e čivo Mezipředmětové vztahy oznámky určuje věcné významy slov

Více

OBSAH. Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický

OBSAH. Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický OBSAH Předmluva (Libuše Dušková) DÍL I. Rozbor fonologický Úvod Rozdělení jazykového rozboru Poměr fonologie k fonetice. Dějiny bádání Fonémy a varianty Monofonémové hodnocení hláskových komplexů Dvoufonémové

Více

Předmět - Český jazyk a literatura Ročník: 5. RVP - ZV Výstup Učivo Průřezová témata

Předmět - Český jazyk a literatura Ročník: 5. RVP - ZV Výstup Učivo Průřezová témata Předmět - Český jazyk a literatura Ročník: 5. čte s porozuměním přiměřeně náročné texty potichu i nahlas rozlišuje podstatné a okrajové informace v textu vhodném pro daný věk, podstatné informace zaznamenává

Více

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT Název školy: Číslo a název projektu: Číslo a název šablony klíčové aktivity: Označení materiálu: Typ materiálu: Předmět, ročník, obor: Číslo a název sady: Téma: Jméno a příjmení autora: STŘEDNÍ ODBORNÁ

Více

SLOVNÍ DRUHY. Vytvořeno dne: druhů, vymezuje tři základní kritéria členění. Závěr prezentace slouží k procvičení osvojených poznatků.

SLOVNÍ DRUHY. Vytvořeno dne: druhů, vymezuje tři základní kritéria členění. Závěr prezentace slouží k procvičení osvojených poznatků. SLOVNÍ DRUHY Název materiálu: Název sady: Vzdělávací oblast: Vzdělávací obor: Téma: Jméno autora: VY_32_INOVACE_CJ2r0101 Morfologie pro 2. ročník Jazyk a jazyková komunikace Český jazyk a literatura Slovní

Více

Dataprojektor, jazykové příručky, pracovní listy

Dataprojektor, jazykové příručky, pracovní listy Předmět: Náplň: Třída: Počet hodin: Pomůcky: Český jazyk (CEJ) Jazyková výchova Tercie 2 hodiny týdně Dataprojektor, jazykové příručky, pracovní listy Skladba *) Ţák vysvětlí pojem aktuální (kontextové)

Více

PŘÍDAVNÁ JMÉNA (ADJEKTIVA)

PŘÍDAVNÁ JMÉNA (ADJEKTIVA) PŘÍDAVNÁ JMÉNA (ADJEKTIVA) Název materiálu: Název sady: Vzdělávací oblast: Vzdělávací obor: Téma: Jméno autora: VY_32_INOVACE_CJ2r0108 Morfologie pro 2. ročník Jazyk a jazyková komunikace Český jazyk a

Více

Výukový materiál zpracován v rámci projektu EU peníze školám

Výukový materiál zpracován v rámci projektu EU peníze školám Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.4.00/21.3665 Šablona: III/2 č. materiálu: VY_32_INOVACE_277 Jméno autora: Mgr. Eva Svárovská Třída/ročník:

Více

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 3.. Průřezová témata Mezipředmětové vztahy.

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 3.. Průřezová témata Mezipředmětové vztahy. OSV - rozvoj individuálních dovedností pro kooperaci (seberegulace v situaci nesouhlasu, odporu apod., dovednost odstoupit od vlastního nápadu, dovednost navazovat na druhé a rozvíjet vlastní linku jejich

Více

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti Prima jednoduše mluví o sobě Slovní zásoba: elementární slovní 1 B/ 26, 27, 29, 30 tvoří jednoduché otázky a aktivně je používá zásoba pro zvolené tematické okruhy odpovídá na jednoduché otázky obsahující

Více

Stonožka jak se z výsledků dozvědět co nejvíce

Stonožka jak se z výsledků dozvědět co nejvíce Stonožka jak se z výsledků dozvědět co nejvíce Vytvoření Map učebního pokroku umožňuje vyhodnotit v testování Stonožka i dílčí oblasti učiva. Mapy učebního pokroku sledují individuální pokrok žáka a nabízejí

Více

Český jazyk a literatura

Český jazyk a literatura Vyučovací předmět: Období ročník: Učební texty: Český jazyk a literatura 2. období 5. ročník Český jazyk pro 4. ročník I. část (Fortuna), Český jazyk pro 4. ročník II. část (Fortuna) Český jazyk pro 5.

Více

Pravopis i-y. MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/21.2389

Pravopis i-y. MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/21.2389 Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám. 1594/16, 664 51 Šlapanice www.zsslapanice.cz MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/21.2389 Pravopis

Více

Projekt IMPLEMENTACE ŠVP

Projekt IMPLEMENTACE ŠVP Střední škola umělecká a řemeslná Evropský sociální fond "Praha a EU: Investujeme do vaší budoucnosti" Projekt IMPLEMENTACE ŠVP Evaluace a aktualizace metodiky předmětu Německý jazyk Obory nástavbového

Více

2. Přídavná jména Tři stránky tabulek obsahují 156 nejběžnějších anglických přídavných jmen.

2. Přídavná jména Tři stránky tabulek obsahují 156 nejběžnějších anglických přídavných jmen. TABULKY SLOVÍČEK Už před lety jsem si všiml, že z nějakého důvodu studenti na základní a dokonce i na pokročilejší úrovni často neznají některá úplně základní slovíčka. Nejvíce se to dá pozorovat u sloves,

Více

Tematický plán pro školní rok 2015/2016 Předmět: Český jazyk Vyučující: Mgr. Jitka Vlčková Týdenní dotace hodin: 8 hodin Ročník: čtvrtý

Tematický plán pro školní rok 2015/2016 Předmět: Český jazyk Vyučující: Mgr. Jitka Vlčková Týdenní dotace hodin: 8 hodin Ročník: čtvrtý ČASOVÉ OBDOBÍ Září KONKRÉTNÍ VÝSTUPY KONKRÉTNÍ UČIVO PRŮŘEZOVÁ TÉMATA rozliší větu jednoduchou a souvětí ví, co znamená věta, slovo rozlišuje slova nespisovná a nahradí je spisovnými zná pravidla pro psaní

Více

7. ročník. Český jazyk a literatura. Komunikační a slohová výchova. Vypravování uspořádání dějových prvků

7. ročník. Český jazyk a literatura. Komunikační a slohová výchova. Vypravování uspořádání dějových prvků list 1 / 8 Čj časová dotace: 4 hod / týden Český jazyk a literatura 7. ročník (ČJL 9 1 09) sestaví vypravování v časové posloupnosti s využitím názorných jazykových prostředků sestaví vypravování s využitím

Více

Český jazyk a literatura

Český jazyk a literatura 1 Výchovné a vzdělávací strategie Kompetence k učení Kompetence komunikativní Kompetence pracovní Kompetence k řešení problémů Kompetence sociální a personální Kompetence občanské RVP výstupy ŠVP výstupy

Více

LISTOPAD Úvod do nauky o tvoření slov, PROSINEC Psaní velkých písmen

LISTOPAD Úvod do nauky o tvoření slov, PROSINEC Psaní velkých písmen (UČEBNÍ MATERIÁLY Český jazyk a stylistika Sexta A, Sexta B Libuše Kratochvílová 2 hodiny týdně Český jazyk pro 2.roč. G SPN 2005 / nov. mat. / Český jazyk pro stř. šk. SPN 2003 a další Český jazyk v kostce

Více

Výstupy z RVP Učivo Ročník Průřezová témata Termín/hodiny Komunikační a slohová výchova 12 čte s porozuměním přiměřeně náročné texty potichu i nahlas

Výstupy z RVP Učivo Ročník Průřezová témata Termín/hodiny Komunikační a slohová výchova 12 čte s porozuměním přiměřeně náročné texty potichu i nahlas 21 sestaví osnovu vyprávění a na jejím základě vytváří krátký mluvený nebo písemný projev s dodržením časové posloupnosti 30 porovnává významy slov, zvláště slova stejného nebo podobného významu a slova

Více

VY_12_INOVACE_26_MLUVNICKE_KATEGORIE_PODSTATNYCH_ JMEN. Předmět: Český jazyk Ročník: 4. Časová dotace: 45 min Datum ověření:

VY_12_INOVACE_26_MLUVNICKE_KATEGORIE_PODSTATNYCH_ JMEN. Předmět: Český jazyk Ročník: 4. Časová dotace: 45 min Datum ověření: Kód materiálu: Název materiálu: VY_12_INOVACE_26_MLUVNICKE_KATEGORIE_PODSTATNYCH_ JMEN Mluvnické kategorie podstatných jmen Předmět: Český jazyk Ročník: 4. Časová dotace: 45 min Datum ověření: 10. 4. 2013

Více

Jazyk a jazyková komunikace 2. ročník a sexta

Jazyk a jazyková komunikace 2. ročník a sexta Předmět: Náplň: Třída: Počet hodin: Pomůcky: Tvarosloví Český jazyk (CEJ) Jazyk a jazyková komunikace 2. ročník a sexta 2 hodiny týdně (viz poznámky) S jistotou určí slovní druh a pojmenuje jej cizím termínem

Více

A JEHO VÝZNAM SLOVO A POJMENOVÁNÍ

A JEHO VÝZNAM SLOVO A POJMENOVÁNÍ Název: VY_32_INOVACE_1_SPSOA_CJL_14_BAL Vypracovala: Andrea Balaštíková Vytvořeno v projektu EU peníze středním školám PRACOVNÍ LIST zápis Úkol: Na vynechaná místa v textu doplňte správné pojmy. SLOVO

Více

Zájmena Pronomina Číslovky Numeralia Tento výukový materiál vznikl za přispění Evropské unie, státního rozpočtu ČR a Středočeského kraje

Zájmena Pronomina Číslovky Numeralia Tento výukový materiál vznikl za přispění Evropské unie, státního rozpočtu ČR a Středočeského kraje Zájmena Pronomina Číslovky Numeralia Tento výukový materiál vznikl za přispění Evropské unie, státního rozpočtu ČR a Středočeského kraje 5.9.2009 Mgr. Jitka Riedlová Zájmena - Plnovýznamový slovní druh

Více

Český jazyk a literatura. 6. ročník. Komunikační a slohová výchova. Vypravování osnova

Český jazyk a literatura. 6. ročník. Komunikační a slohová výchova. Vypravování osnova list 1 / 7 Čj časová dotace: 4 hod / týden Český jazyk a literatura 6. ročník (ČJL 9 1 09) (ČJL 9 1 05) (ČJL 9 1 09) napíše kratší vypravování a dodržuje následnost dějových složek umí využívat dějových

Více