Analýza staročeské morfologie v Excelu



Podobné dokumenty
Stručný obsah. K2118.indd :15:27

Obsah. Úvod 9. Úvod do Office Seznámení s Office Vylepšení programu Access XML 13 Inteligentní značky 14

Obsahy kurzů MS Office

Import a export dat EU peníze středním školám Didaktický učební materiál

Služby Microsoft Office 365

Obsah. Základy práce s databází 13. Tabulky 43. Obsah. Úvod 9 Poděkování 12

Excel a externí data KAPITOLA 2

Informace k e-learningu

Analýza a prezentace dat

Microsoft Access tvorba databáze jednoduše

Microsoft Excel 2007 pokročilé metody a funkce

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MS Access složitější konverze dat Ing. Kotásek Jaroslav

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Microsoft Excel 2010 pokročilé metody a funkce

Tabulkový procesor otázka č.17

POZVÁNKA NA KURZY. Literatura Ke všem kurzům jsou poskytovány metodické příručky pro školství v elektronické podobě.

EPLAN Electric P8 2.7 s databázemi na SQL serveru

Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma. Ing. Jiří Šunka Ing. Michaela Hendrychová. ISSS Hradec Králové, 5. 4.

Příloha č. 1. Specifikace jednotlivých e-learningových výukových kurzů:

PowerPivot pro Microsoft Excel 2013

Předmluva 11 Typografická konvence použitá v knize Úvod do Excelu

Srovnání 602Office a 602PC SUITE

Efektivní práce s Excelem (středně pokročilí uživatelé)

Vzdělávací obsah vyučovacího předmětu

Začínáme pracovat s tabulkovým procesorem MS Excel

III. Kontingenční tabulky v Excelu. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M.

Tlačítka a další prvky vestavěných panelů nástrojů a nabídek (CommandBar) a jejich Control ID ve verzi Excel 2010

Prozkoumání příkazů na pásu karet Každá karta na pásu karet obsahuje skupiny a každá skupina obsahuje sadu souvisejících příkazů.

Databáze MS-Access. Obsah. Co je to databáze? Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová

SOFTWARE 5P. Instalace. SOFTWARE 5P pro advokátní praxi Oldřich Florian

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Obsah. Seznámení s prostředím Excelu. Poděkování 25 O přiloženém CD 26 Co je na CD 26 Použití CD 26 Systémové požadavky 26 Podpora 27

Konfigurace pracovní stanice pro ISOP-Centrum verze

Data x Informace x Znalosti

Testovací protokol USB Token Cryptomate

ŠKOLENÍ MS OFFICE na rok 2010

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Příprava dat v softwaru Statistica

Programy pro psaní textů. textové editory, textové procesory

TECHNICKÁ SPECIFIKACE PŘEDMĚTU PLNĚNÍ

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

[Zadejte název společnosti.] Instalace. SOFTWARE 5P pro správu bytového fondu Oldřich Florian

Konfigurace pracovní stanice pro ISOP-Centrum verze

Workshop DSP Jan Medek, DiS. Data Agentura INFOPHARM s.r.o.

I. Příprava dat Klíčový význam korektního uložení získaných dat Pravidla pro ukládání dat Čištění dat před analýzou

Pracovní list VY_32_INOVACE_33_15 Databáze Databáze Databáze Test Ing. Petr Vilímek

Pracovní sešit MS Word pokročilý

Typy souborů ve STATISTICA. Tento článek poslouží jako přehled hlavních typů souborů v programu

Analýza dat na PC I.

1.13 ACCESS popis programu

1 Webový server, instalace PHP a MySQL 13

II. Vzorce v Excelu Tipy pro práci s Wordem Kontingenční tabulky v Excelu, 1. část

INFORMATIKA. Libovolná učebnice k MS OFFICE 200x (samostatné učebnice k textovému procesoru MS Word 200x, tabulkovému procesoru MS Excel 200x).

Business Intelligence nástroje a plánování

Počítačové kurzy buildit

KANCELÁŘSKÉ APLIKACE

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů Praha 1

Ukázka knihy z internetového knihkupectví

CBR Test dimenzač ní čh parametrů vozovek

VÝVOJ INTERNETOVÝCH APLIKACÍ - VIA

ZŠ ÚnO, Bratří Čapků 1332

Obsah. 1 Úvod do Visia Práce se soubory 47. Předmluva 11 Typografická konvence použitá v knize 13

Testovací protokol USB token etoken PRO 32K

Úvod do MS Access. Modelování v řízení. Ing. Petr Kalčev

Microsoft Word základní

6. Statistica (pokračování) Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová

Jak lze zefektivnit monitoring médií

Edu-learning pro školy

1. Úroveň znalostí a dovedností

Vzdělávací obsah předmětu

Předmětem části B) veřejné zakázky je dodávku existujícího licencovaného softwaru dle této technické specifikace.

Otevřený svět ICS. Radim Navrátil. aneb co svět oken a ICS? Vedoucí oddělení aplikační administrace a bezpečnosti, YOUR SYSTEM, spol. s r.o.

Kontingenční tabulky v MS Excel 2010

Tvorba PDF Práce s Adobe Acrobatem

POKROČILÉ POUŽITÍ DATABÁZÍ

Hlavní rysy produktu MapInfo Professional

Obsah KAPITOLA 1 Několik slov o Wordu

práce s databázemi a kontingenčními tabulkami

Níže uvedená tabulka obsahuje technické údaje a omezení aplikace Excel (viz také článek Technické údaje a omezení aplikace Excel (2007).

Základní informace o vzdělávacím kurzu

PRODUKTY. Tovek Tools

Přístup k poště MS Office 365 mají pouze studenti 1. a 2. ročníku EkF prezenčního studia. Přístup k ostatním službám mají všichni studenti.

Testovací protokol čipová karta ACOS5

Účetní, ekonomické a právní kurzy

Vytvoření kontingenční tabulky

Databáze prodejců. Tlačítka. Vytvoří kartu nového prodejce (Alt+N); Změní vybraného prodejce Uloží nového prodejce nebo změnu (Alt+U);

BMOF011 Aplikace MS Office (jaro 2013) Microsoft Word 2007

ZŠ ÚnO, Bratří Čapků 1332

Kapitola 1: Co je Microsoft Access? 27 Kapitola 2: Mnoho tváří aplikace Microsoft Access 41 Kapitola 3: Návrh databázové aplikace 75

www. www g. r g ad ra a d.c a. z Kniha obsahuje tato témata: Příklady k procvičování zdarma ke stažení na

C# - Databáze úvod, ADO.NET. Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T.G. Masaryka, Kostelec nad Orlicí

Excel Práce s databázemi a kontingenčními tabulkami. Marek Laurenčík

Informatika I. ení 5 - podpora

O P A K O V A C Í T E S T z a d á n í 1/5 TEXTOVÝ EDITOR. Pomocí nástroje hromadná korespondence vytvořte formulářové dopisy: Hlavní dokument

SECTRON s.r.o. Výstavní 2510/10, Ostrava - Mariánské Hory , sales@sectron.cz

Export tabulky výsledků

4. Vzorce v Excelu Tipy pro práci s Wordem Kontingenční tabulky v Excelu

DATABÁZE MS ACCESS 2010

Transkript:

Analýza staročeské morfologie v Excelu B O R I S L E H E Č K A, B O R I S @ D A L I B O R I S. C Z O D D Ě L E N Í V Ý V O J E J A Z Y K A Ú S T A V P R O J A Z Y K Č E S K Ý A V Č R L I N G V I S T I K A P R A H A 2 0 1 4 1 1. D U B N A 1 6. 0 0

Boris Lehečka boris@daliboris.cz oddělení vývoje jazyka ÚJČ AV ČR programátor s lingvistickými základy Vokabulář webový <http://vokabular.ujc.cas.cz> materiály ke stažení http://vokabular.ujc.cas.cz/informace.aspx?t=lp2014 http://bit.ly/1qmojzd

Obsah Účel analýzy deklinace staročeských apelativ časové období vzory Auditorium anketa Excel Power Query import a transformace datových zdrojů programovací jazyk

Obsah Excel PowerPivot stamiliony položek tabulky relace Kontingenční tabulky a grafy Vstupy výchozí po transformaci pomůcky Ukázka

Účel analýzy deklinace staročeských apelativ disertační práce Pavlíny Jínové časové období vzory lemmata koncovky ověření výskytu tvaru/tvarů

Anketa Kdo používá Excel? Jakou verzi Excelu? 2010 2013 jinou (např. Office 365 pro vysokoškoláky) Jakou edici Excelu? Home and Student Professional Kdo zná PowerPivot? Kdo zná Power Query? Kdo zná vertikálu? Příprava dat, nebo kontingenční tabulky/grafy v Excelu?

Vstupy Staročeská textová banka Metadata identifikátor zkratka období vzniku literární žánr atp. (podle potřeby) Vertikála poznámky = metainformace

Staročeská textová banka metadata

Staročeská textová banka Word

Vstupy Slovníky ESSČ (Přib ž, ž ch) MSS (a ž) StčS (n při) GbSlov (a netbanlivý) formát XML

Úpravy vstupů Vertikála kategorizace tokenů jazyk torzo funkce (interpunkce, číslo) relevance segmentace tokenů na fonogramy zakončení 1 3 fonogramy

Fonogram grafická jednotka korespondující s fonémem změna fonému v důsledku hláskoslovného vývoje, flexe a/nebo slovotvorby znamená změnu fonogramu m ú ch a m ú š ě m ou š e h o s t ie h o s t í d ie v k a d í v k a h o s t i e h o s t i í

Úpravy vstupů Metadata o textech výběr údajů datace časová období převod z XML na CSV Slovníky lemma slovní druh morfologická charakteristika

Úpravy vstupů nástroje C# transformace DOCX > XML XML > VERT VERT > TAB Metadata > TAB OpenRefine http://openrefine.org analýza vstupů statistiky redefinice vlastností

Excel Power Query Doplněk verze 2.10.3598.81 pro Excel 2010 a 2013 podmínky Windows Vista až Window 8.1 Office 2010 Professional Plus + SA Office 2013 Professional Plus, Office 365 ProPlus, Excel 2013 Princip import dat z různých zdrojů nový programovací jazyk není třeba řešit zabezpečení maker

Excel PowerPivot Microsoft SQL Server 2012 PowerPivot for Excel Doplněk pro Excel 2010 od Excelu 2013 je již součástí programu verze 11.0.3129.0 Podmínky Windows XP SP3 až Window 8 Office 2010 zdarma pro všechny edice v Excelu 2013 návrh pouze v edici Professional 64bitová verze (pro velké objemy dat)

Excel PowerPivot Princip stamiliony záznamů tabulky relace Nevýhody nerozlišuje velikost písmen relace M : N text!= jedinečný klíč textová data velký objem bez redukce

Excel PowerPivot Kontingenční tabulky Kontingenční grafy Průřezy

Excel doporučení Vstupní data textové soubory rychlé generování lze i v Excelu identifikátory relace tabulky v sešitě ad hoc metadata aktualizace v PowerPivotu v Excelu Import v PowerPivotu nejprve nastavit parametry, pak vybrat soubor první řádek jako názvy, až po výběru souboru

Ukázka Metadata XML TXT úpravy Textová banka Word XML TEI P5 Vertikála

PowerPivot import dat vytvoření relací počítané sloupce míry testovací data malý objem kontingenční tabulka vytváření interaktivita průřezy pro více objektů kontingenční graf vytváření interaktivita průřezy Ukázka

Ukázka Power Query vytvoření dotazu opětovné spuštění dotazu Sešit Tokeny reálná data připravené tabulky připravené grafy tabulka a graf na přání

Analýza morfologie v Excelu Plusy off-line není třeba korpusový manažer opakovatelnost (s jinými daty) ad hoc analýzy kontingenční přehledy zdarma (pro Excel 2010) Minusy příprava vstupních dat chybí kontext bez pokročilých analýz

Postupy Míry Formátování čísel Velikost písmen Identifikátory Aktualizace PowerPivot Kontingenční tabulky Propojené tabulky Power Query Soubory Průřezy