ZKUŠENOSTI S AUTOMATIZACÍ CITAČNÍ ANALÝZY NA ZAKONECHPROLIDI.CZ. Pavel Gardavský/AION CS, s.r.o

Podobné dokumenty
UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0

Ontologie. Otakar Trunda

Všem pedagogům, studentům i zaměstnancům s platnými přihlašovacími údaji do Informačního systému univerzity VŠFS.

Část 3 Manuál pro správce

Legislativní pravidla vlády (dále jen LPV ) schválená usnesením vlády ze dne 19. března 1998 č. 188, ve znění

Obsah KAPITOLA 1 Několik slov o Wordu

1. Začínáme s FrontPage

PALSTAT s.r.o. systémy řízení jakosti PALSTAT CAQ verze Kontakty 08/ Obsah

Efektivní práce s Excelem (středně pokročilí uživatelé)

OPERAČNÍ SYSTÉM. Informační a komunikační technologie

METODIKA JEDNOTNÉHO CITOVÁNÍ A TVORBY BIBLIOGRAFICKÝCH ODKAZŮ PRO NEJČASTĚJI CITOVANÉ DOKUMENTY NA VŠTE DLE ČSN ISO 690:2010

POKROČILÉ POUŽITÍ DATABÁZÍ

Jakub Klímek Zlín

Automatizovatelná aktualizace Wikidata z veřejných databází. Jakub Klímek

PMA 3 jako nástroj rozvoje českého egovernmentu

Mzdy Optimum základy ovládání

JAK POPSAT KONTROLNÍ ZJIŠTĚNÍ

ISI WEB OF SCIENCE - manuál

TECHNICKÉ POŽADAVKY NA NÁVRH, IMPLEMENTACI, PROVOZ, ÚDRŽBU A ROZVOJ INFORMAČNÍHO SYSTÉMU

Návod pro zpracování srovnávací tabulky. Název Uvede se název předpisu EU. Směrnice Evropského parlamentu a Rady 2005/1/ES...

Správnost XML dokumentu

DATABÁZE MS ACCESS 2010

Maturitní otázky z předmětu PROGRAMOVÁNÍ

Logický datový model VF XML DTM DMVS

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Jak psát Bc. resp. Mgr. závěrečnou práci. Zpracoval: Karel Bílek

Průzkumník IS DP. Návod k obsluze informačního systému o datových prvcích (IS DP) vypracovala společnost ASD Software, s. r. o.

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

NEJVYŠŠÍ SPRÁVNÍ SOUD

Zabezpečení proti SQL injection

Návrh databázového modelu

RETROBI Softwarová aplikace pro zpřístupnění digitalizované lístkové kartotéky Retrospektivní bibliografie české literatury

NLP & strojové učení

Předmluva 11 Typografická konvence použitá v knize Úvod do Excelu

Využití sociálních sítí pro komunikaci s absolventy a profesní uplatnění absolventů Petr Macek Workshop KA05, Olomouc,

GISON: ontologická integrace urbanistických datových sad IPR

Manuální anotace a sběr dat pro automatickou extrakci referencí ze soudních rozhodnutí Jakub Harašta Jaromír Šavelka

Profilová část maturitní zkoušky 2017/2018

Hlavní okno aplikace

NÁVOD NA PRÁCI S KATALOGEM CKAN. Vzniklo v rámci výzkumného grantu Sémantické propojování dat ve veřejné správě IG407011

ČÁST PRVNÍ DRUHY VNITŘNÍCH PŘEDPISŮ

POKYNY PRO ZPRACOVÁNÍ MATURITNÍ PRÁCE

MMHK & Dynamica, a.s. Eliška Dimovová & Boris Bělousov

Evropská právní informatika modul. č. 2. Pravidla správné citace EUR-Lex

PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP)

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT EU-OVK-VZ-III/2-ZÁ-210

VÝPOČETNÍ TECHNIKA OBOR: EKONOMIKA A PODNIKÁNÍ ZAMĚŘENÍ: PODNIKÁNÍ FORMA: DENNÍ STUDIUM

Výroková logika syntaxe a sémantika

Překladač a jeho struktura

Uživatelem definované požadavky a parametry systému

Typy souborů ve STATISTICA. Tento článek poslouží jako přehled hlavních typů souborů v programu

HROMADNÉ ÚPRAVY NAJÍT A NAHRADIT

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Bloky, externí reference

Tvorba WWW stránek. Mojmír Volf

REFERÁT. Výklad: Co je referát? Jak napsat referát?

1. KONSTRUKČNÍ KUSOVNÍK... 3

Základy XML struktura dokumentu (včetně testových otázek)

FUNKCE 3. Autor: Mgr. Dana Kaprálová. Datum (období) tvorby: září, říjen Ročník: sedmý. Vzdělávací oblast: Informatika a výpočetní technika

Kódování vzácných onemocnění v MKN-11

Úvodem 9. Zpětná vazba od čtenářů 10 Zdrojové kódy ke knize 10 Errata 10. Než začneme 11

soubor dat uspořádaných do řádků a sloupců

Základní informace o modulu

Metodický manuál pro vypracování seminární práce

Uţivatelská příručka pro webový formulář vývozního šetření s dostupnosti z internetu

Úvod. Klíčové vlastnosti. Jednoduchá obsluha

Níže uvedená tabulka obsahuje technické údaje a omezení aplikace Excel (viz také článek Technické údaje a omezení aplikace Excel (2007).

Pravidla pro formální úpravu textu seminárních prací

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MS Access složitější konverze dat Ing. Kotásek Jaroslav

Návrh technických pravidel pro tvorbu SIP

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Příklady citace zdrojů multimediálních prvků v ODZ

Registr práv a povinností. Metodika pro definici údajů vedených v agendě

Profilová část maturitní zkoušky 2013/2014

Algoritmizace prostorových úloh

Popis. Manuál Klávesové zkratky a příkazy - 1 -

Několik rad pro psaní článku na Wikipedii

Výměnný formát XML DTM DMVS PK

Microsoft Access tvorba databáze jednoduše

Formální úprava závěrečných prací - SOU

Jazyk C++ II. STL knihovna kontejnery část 2

Analýza a prezentace dat

Formát Vysvětlení Poznámka číslic číslo PESEL číslic daňové identifikační číslo

Příprava dat v softwaru Statistica

DUM 4 téma: Základní registry

PARLAMENT ČESKÉ REPUBLIKY Poslanecká sněmovna 2009 V. volební období. Návrh. poslance Miroslava Kalouska a dalších.

EBSCO. Poklikneme na možnost EBSCOhost Web. Vybereme (poklepeme, zaškrtneme) databázi, s kterou chceme pracovat.

Úvod 1 ČÁST 1 HTML 1 Základy HTML a kaskádových stylů 5

Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT

BMOF011 Aplikace MS Office. Word 2016 Lekce 4 Bibliografie. Matěj Karolyi IBA LF MU,

RELAČNÍ DATABÁZE ACCESS

DUM 12 téma: Příkazy pro tvorbu databáze

Vstupní požadavky, doporučení a metodické pokyny

Kontrolní hlášení DPH (CZ) od verze Klient 5.12.a

Parlament se usnesl na tomto zákoně České republiky: 8 ) 189 občanského zákoníku..

Editor dat povodňového plánu

Unární je také spojka negace. pro je operace binární - příkladem může být funkce se signaturou. Binární je velká většina logických spojek

Aplikace pro srovna ní cen povinne ho ruc ení

Petr Souček Český úřad zeměměřický a katastrální

Transkript:

1 ZKUŠENOSTI S AUTOMATIZACÍ CITAČNÍ ANALÝZY NA ZAKONECHPROLIDI.CZ 21.9.2017 ČPIT 2017 Pavel Gardavský/AION CS, s.r.o

O čem budu mluvit? 2 ZPL a citační analýza, typy, čísla, příklady Principy trochu podrobněji Výhled dalšího využití citační analýzy do budoucna Drobné překvapení na závěr

Zákony pro lidi a citační analýza 3 strojově prováděná citační analýza je pro ZPL jedním ze základních stavebních kamenů prostřednictvím citační analýzy lokalizujeme sémantické entity podle předem daných pravidel pro lokalizované sémantické entity nalézáme cíle používáme při vyhledávání tvoříme dvojice zdroj cíl, propojujeme je obousměrnými vazbami, které navenek vypadají jako odkazy postupujeme (až na výjimky) automaticky

2 detaily 4 1. Fragmentální datový model Princip 1. rozklad předpisů na fragmenty Princip 2. skládání fragmentů do hierarchií předpisů Princip 3. asociační vazby Princip 4. konsolidační vazby 2. Vše je zapsáno v databázi jednotlivé fragmenty hierarchie fragmentů různé typy vazeb

Pár čísel 5 externí odkazy odkazy na celé předpisy 338.291 unikátních 1.629.423 přes všechna znění odkazy na celé předpisy ve znění 149.223 unikátních 800.802 přes všechna znění odkazy na části jiných předpisů 128.785 unikátních 608.972 přes všechna znění odkazy prováděcích předpisů 15.093 unikátních 44.952 přes všechna znění interní odkazy 339.261 unikátních 2.329.362 přes všechna znění odkazy na EUR-Lex 52.928 unikátních 212.684 přes všechna znění

6 Pár příkladů Externí odkazy: Poznámky pod čarou Zákoníku práce 262/2006 Sb. Záložka Souvislosti Interní odkazy: zakonyprolidi.cz/cs/2006-262#p363 Využití citační analýzy při hledání Kuriozita skript analýzy citací nad EUR-Lexem

7 Podrobněji Dvoufázový systém propojování sémantických entit 1. Extrakce entit (= lokalizace a označkování) předpis (89/2012 Sb., daňový řád,..) ustanovení ( 1 bod 2, 1 až 5,..) paragraf, článek, hlava, odstavec, písmeno, bod, věta, část, kapitola,.. instituce (vláda, ministerstvo spravedlnosti, Česká národní rada,...) typ (zákon, vyhláška, opatření,..) datumy 2. Identifikace vztahů zdroj cíl (= nalezení cíle) výsledkem je změna textu na prokliknutelný odkaz zápis oboustranné vazby určení časového řezu zákona ve znění ( zákon 89/2012 ve znění novely 298/2016 Sb. ve znění od 1.1.2012 ) je třeba zjistit účinnost zdrojového ustanovení vyřešení mnohoznačností textových citací zákonů ( Občanský zákoník - 40/1964 Sb. vs. 89/2012 Sb.) identifikace ustanovení v časovém řezu cílového zákona

8 A ještě podrobněji 1. fáze: Extrakce entit schopnost identifikovat posloupnosti citovaných ustanovení 1, 3 písm. a), 5 odst. 1 a 2, 10 rozsahy citovaných ustanovení 1-5, Hlava X až XV, 5 a násl. dynamicky řízené pravidla editory kontrolované zkratky zákonů TrZ, NOZ kombinace předcházejících 1 písm. b) až c), 2, 4, 6-9 a 15 TrZ posloupnosti předpisů obsluha sekvence ve znění

9 A ještě podrobněji 2. fáze Identifikace předpisů a ustanovení context aware system analýza určení vztahů bere v potaz stromovou sktrukturu zdrojového textu odkazy na předcházející odstavce (chybí kompletní jednoznačná sémantická adresa citovaného ustanovení: 1 odstavec 3 vs. odstavec 3 ) rozsahy typu 1 a násl. (stromová struktura cíle) identifikace citací tohoto zákona, identifikace definovaných zkratek v textu 89/2012 (dále jen zákon )

10 A úplně nejpodrobněji: Podstata věci extraktor entit řízený vlastním regex enginem možnost definice kombinací (vnořování) předešle pojmenovaných výrazů vnořené části 2 odstavec 3 písmeno a) až odstavec 4 písmeno d) sada výrazů pro písmena je znovupoužitelná pro jiné výrazy (odstavce, paragraf) možnost vlastních maker pro detekci schopnost extraktoru správně interpretovat numerické, slovní a římská čísla datumy v libovolném formátu (číselné a slovní vyjádření jednotlivých složek)

A kudy dál s citační analýzou na ZPL? 11 Především analyzovat další dokumenty soudní rozhodnutí podle stále zelených principů popsaných panem Mgr. Jaromírem Šavelkou před několika lety na JinémPrávu jak to bude vypadat: 52 písm. c) zákona č. 262/2006 Sb. zákoník práce

Překvapení... 12 Dnes zprovozněna na počest ČPIT nová funkčnost ZPL Monitor změn sledování práce našich zákonodárců informace na stříbrném podnose

13 Have a wonderful Friday & weekend!