Jaroslav Moravec 207912@mail.muni.cz
Obsah Tvorba dat pro korpus Chyby Klasifikace chyb Vnořené a překrývající se opravy Způsob zaznamenání opravy OpenOffice.org Corr OOCorr OOCorr GUI a instalace OOCorr vyznačení opravy OOCorr editace a rušení opravy OOCorr příprava k odevzdání, tisk Závěr
Tvorba dat pro korpus Chyby
Klasifikace chyb požadavek na možné aktualizace klasifikace chyb Závislosti na klasifikaci chyb: délka vyznačovaného textu výskyt překrývajících se chyb/oprav Implementace XML souboru struktura XML popsaná ve Scheme změna klasifikace chyb v nastavení aplikace
Vnořené a překrývající se chyby Pro možný výskyt překrývajících se chyb byla dříve xml značka implementována jako nepárová s atributem words Atribut words označuje počet slov nového opraveného textu slovo nebylo/není jednoznačně definováno problémy při zpětné rekonstrukci textu pokus o implementaci pomocí tokenizeru unitok.py problém s mezerami v textu
Způsob zaznamenání opravy errtype typ chyby corrtype typ opravy old text s chybou před opravou opravený text words doposud i počet slov Nepárová XML Značka <corr errtype= str corrtype= str words= int old= str />opravený text Párová XML Značka <corr errtype= str corrtype= str old= str >opravený text</corr> str textový řetězec, int celé číslo
OpenOffice.org Corr, název OOCorr multiplatformní (implementace v Javě) práce s více formáty:.odt,.rtf,.doc,.docx aktualizovatelná klasifikace chyb vnořené chyby žádné typografické změny textu při editaci (viz. WinCorr) přímá editace textu pro opravení delší části snadný export dat do XML/HTML lokalizace v českém a anglickém jazyce nutnost mít nainstalovaný OpenOffice.org zatím nepodporuje zdrojové soubory TeXu
OOCorr GUI a instalace jednoduchá instalace (ukázka) snadné použití a vyznačení chyb pomocí intuitivního GUI
OOCorr Zanesení opravy využití stylů a vlastnosti textu hidden (skryté) podpora v běžných formátech textových dokumentů 1. vyznačení rozsahu chyby 2. kliknutí na ikonu opravy 3. určení druhu chyby 4. vepsání nového textu 5. určení typu opravy
OOCorr Editace a rušení opravy Postup (ukázka) 1. kliknutí dovnitř opravy 2. stisknutí tlačítka úpravy opravy nebo zrušení opravy Úprava opravy Postup je stejný jako při vytváření opravy od bodu 3 Zrušení opravy zobrazení dialogového okna zobrazující všechny rušené opravy možnost upravit pouze opravu bez vnořených oprav nemožnost rušení vnější opravy bez zrušení vnitřní opravy
OOCorr Příprava k odevzdání, tisk dokumenty se tisknou pro odevzdání k opravě tisk černobílý nutnost odbarvení oprav (ukázka) využití změny stylů oprav (změna barvy na černou) Postup stisknutí tlačítka vypnout/zapnout nutná aktualizace vykreslení stránky zatím nezajištěno, obejití pomocí zobrazení a skrytí netisknutelných znaků, ikona se znakem
Závěr nasazení příští týden (včetně nové klasifikace chyb) příručka pro používaní OOCorru hlášení chyb (bug report) na webu projektu web projektu: http://nlp.fi.muni.cz/projekty/oocorr e-mail podpory: 207912@mail.muni.cz
Děkuji za pozornost. Jaroslav Moravec 207912@mail.muni.cz