Automatická detekce emocí v textu

Podobné dokumenty
Automatická detekce emocí v textu

Postojová modalita a možnosti automatické extrakce emocionality z psaného textu

Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami. reg. č.: CZ.1.07/2.2.00/

Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,

NLP & strojové učení

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Počítačová lingvistika v praxi Pavel Ševeček, Tomáš Pavelek

Forenzní lingvistika. jazykověda ve službách vyšetřování

Automatická post-editace výstupů frázového strojového překladu (Depfix)

Popis morfologických značek poziční systém

Využití korpusu InterCorp při vytváření ručních pravidel pro automatickou detekci pleonastického it a jeho českých ekvivalentů v závislostních datech

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

SSOS_CJL_5.13. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Číslo a název projektu Číslo a název šablony

Školní vzdělávací program Základní školy a mateřské školy Sdružení

Sociální síť. = propojená skupina lidí na internetu

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

VĚTNÉ ČLENY. Mgr. Jiří Ondra Procvičení základních pojmů a kategorií z oblasti české skladby. Zdokonalování jazykových vědomostí a dovedností

SLOVNÍ DRUHY. Vytvořeno dne: druhů, vymezuje tři základní kritéria členění. Závěr prezentace slouží k procvičení osvojených poznatků.

Učebnice, cvičebnice, CD-Rom, audio CD a DVD, počítačová učebna, dataprojektor, mapy anglicky mluvících zemí, slovník, interaktivní tabule

Přípravné kurzy k nové maturitě německý jazyk /vyšší úroveň/ Obsahem každé lekce bude nácvik:

7. ročník. Český jazyk a literatura. Komunikační a slohová výchova. Vypravování uspořádání dějových prvků

SADA VY_32_INOVACE_CJ1

Učební plán (sylabus) pro intenzivní kurz úroveň A1.1.B začátečníci 1/4 - pomalý kurz (40 vyučovacích hodin)

Automatické vyhledávání informace a znalosti v elektronických textových datech

Vzdělávací obsah vyučovacího předmětu

Obsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1

DIGITÁLNÍ ARCHIV VZDĚLÁVACÍCH MATERIÁLŮ

Filozofická fakulta. Compiled Jan 21, :48:06 PM by Document Globe 1

Anglický jazyk základní úroveň obtížnosti. obsahem lekcí bude nácvik jednotlivých dovedností a typů úloh:

Data Science projekty v telekomunikační společnosti

Oddíl E učební osnovy VI.1.B LATINA

Dolování z textu. Martin Vítek

Kvantitativní analýza žánrů. Radek Čech & Miroslav Kubát

Očekávané výstupy z RVP Učivo Přesahy a vazby Dokáže pracovat se základními obecné poučení o jazyce (jazykové příručky)

Anglický jazyk vyšší úroveň. obsahem lekcí bude nácvik jednotlivých dovedností a typů úloh:

Přípravné kurzy k nové maturitě německý jazyk /základní úroveň/

OPAKOVÁNÍ SLOHOVÝCH ÚTVARŮ I. Tento výukový materiál vznikl za přispění Evropské unie, státního rozpočtu ČR a Středočeského kraje

Jak pracuje internetový vyhledávač

MARKETING STRAVOVACÍHO ÚSEKU. Mgr. Kateřina Bogdanovičová Ph.D., MBA

Vytěžování znalostí z dat

Vzdělávací obsah vyučovacího předmětu

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

ve strojovém překladu

Tematický plán pro školní rok 2015/2016 Předmět: Český jazyk Vyučující: Mgr. Jitka Vlčková Týdenní dotace hodin: 8 hodin Ročník: čtvrtý

Dobývání znalostí z textů text mining

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

Tematický plán učiva. Předmět : Český jazyk a literatura Školní rok : Třída-ročník : 4. Vyučující : Věra Ondrová

učebnice, cvičebnice, CD-Rom, počítačová učebna, dataprojektor, interaktivní tabule, mapy anglicky mluvících zemí, slovník

Strojové učení Marta Vomlelová

Softwarová analýza dat z monitoringu internetových diskusí: Cesta do pekel

DATA SUPPORT READER S LOYALTY CONSUMER GUIDE

Učební plán (sylabus) pro intenzivní kurz úroveň B1.3.B středně pokročilí 3 pomalý kurz (40 vyučovacích jednotek)

IV. Gramatika A. Tvarosloví 1. Slovní druhy

Akustické aplikace pro IB

TVORBA A REALIZACE VEŘEJNÉ POLITIKY KOMUNIKACE A KOMUNIKAČNÍ PROCESY

Očekávané výstupy z RVP Učivo Přesahy a vazby. zvuková stránka jazyka (spisovná a nespisovná výslovnost)

Mgr. Jaroslava Kholová. Období tvorby Listopad- prosinec Střední vzdělání s MZ, nástavbové studium, 2. ročník. oblast

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Předmět: Český jazyk. čtení plynulé, tiché, hlasité, s porozuměním. nadpis, osnova vypravování, popis s dodržením časové posloupnosti

Příruční mluvnice češtiny. 2. vyd., Praha: Lidové noviny, s. ISBN

Inovace CRM systémů využitím internetových zdrojů dat pro malé a střední podniky. Ing. Jan Ministr, Ph.D.

III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT. Žák se seznámí se základními pojmy morfologie tvarosloví, ohebnost, význam slov.

Název materiálu: Jazykové rozbory

1 Vzdělávací oblast: Jazyk a jazyková komunikace 2 Vzdělávací obor: Cizí jazyk 3 Vzdělávací předmět: Anglický jazyk 4 Ročník:

Využití sociálních sítí v náboru zaměstnanců

Předmět: Český jazyk a literatura

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Český jazyk Ročník: 7. Průřezová témata Mezipředmětové vztahy.

Projekt: ŠKOLA RADOSTI, ŠKOLA KVALITY Registrační číslo projektu: CZ.1.07/1.4.00/ EU PENÍZE ŠKOLÁM

Vzdělávací oblast: Jazyk a jazyková komunikace Vyučovací předmět: Anglický jazyk Ročník: 8. Průřezová témata Mezipředmětové vztahy.

Jak lze v korpusech hledat doklady pro výzkum morfologie?

OBSAH SEZNAM TERMÍNŮ, ZKRTATEK A ZNAČEK POUŽÍVANÝCH V UČEBNICI POSTAVY PŘÍBĚHU 3 LEKCE 1 STUDIUM JAZYKŮ 8 LEKCE 2 LIDSKÁ KOMUNIKACE 42.

JAZYKOVÁ VÝCHOVA. Tvarosloví. Pravopis. Jazyk a jazyková komunikace - Český jazyk - 7. ročník. POZNÁMKY (průřezová témata, mezipředmětové vztahy)

Gramatika. Přítomný čas prostý a průběhový. Minulý čas prostý pravidelných i nepravidelných sloves. Počitatelná a nepočitatelná podstatná jména

KORPUSOVÝ WORKSHOP. Václav Cvrček, Lucie Chlumská Univerzita Karlova v Praze VŠE, CO JSTE CHTĚLI VĚDĚT O KORPUSU, A BÁLI JSTE SE ZEPTAT!

LATINA. V rámci gymnaziálního vzdělání přispívá předmět Latina k utváření a rozvíjení klíčových kompetencí t těmito metodami:

Gramatika. Minulý čas prostý. Minulý čas průběhový. Předpřítomný čas. Podmínkové věty typ I. Modální slovesa. Vyjadřování budoucnosti

návštěvy divadelních a filmových představení

Jazyková výchova Párové souhlásky. Opakování párových souhlásek na konci slov. Párové souhlásky uvnitř slov. Abeceda ČaJs. Slovo

VEDLEJŠÍ VĚTY 3 Autor: Katka Česalová Datum: Cílový ročník: ročník

Webová analytika v kostce. Pavel Jašek Marketing Monday 7. listopadu 2011

Příklad rozpracování minimální doporučené úrovně pro úpravu. očekávaných výstupů v rámci podpůrných opatření. do učebních osnov vyučovacího předmětu

Využití metod strojového učení v bioinformatice David Hoksza

Český jazyk pro 7. ročník

Specializované korpusy mluveného jazyka - jejich tvorba a využití

Vyučovací předmět: Český jazyk a literatura Ročník: 9. Školní výstupy

ANALÝZA SENTIMENTU S VYUŽITÍM DOLOVÁNÍ DAT SENTIMENT ANALYSIS WITH USE OF DATA MINING

Jak přetavit data v hodnotné informace, které nesou peníze

RVP ŠVP UČIVO - rozlišuje a příklady v textu dokládá nejdůležitější způsoby obohacování slovní zásoby a zásady tvoření českých slov

Propojení světa online a kamenných prodejen Retail News, Praha,

Dolování asociačních pravidel

Český jazyk a literatura

VELETRH: ÚČINNÝ MARKETINGOVÝ a OBCHODNÍ NÁSTROJ

Zjišťování požadavků zákazníka. Jana Hamanová, SC&C s.r.o.

Úvod do sociálních sítí

Marketingový výzkum 10. Výzkum spokojenosti Analýza image

Jazyk a jazyková komunikace Český jazyk

Mobilní telefon v roli komunikačního a reklamního prostředku

Transkript:

Automatická detekce emocí v textu Kateřina Veselovská veselovska@ufal.mff.cuni.cz New Media Inspiration, Praha 21. 2. 2015

Informace v textu objektivní fakta subjektivní názory pocity domněnky pozitivní či negativní hodnocení atd.

Informace v textu objektivní fakta subjektivní názory pocity domněnky pozitivní či negativní hodnocení atd.

Informace v textu rozvoj Webu 2.0 obsah generovaný uživateli potřeba automatického třídění informací

K čemu je to dobré? Postojová analýza (sentiment analysis) automatická extrakce názorů a postojů z textu a řeči = co si vlastně lidé myslí

Postojová analýza automatická extrakce názorů a postojů z textu a řeči = co si vlastně lidé myslí

Postojová analýza binární úloha nebo ordinální škála: - líbí x nelíbí -

K čemu je to dobré? hodnocení produktů průzkum veřejného mínění monitoring sociálních sítí intenční analýza forenzní lingvistika predikace trendů v marketingu predikace výsledků voleb

K čemu je to dobré? potenciální zákazník názory a komentáře jiných uživatel sdílení zkušeností obchodník zpětná vazba

Jak se to dělá? Nerezový vejcovar Steba má vyměnitelné pláty pro volská oka. vs. Krásný nerezový vejcovar Steba je i u netrpělivých zákazníků velmi oblíben.

Jak se to dělá? Nerezový vejcovar Steba má vyměnitelné pláty pro volská oka. vs. [Krásný nerezový vejcovar Steba je i u netrpělivých zákazníků velmi oblíben.]+

Jak se to dělá? Nerezový vejcovar Steba má vyměnitelné pláty pro volská oka. vs. [Krásný nerezový vejcovar Steba je i u netrpělivých zákazníků velmi oblíben.]+ = hlasování prostou většinou

Czech Sublex 1.0

Czech Sublex 1.0 překlad části MPQA korpusu přes paralelní korpus CzEng 1954 substantiv 1698 sloves 819 adjektiv 465 adverbií 4936 hodnotících slov přístupný ze stránek www.ufal.cz/sentiment

Jak se to dělá? metody kvantitativní lingvistiky (tematická koncentrace) unsupervised learning - Turneyův třístupňový algoritmus (využití PMI) supervised learning - support vector machines - maximální entropie - slovníkové klasifikátory - Naivní Bayesův klasifikátor

Naivní Bayes velké množství trénovacích dat (csfd.cz, mall.cz ) preprocessing: spell-checking lemmatizace desambiguace morfologie parsing

Naivní Bayes feature: přítomnost lemmatu v daném segmentu odhaduje predikační sílu lemmatu vzhledem k polaritě trénování = budování slovníku všech přítomných lemmat a jejich predikačních sil

Naivní Bayes filtrování - podle slovních druhů - na základě frekvence - zohlednění jazyka emocí emocí v jazyce

Jazyk emocí

Jazyk emocí

Jazyk emocí emotikony :-) :-D :-P ;-) >:-[ :-/ :-( výrazná interpunkce!!!!!!!??????????!!!!!! opakování znaků: Supeeeeeeeeer! důraz pomocí kapitálek: Je to prostě BOŽÍ! vytýkání: Tenhle vejcovar nade všechno *miluju* nové pojetí vulgarismů: KUA

Jazyk emocí

Jazyk emocí augmentativa (barabizna) deminutiva (mimísek) eufemismy (okrasný tukový prstenec x špek) vulgarismy (@#%$!!) evaluativní frazémy a idiomy pojmenované entity

Jazyk emocí za málo peněz hodně muziky mít se jako prase v žitě cítit se jako nahý v trní stát za houby být příjemný jako osina v zadku jít jako po másle být šťastný jako blecha tvářil se, jako by mu uletěly včely má to své mouchy lepší než drátem do oka

Emoce v jazyce moderátorka Jolka Krásná obec Krásná karpatský hřeben Krásná polonina zemědělské družstvo Krásná Hora nad Vltavou bar/pořad Krásný ztráty časopis Krásná a zdravá lunární kalendář Krásné paní píseň Krásná je Neapol poéma Krásná Poldi román Cizinec a krásná paní film Život je krásný soutěž Věda je krásná

Jazyk emocí Jeho styl mi nic neříká, neoslovuje mě. Poezii (já) miluju, ale Šrámek ani náhodou. Ve škole na něj češtinářka pěla ódy, tak mě to zajímalo, jestli je (on) fakt tak dobrej, chtěla jsem přečíst i něco jinýho než Splav, ale neshledala jsem (já) v jeho díle nic obdivuhodného, takže (já) fakt nechápu tu všeobecnou glorifikaci. zdroj Zdroj: http://www.zpovednice.cz diskuse k básni Splav

Jazyk emocí Jeho styl mi nic neříká, neoslovuje mě. Poezii (já) miluju, ale Šrámek ani náhodou. Ve škole na něj češtinářka pěla ódy, tak mě to zajímalo, jestli je (on) fakt tak dobrej, chtěla jsem přečíst i něco jinýho než Splav, ale neshledala jsem (já) v jeho díle nic obdivuhodného, takže (já) fakt nechápu tu všeobecnou glorifikaci. zdroj cíl Zdroj: http://www.zpovednice.cz diskuse k básni Splav

Jazyk emocí Jeho styl mi nic neříká, neoslovuje mě. Poezii (já) miluju, ale Šrámek ani náhodou. Ve škole na něj češtinářka pěla ódy, tak mě to zajímalo, jestli je (on) fakt tak dobrej, chtěla jsem přečíst i něco jinýho než Splav, ale neshledala jsem (já) v jeho díle nic obdivuhodného, takže (já) fakt nechápu tu všeobecnou glorifikaci. zdroj cíl hodnocení Zdroj: http://www.zpovednice.cz diskuse k básni Splav

Emoce v jazyce plnovýznamové slovní druhy s výjimkou zájmen a číslovek evaluativní částice citoslovce

Emoce v jazyce důležitost desambiguace Dobře, já to udělám. Zachoval se dobře.

Emoce v jazyce důležitost slovesa zdroj hodnocení cíl agens predikát patiens

Emoce v jazyce slovesa osobního mínění myslet, domnívat se, předpokládat, pohlížet na

Emoce v jazyce explicitní hodnocení vyjádření citového stavu nesouhlasit s, nesnášet, chválit, zbožňovat

Emoce v jazyce explicitní hodnocení vyjádření citového stavu nesouhlasit s, nesnášet, chválit, zbožňovat [Toho hrdopýška všichni nesnášejí.] [Toho hrdopýška všichni chválí.] +

Emoce v jazyce explicitní hodnocení vyjádření citového stavu nesouhlasit s, nesnášet, chválit, zbožňovat [Toho hrdopýška všichni nesnášejí.] [Toho hrdopýška všichni chválí.] + hodnotící sloveso má větší indikační sílu než hodnotící substantivum

Emoce v jazyce důležitost částic [Bohudík toho hrdopýška všichni nesnášejí.] + [Bohužel toho hrdopýška všichni chválí.] - emocionální částice má větší indikační sílu než evaluativní sloveso - chválabohu, naštěstí, zaplať pánbůh

Emoce v jazyce důležitost adjektiv [Bylo to příjemné nedorozumění.] + hodnotící adjektivum má větší indikační sílu než hodnotící substantivum

Emoce v jazyce pragmatická odbočka: ironie Byl to hrdinný chlípník. Byl to chlípný hrdina.

Emoce v jazyce intenzifikátory [Ještě si pamatuju, že to kafe bylo strašně dobrý.] +

Emoce v jazyce důležitost negace - obrací větnou polaritu [Jídlo nebylo dobré.]

Emoce v jazyce důležitost spojky ale adverzativní koordinace [Pláž byla hrozná]-, ale [v hotelu se nám líbilo.]+

Emoce v jazyce přípustkové spojky přestože, ačkoliv, jakkoliv, byť, i když Přestože příjezd nesplnil všechna jeho očekávání, leccos ho potěšilo.

Emoce v jazyce hodnocení je často závislé na doméně: chytrý telefon x chytrý zásah litvínovského útočníka tichý vysavač x tichý detektor kouře Go read the book!

Emoce v jazyce Rubbish hotel in Madrid

Jakou to má úspěšnost? nejlepší dosažená přesnost: 89% (trénovací data z Mall.cz)

Jaké to má aplikace? Customer churn analysis: Blahopřeju vám k anti-péči o zákazníka. Jsem u vás od roku 2002 a jediné co mi umíte nabídnout jsou běžné a stále dost nevýhodné tarify. Člověk si aspoň uvědomí, jak moc potřebujeme Evropskou unii (jejíž instituce jako jediná z relevantních subjektů tlačí ceny dolů). Po špatných zkušenostech hodlám přejít ke konkurenci.

Jaké to má aplikace? Customer loyalty analysis Produkt této společnosti používám na několika PC už několik let a zatím jsem neobjevil žádné vady. Vzhledem k mé naprosté spokojenosti ani do budoucna nehodlám nic měnit.

Jaké to má aplikace? Customer risk analysis detekce lži: kratší věty, krátká slova, více výrazů vyjadřujících pozitivní emoce (+ další dimenze) detekce spamu, detekce falešných profilů, výhružných e-mailů aj.

Jaké to má aplikace? Customer feedback analysis Koupit si tento fotoaparát a spoléhat na jméno firmy se mi vůbec nevyplatilo. Např. proti mému stařičkému fotoaparátu je toto naprostý propadák. Průměrný telefon s fotoaparátem udělá stejné, ne-li lepší fotografie. Ani komunikace s centrem podpory nestojí za nic. Výrobek mě zklamal a víckrát už si žádný produkt této firmy bezpochyby nekoupím. cílený marketing

Jaké to má aplikace? personalizovaný marketing, individuální interakce

Jaké to má aplikace? http://twittersentiment.appspot.com/

http://socialmention.com/ Jaké to má aplikace?

Jaké to má aplikace? Zdroj: http://www.yeseter.com

Jaké to má aplikace? Zdroj: http://www.semantic-visions.com/

Jaké to má aplikace?

Jaké to má aplikace?

Jakou to má budoucnost? lepší preprocessing: pojmenované entity spell-checking (vulgarismy apod.) automatická identifikace cílů doménově závislé výrazy analýza mluvených dat psycholingvistické experimenty

*Děkuji* za pozornost!! www.ufal.cz/~veselovska