IBM SPSS Modeler Professional



Podobné dokumenty
IBM SPSS Modeler Premium

IBM SPSS Modeler. Hlavní přínosy. Intuitivní ovládání IBM

IBM SPSS Decision Trees

Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků.

Profitabilita klienta v kontextu Performance management

Příprava dat v softwaru Statistica

STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

Datová věda (Data Science) akademický navazující magisterský program

Moderní systémy pro získávání znalostí z informací a dat

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

Cíle supervizovaného učení Ondřej Háva

Úvodem Dříve les než stromy 3 Operace s maticemi

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Business Intelligence

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

Business Intelligence nástroje a plánování

Bayesovská statistika. Syntax editor. Vylepšení grafiky. Přidáno ve verzi 24. IBM SPSS Statistics. IBM Software Business Analytics

Základy business intelligence. Jaroslav Šmarda

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR

PRODUKTY. Tovek Tools

IBM Cognos Express. Hlavní přínosy. IBM Cognos Express. IBM Software. Business Analytics

IBM SPSS Reports for Surveys

IBM SPSS Neural Networks

Stručný obsah. K2118.indd :15:27

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Novinky IBM SPSS Statistics

ELO Analytics Vaše obchodní metriky na jednom místě. Vaše obchodní metriky na jednom místě. Enterprise Content Management

Vzdělávací obsah vyučovacího předmětu

1 Úvod 1.1 Vlastnosti programového vybavení (SW)

Jádrem systému je modul GSFrameWork, který je poskytovatelem zejména těchto služeb:

Role BI v e-business řešeních pohled do budoucnosti

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Obohacení dat o statistické výsledky a potenciál jejich využití

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Wonderware Information Server 4.0 Co je nového

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Pokročilé neparametrické metody. Klára Kubošová

Geografické informační systémy ArcGIS Pavel Juška (jus011) 4. března 2010, Ostrava

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

UDS for ELO. Univerzální datové rozhraní. >> UDS - Universal Data Source

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

Získávání dat z databází 1 DMINA 2010

Infor Performance management. Jakub Urbášek

Snadný a efektivní přístup k informacím

Pořízení licencí statistického SW

Inteligentní řízení strojů s portfoliem u-mation Řešení pro automatizaci a digitalizaci Let s connect. Automatizace a digitalizace

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

PRODUKTY. Tovek Tools

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Informační systémy 2006/2007

Strojové učení Marta Vomlelová

UČENÍ BEZ UČITELE. Václav Hlaváč

Moderní metody automatizace a hodnocení marketingových kampaní

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

Microsoft Access tvorba databáze jednoduše

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Analýzou dat k efektivnějšímu rozhodování

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

MBI - technologická realizace modelu

Snažší používání. > Prostředí pro mobilní zařízení. > Vylepšení uživatelského komfortu. > Zjednodušení práce. > Integrace Office 365

IBM SPSS Direct Marketing

Softwarová podpora v procesním řízení

Data mining. Letní semestr. únor červen Ondřej Brom lektor, analytik, konzultant spoluautor knihy SPSS Praktická analýza dat

SyMAP. systém majetkoprávní přípravy staveb

Business Intelligence

Aktuální otázky provozu datových skladů PAVEL HNÍK

SW pro správu a řízení bezpečnosti

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

5. Umělé neuronové sítě. Neuronové sítě

Jak úspěšně bojovat s ekonomickou krizí pomocí CI

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Novinky IBM SPSS Statistics

Představuje. Technický Informační Systém nové generace

Uživatelská podpora v prostředí WWW

Novinky IBM SPSS Statistics

PowerOPTI Řízení účinnosti tepelného cyklu

Získávání znalostí z databází. Alois Kužela

Software pro analýzu dat VERZE 8 NOVINKY. Buďte lepším auditorem. Vy máte znalosti. My máme nástroje.

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Připravte se na konjunkturu se systémem řízení údržby SGM. SGM moderní nástroj pro řízení údržby nejen výrobních zařízení

Algoritmy a struktury neuropočítačů ASN - P11

STATISTICA 10. Nové funkce a vylepšení. Obsah

Trendy: Růst významu analytického reportingu. Tomáš Pospíšil, Oracle Czech Olomouc,

powerful SAP-Solutions

Projektové řízení jako základ řízení organizace

HR reporting aneb kouzla s daty Jan Pavelka

Optimalizaci aplikací. Ing. Martin Pavlica

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Software pro analýzu energetických dat W1000

Transkript:

IBM SPSS Modeler Professional 16 IBM SPSS Software IBM SPSS Modeler Professional Včasné rozhodnutí díky přesným informacím Metodami data miningu získáte detailní přehled o svém současném stavu i jasnější pohled na budoucnost. Vaše společnost může s IBM SPSS Modeler Professional provádět sofistikovaný data mining a využívat stále rostoucí a komplexnější data k hlubšímu pochopení Vašich klientů nebo zaměstnanců. Ucelený program obsahuje nástroje pro porozumění datům, jejich přípravu a modelování. Můžete tak provádět včasná a přesná obchodní rozhodnutí. Společnosti řeší pomocí nástrojů data miningu rozsáhlou škálu úloh, mohou jimi například být získávání nových zákazníků, posilování jejich loajality, retence zákazníků či detekce podvodného chování. Ve veřejném sektoru se IBM SPSS Modeler používá pro předpověď budoucího vývoje, prevenci kriminality a prevenci poškození veřejného majetku, při řízení akademických institucí a obecně v situacích, kdy je třeba provádět rozhodnutí. Hlavní přínosy snadný přístup k datům v datových skladech, databázích, Hadoop distribucích či samotných souborech příprava a modelování v intuitivním grafickém rozhraní rychlé odvození a ověření modelů pokročilými statistickými a modelovacími metodami efektivní nasazení predikčních a analytických modelů přístup k základním i komplexním analytickým metodám v rámci jediné platformy

Zjednodušení dataminingového procesu IBM SPSS Modeler Professional je populární u analytiků, ale i u ostatních uživatelů. S automatizovanou přípravou dat a modelováním může i uživatel bez analytických zkušeností a příslušné specializace rychle vytvořit přesné modely. Profesionální a zkušení analytici využijí k přípravě dat a modelování vizuálního programování ve formě proudů. V intuitivním grafickém rozhraní IBM SPSS Modeler je vizualizován každý krok dataminingového procesu. Odborníci a specialisté mohou na těchto proudech spolupracovat a rychle tak přidat své znalosti a zkušenosti z obchodních procesů do celého projektu. Konstrukce proudů ve formě vizuálního programování umožňuje lépe se zaměřit na samotnou úlohu než na technické psaní programovacího kódu. Výhody pro organizace IBM SPSS Modeler Professional využijí všechny typy organizací, které provádějí hloubkové analýzy, a mohou tak dosáhnout větších úspěchů. Podnikatelé mohou přilákat nové zákazníky, posílit jejich loajalitu a zabránit jejich odchodu. Dále mohou detekovat podvodné chování a snížit riziko podnikání. Ve veřejném sektoru lze předpovídat ukazatele, vyhodnotit efektivitu sociálních programů a reagovat na bezpečností rizika. Vzdělávací instituce mohou sledovat výsledky svých studentů, dosáhnout vyšší efektivity ve vzdělávání a použít jej pro samotnou výuku nebo akademické projekty. V průmyslových odvětvích lze vhodně plánovat údržbu a zabránit tak havarijním stavům. Jednoduchý přístup a integrace dat V přehledném vizuálním rozhraní můžete snadno přistoupit k databázím, tabulkám a souborům. Mezi podporované formáty patří například standardní formáty IBM SPSS Statistics, IBM SPSS Data Collection, Cognos Business Intelligence, SAS a Microsoft Excel. Po kombinaci s IBM SPSS Modeler Professional Server již není potřeba přesouvat data z velkých databází, jelikož modelování a analýza probíhá přímo v databázi, což snižuje celkovou časovou náročnost dataminingových projektů. Dále IBM SPSS Modeler umožňuje pomocí SQL Pushbacku podstatně zrychlit transformace a přípravu dat v databázi převedením posloupnosti příkazů do SQL bez nutnosti, aby uživatel sám tyto SQL dotazy psal. V případě, že databáze sama podporuje modelovací algoritmy, je možné s nimi jednoduše v uživatelsky příjemném prostředí IBM SPSS Modeler vytvářet nové modely a používat je pro další skórování. Jsou podporovány algoritmy v IBM InfoSphere, Microsoft SQL Server, Oracle a IBM Netezza. IBM SPSS Scoring Adapters skórují data přímo v databázi, což umožňuje ještě rychlejší rozhodování, včasné rozhodování a tedy ve výsledku rychlejší návratnost investice. Intuitivní tvorba modelů formou vizuálního programování v IBM SPSS Modeler

Rozsáhlá nabídka modelovacích technik IBM SPSS Modeler disponuje širokou škálou pokročilých datamininigových modelovacích nástrojů pro řešení úloh, na které může analytik narazit. Klasifikační a regresní algoritmy. Vytvoříte předpovědi budoucího chování na základě historických dat pomocí modelovacích technik, jako jsou klasifikační stromy, neuronové sítě, logistická regrese, podpůrné vektory, Coxova regrese, zobecněné smíšené lineární modely (GLMM) a další. Využijete automatické modelování jak pro kategorizované, tak pro spojité cílové proměnné. Segmentační algoritmy. Seskupíte zákazníky a naleznete neobvyklé vzory pomocí automatického seskupování, detekce anomálií a neuronových sítí. Automatické seskupování současně vyzkouší více segmentačních algoritmů a Vy vyberete vhodnou seskupovací metodu. Asociační algoritmy. Objevíte typické kombinace jevů a vztahy v posloupnostech událostí (např. nákupů) pomocí algoritmů Apriori, CARMA a sekvenčních asociací. Časové řady. Vytvoříte předpovědi pro jednu nebo více časových řad pomocí statistických modelovacích technik. Rozšíření jazykem R. Modeler umožňuje používat transformace, modely a výstupy v jazyce R. Kolegům, kteří nechtějí přímo psát zdrojový kód, vytvoříte vlastní, standardně ovládaný uzel využívající nástroje jazyka R. Monte Carlo simulace. Vzhledem k přirozené variabilitě, popřípadě nepřesnostem v datech, použijete metody Monte Carlo pro zpřesnění modelů a výběry scénářů. Příprava a datové manipulace Příprava dat je časově nejnáročnějším krokem každého analytického projektu. IBM SPSS Modeler poskytuje pestrou škálu nástrojů pro manipulace jak s jednotlivými záznamy, tak s proměnnými a vlastnostmi záznamů. Mezi základní datové manipulace patří: Práce se záznamy. Vyberete příslušné záznamy, se kterými chcete pracovat. Naleznete opakované případy v datech a připojíte nové záznamy. Agregací vytvoříte nové proměnné s agregovanými (shrnujícími) hodnotami například pro RFM analýzu. Data dále snadno setřídíte nebo navýšíte pomocí uzlu pro vážení. Pomocí uzlu Space Time Boxes taktéž seskupíte události blízké v čase a prostoru. Práce s proměnnými. Snadno upravíte metadata a vlastnosti proměnných v datové matici. Odfiltrujete nepotřebné a odvodíte nové proměnné. Proměnné restrukturalizujete a optimálně kategorizujete. Za účelem modelování také záznamy rozdělíte na trénovací a testovací množinu. Automatické modelování Nástroj pro automatické modelování je určen pro rychlé nalezení přesného modelu bez potřeby analytických zkušeností. Využijí jej ale i zkušení analytici při hledání vhodného modelu a při sestavování složitých proudů. Automatické modelování poskytuje nástroj pro snadné porovnání výsledků různých modelů s různým nastavením parametrů. Výstupem je seznam modelů, které dosahují nejlepších výsledků. Metodologický přístup V každé části dataminingového procesu umožňuje IBM SPSS Modeler postupovat podle obecně přijatého dataminingového standardu CRISP-DM (Cross-Industry Standard Process). To znamená, že uživatelé místo soustředění na tvorbu vlastní metodologie, mohou věnovat svůj drahocenný čas na řešení daného úkolu.

Projekty lze v IBM SPSS Modeler efektivně organizovat v projektovém manažeru CRISP-DM. Specifikace Pochopení dat široká škála interaktivních grafů pavučinový graf pro analýzu vztahů v datech interaktivní výběr dat z grafu pro vizualizaci nebo modelování přístup k procedurám a grafům z programu IBM SPSS Statistics přímo v programu Modeler Příprava dat přístup k datům z IBM SPSS Collaboration and Metodologie CRISP-DM umožňuje data minerům postupovat v projektech efektivně a dosáhnout požadovaných výsledků. Nasazení do praxe Díky otevřené a škálovatelné architektuře programu IBM SPSS Modeler jej lze efektivně nasadit do stávající IT infrastruktury. Integruje se přímo s Vašimi existujícími systémy, jak pro sběr dat, tak pro rozhodování. Navíc využívá modelování a skórování v databázi, SQL pushback, multithreading a serverové klastry. Tím umožňuje nejenom efektivně a rychle získat výsledky, ale i redukovat celkové náklady. V rámci architektury klient/server umožňuje IBM SPSS Modeler Server pracovat více analytikům najednou a pomocí modelování a skórování přímo v databázi efektivně zpracovávat velký objem dat. IBM SPSS Modeler Server navíc rozšiřuje způsob aplikace výsledků a snadno předává výsledky manažerům pro rychlé rozhodování. Deployment Services Repository, Cognos Business Intelligence, Cognos TM1, IBM DB2, Oracle, Microsoft SQLServer, IBM Informix, IBM Netezza, mysql (Oracle), Hadoop Distributed File System, datovým zdrojům Teradata, stejně tak jako k databázím zdb2 a IBM Classic Federation Server Support import textových souborů pevné délky nebo s oddělovači, import datových souborů IBM SPSS Statistics, SAS, IBM SPSS Data Collecton nebo XML paleta nástrojů pro čištění dat od odebrání či nahrazení chybných údajů až po automatické vkládání chybějících hodnot a zmírnění vlivu odlehlých pozorování a extrémních hodnot automatická příprava pro ověření kvality dat a jejich modelování automatické ověření kvality dat a jejich příprava k modelování výběr proměnných, přejmenování, odvození nových proměnných, kategorizace, nahrazení hodnot a změna pořadí proměnných výběr případů, náhodné výběry, spojení dat a textových řetězců, třídění, agregace a vážení

restrukturalizace dat, rozdělení na tréninkovou a testovací množinu a transpozice funkce pro práci s textovými řetězci: tvorba řetězců, nahrazování znaků, vyhledávání, ořezávání a odebírání mezer RFM skórování, agregace transakčních dat pro kompletní RFM analýzu export dat do databází, IBM Cognos Business Intelligence, IBM SPSS Statistics, IBM SPSS Data Collection, textových dokumentů, Excel, SAS, XML. Modelování a ověření modelů pokročilé dataminingové algoritmy pro získání informací z Vašich dat automatická klasifikace a seskupování pro rychlé nalezení vhodných modelů interaktivní prohlížeč modelů a přehledné statistické výstupy vizualizace analytických výsledků na geografických mapách grafické zobrazení relativní důležitosti prediktorů pro závislou proměnnou kombinace několika modelů (metamodelování), nebo analýza jednoho modelu pomocí druhého Component-Level Extension Framework (CLEF) pro tvorbu vlastních aplikací přístup k nástrojům jazyka R propojení s IBM SPSS Statistics simulování dat metodou Monte Carlo Modelovací algoritmy C&C&RT, C5.0, CHAID & QUEST rozhodovací a klasifikační stromy s možností interaktivního růstu Decision List interaktivní algoritmus pro vytváření pravidel Kohonenovy sítě, metody K-Means a Two Step, diskriminační analýza a metoda podpůrných vektorů (SVM) seskupovací a segmentační algoritmy faktorová analýza, analýza hlavních komponent algoritmy pro redukci dimenzionality lineární regrese, zobecněná lineární regrese (GLM) a zobecněné lineární smíšené modely (GLMM) odhady parametrů v lineárních modelech logistická regrese - modelování kategorizovaných proměnných SLRM bayesovský model s postupným učením analýza časových řad automatické generování a odhady parametrů časových řad neuronové sítě vícevrstvá síť se zpětnou propagací, síť s radiální bazickou funkcí podpůrné vektory (SVM) pokročilý algoritmus vhodný pro rozsáhlé datové soubory bayesovské sítě modely založené na podmíněné pravděpodobnosti Coxova regrese odhad času do konkrétní události detekce anomálií nalezne neobvyklé záznamy pomocí seskupovacích algoritmů KNN klasifikace metodou nejbližších sousedů Apriori oblíbený asociační algoritmus s pokročilými funkcemi pro vyhodnocení výsledků CARMA asociační algoritmus s možností vícenásobných důsledků equence nalezení asociací v záznamech uspořádaných podle času modelovací algoritmy v databázi IBM InfoSphere*: Apriori, seskupování, rozhodovací stromy, logistická regrese, naivní bayesovské klasifikátory, regresní modely, hledání asociací v sekvencích a časové řady

modelovací algoritmy v databázi IBM Netezza*: bayesovské sítě, naivní bayesovské klasifikátory, rozhodovací a regresní stromy, hierarchické seskupování, seskupování metodou K-Means, zobecněné lineární modely, metoda hlavních komponent a časové řady modelovací algoritmy v databázi IBM Netezza*: bayesovské sítě, naivní bayesovské klasifikátory, rozhodovací a regresní stromy, hierarchické seskupování, seskupování metodou K-Means, zobecněné lineární modely, metoda hlavních komponent a časové řady modelovací algoritmy pro databázi Microsoft SQL Server*: Apriori, seskupování, rozhodovací stromy, lineární regrese, naivní bayesovské klasifikátory, neuronové sítě, sekvenční seskupování a časové řady modelovací algoritmy pro databázi Oracle*: adaptivní bayesovské sítě, naivní bayesovské klasifikátory, Apriori, umělá inteligence (AI), rozhodovací stromy, zobecněný lineární model (GLM), metoda K-Means, minimální popisná vzdálenost (MDL), faktorizace pozitivně semidefinitních matic, O-Cluster (ortogonální seskupování), podpůrné vektory (SVM) Modeler Server (volitelný) přístup k modelovacím nástrojům přímo v databázích paralelní spuštění proudů a modelů bezpečný přenos citlivých dat mezi klientem a serverem pomocí kódování Secure Sockets Layer (SSL) IBM IBM software poskytuje akční vhled, který manažeři potřebují k dosažení lepších obchodních výsledků. IBM nabízí komplexní jednotné portfolio složené z nástrojů pro business intelligence, prediktivní analýzy, finančních výpočty a strategický management a kontrolu rizik. Pomocí IBM software dokážou společnosti odhalit trendy, vzory chování a odchylky od nich, porovnat scénáře Co by bylo, kdyby..., predikovat potenciální hrozby a příležitosti, identifikovat a řídit klíčová obchodní rizika a plány, rozvrhnout a odhadovat zdroje. Díky těmto analytickým možnostem dokáží naši zákazníci po celém světě lépe pochopit, předvídat a vytvářet obchodní výsledky. *vyžaduje IBM SPSS Modeler Professional Server Aplikace export modelů pomocí SQL nebo PMML (standardní XML formát pro prediktivní modely) využívá IBM SPSS Collaboration and Deployment Services pro správu analytických procesů, automatizaci a zavedení do praxe Copyright 2014, ACREA CR, spol. s r.o. Společnost ACREA CR, spol. s r.o. je distributorem softwaru IBM SPSS a poskytovatelem analytických a statistických služeb a kurzů v České a Slovenské republice. ACREA CR, spol. s r.o. (t) +420 234 721 400 Krakovská 7, (e) info@acrea.cz Praha 1, 110 00 (w) www.acrea.cz