IBM SPSS Modeler. Hlavní přínosy. Intuitivní ovládání IBM

Podobné dokumenty
IBM SPSS Modeler Professional

IBM SPSS Modeler Premium

Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků.

IBM SPSS Decision Trees

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Příprava dat v softwaru Statistica

STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM

Úvodem Dříve les než stromy 3 Operace s maticemi

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

IBM SPSS Neural Networks

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Bayesovská statistika. Syntax editor. Vylepšení grafiky. Přidáno ve verzi 24. IBM SPSS Statistics. IBM Software Business Analytics

Profitabilita klienta v kontextu Performance management

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

Moderní systémy pro získávání znalostí z informací a dat

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

IBM Cognos Express. Hlavní přínosy. IBM Cognos Express. IBM Software. Business Analytics

Stručný obsah. K2118.indd :15:27

Novinky IBM SPSS Statistics

Datová věda (Data Science) akademický navazující magisterský program

Cíle supervizovaného učení Ondřej Háva

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

MBI - technologická realizace modelu

Pokročilé neparametrické metody. Klára Kubošová

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Business Intelligence nástroje a plánování

IBM SPSS Reports for Surveys

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Získávání dat z databází 1 DMINA 2010

Základy business intelligence. Jaroslav Šmarda

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

Maturitní otázky z předmětu PROGRAMOVÁNÍ

Business Intelligence

Informační systémy 2006/2007

Jádrem systému je modul GSFrameWork, který je poskytovatelem zejména těchto služeb:

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

PRODUKTY. Tovek Tools

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Strojové učení Marta Vomlelová

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

Novinky IBM SPSS Statistics

SW pro správu a řízení bezpečnosti

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík

Algoritmy a struktury neuropočítačů ASN - P11

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

1 Úvod 1.1 Vlastnosti programového vybavení (SW)

Analýzou dat k efektivnějšímu rozhodování

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Geografické informační systémy ArcGIS Pavel Juška (jus011) 4. března 2010, Ostrava

Jak využít data o zákaznících ke zvýšení příjmů z prodeje

Wonderware Information Server 4.0 Co je nového

ANALÝZA A KLASIFIKACE DAT

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Novinky IBM SPSS Statistics

Katedra kybernetiky, FEL, ČVUT v Praze.

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

Představuje. Technický Informační Systém nové generace

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

TÉMATICKÝ OKRUH Softwarové inženýrství

PRODUKTY Tovek Server 6

Inteligentní řízení strojů s portfoliem u-mation Řešení pro automatizaci a digitalizaci Let s connect. Automatizace a digitalizace

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Obohacení dat o statistické výsledky a potenciál jejich využití

PRODUKTY. Tovek Tools

Uživatelská podpora v prostředí WWW

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR

Obsah. Zpracoval:

Efektivní práce s Excelem (středně pokročilí uživatelé)

HR reporting aneb kouzla s daty Jan Pavelka

UČENÍ BEZ UČITELE. Václav Hlaváč

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

ABBYY Automatizované zpracování dokumentů

1. Webový server, instalace PHP a MySQL 13

PowerOPTI Řízení účinnosti tepelného cyklu

Software pro analýzu energetických dat W1000

Big Data od velkých očekávání k praktickému využití. DSW, Praha,

powerful SAP-Solutions

Formy komunikace s knihovnami

Lineární klasifikátory

Lotus Quickr - ECM Integrace s LD/LN aplikacemi. Ing. Josef Homolka VUMS Legend

Dobývání a vizualizace znalostí

Vývoj informačních systémů. Přehled témat a úkolů

Spark SQL, Spark Streaming. Jan Hučín

Dolování z textu. Martin Vítek

IBM SPSS Direct Marketing

STATISTICA 10. Nové funkce a vylepšení. Obsah

UDS for ELO. Univerzální datové rozhraní. >> UDS - Universal Data Source

Přednáška 13 Redukce dimenzionality

Transkript:

IBM SPSS Software IBM SPSS Modeler Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků. IBM SPSS Modeler je komlpexní platforma pro prediktivní analýzu, která dává do rukou jednotlivce, pracovních skupin nebo celé organizace nástroje pro nalezení skrytých vzorů v datech. S nástrojem SPSS Modeler nezáleží na velikosti vašeho řešení. Umožnuje pracovat na desktopovém počítači i používat řešení založené na rozsáhlém množství pokročilých algoritmů zpracovávaných na serverovém počítači. Použití těchto technik v rozhodování může vést k rychlému růstu ROI, k aktivnímu a opakovanému snižování nákladů při zvýšení produktivity. Intuitivní ovládání Software IBM SPSS Modeler využívá ověřenou a celosvětově uznávanou metodiku CRISP-DM (Cross Industry Standart Process for Data Mining). Díky tomu Vám ponechává kontrolu nad daty a nad celým procesem, ve všech jeho fázích: porozumění úloze a jejímu cíli, porozumění datům, příprava dat, modelování, vyhodnocení, implementace. Uživatelsky orientované, intuitivní grafické rozhraní umožňuje snadnou práci s programem a vytváření modelů i uživatelům bez hlubších technických znalostí. Analytici potom využijí pokročilejší funkce programu. Ovládání softwaru je lehké, uživatel se může soustředit na konkrétní problém, nikoliv na jeho technické řešení. Hlavní přínosy datová nezávislost v přístupu k datovým skladům, databázím, Hadoop distribucím či ke klasickým textovým či excelovským souborům sofistikované analytické prostředky pro hledání skrytých vzorů v datech zpřístupnění statistických a dataminingových procedur širšímu spektru uživatelů díky uživatelsky jednoduché a intuitivní práci formou vizuálního programování využitelnost dataminingové platformy pro řešení širokého okruhu obchodních úloh, od jednoduchých popisných statistik až po komplexní analytické modely maximální využití stávající IT infrastruktury pro dosažení maximální rychlosti zpracování dat díky delegaci zpracování přímo do databází rozšiřitelnost dataminingová platformy s možností její integrace s dalšími řešeními IBM IBM SPSS Software jednoduchá implementace a integrace řešení do stávající IT infrastruktury

Přístup k různým typům dat Z grafického rozhraní lze jednoduše přistupovat ke všem typům databází (IBM InfoSphere, Microsfoft SQL Server, Oracle a IBM Netezza), tabulek, datových souborů (jako jsou soubory IBM SPSS Statistics, SAS a Excel), textových souborům, zdrojům z Web 2.0 (například RSS), IBM SPSS Data Collection, IBM Cognos Business Intelligence, ze systémů s IBM Classic Federation server a zdb2 for z/os. Příprava dat a datové manipulace Příprava dat je důležitý ale časově náročný krok v dataminingovém procesu. Nástroj SPSS Modeler nabízí řadu způsobů jak manipulovat a připravovat data pro analýzy, ať už se jedná o přípravu záznamů v řádcích nebo přípravu proměnných ve sloupcích. Mezi metody používané k přípravě dat pro konkrétní typ analýzy se používají: Operace se záznamy Uzly Select, Sample a Distinct umožnují vybrat si specifické řádky v tabulce. Uzly Merge a Append spojují dvě a více tabulek. Uzly Aggregate a RFM Aggregate vytvářejí agregace v podobě jednoho řádku. Balance uzel upravuje poměr záznamů v nevyvážené datové matici. Uzel Sort řadí záznamy na základě vybrané proměnné. Uzel Space Time Box transformuje geo-prostorová data a časové řady záznamů. Operace s proměnnými Uzlem Type specifikujete metadata a vlastnosti datové matice. Uzel Filter odstraňuje záznamy z datové matice. Uzel Derive vytváří nové proměnné, zatímco uzel Filler přepisuje existující proměnné. Restrukturalizaci datové matice lze provádět za pomocí uzlů Set to Flag, Restrucure nebo Transpose. K přeskupení kategorií v rámci jedné proměnné se používají uzly Reclassify nebo Binning. Před modelování je vhodné rozdělit datovou matici na trénovací a testovací množinu prostřednictví uzlu Partition. Uzly History a Time Intervals umožnují vytvářet nové proměnné při práce se sekvenčními daty (např. časové řady). Uzel Field Reorder upravuje pořadí proměnných v datové matici. Rozsáhlá nabídka modelovacích technik IBM SPSS Modeler disponuje širokou škálou pokročilých datamininigových modelovacích nástrojů pro řešení úloh, na které může analytik narazit.

Klasifikační algoritmy Vytváří předpovědi budoucího chování na základě historických dat pomocí modelovacích technik, jako jsou klasifikační stromy, neuronové sítě, logistická regrese, podpůrné vektory, Coxova regrese, zobecněné smíšené lineární modely (GLMM) a další. Využijete automatické modelování jak pro kategorizované, tak pro spojité cílové proměnné a vytvořte samo-učící se model (SLRM), který můžete opakovaně aktualizovat nebo znovu odhadovat bez nutnosti předělat váš model. Segmentační algoritmy Seskupuje zákazníky a hledá neobvyklé vzory pomocí automatickéhonebo uživatelského seskupování, detekce anomálií a neuronových sítí. Automatické seskupování současně vyzkouší více segmentačních algoritmů a vy vyberete vhodnou seskupovací metodu. Asociační algoritmy Nacházejí typické kombinace jevů a vztahy v posloupnostech událostí (např. nákupů) pomocí algoritmů Apriori, CARMA a sekvenčních asociací. Časové řady Vytvářejí předpovědi pro jednu nebo více časových řad pomocí statistických modelovacích technik. Rozšíření o jazyk R SPSS Modeler umožňuje používat transformace, modely a výstupy v jazyce R. Pro kolegy, kteří nechtějí přímo psát zdrojový kód, lze vytvořit vlastní, standardně ovládaný uzel využívající nástroje jazyka R. Monte Carlo simulace Umožňuje vložit prvek nejistoty do predikčních modelů. Vstupy do modelu obsahující prvek nejistoty jsou nasimulovány podle historických dat nebo pravděpodobnostního rozdělení. Tento proces může být mnohokrát opakován. Výsledkem je pak rozdělení výsledků, které mohou přispět k zodpovězení komplexních otázek. Proč IBM SPSS Modeler? Prostřednictvím nezávislých studií a díky našim zkušenostem z projektů jsme identifikovali následující hlavní kategorie přínosů, které Vám software IBM SPSS přinese: jednoduchá a rychlá implementace (do ½ dne), nízké náklady na zaškolení v důsledku nenáročného ovládání software, rychlé předání znalostí a know how užívání softwaru v rámci organizace, zvýšení produktivity jako důsledek práce s jednoduchým grafickým uživatelským prostředím bez nutnosti programování, snadné sdílení výsledků práce díky dokumentaci datového procesu přímo v prostředí programu, přístup k datům v datových skladech, databázích, Hadoop distribucích či samotných souborech, silný nástroj nejen pro tvorbu modelů, ale také pro (často zásadní) přípravu vstupních dat, komplexní analýza velkého množství dat v kratším čase s použitím stávajícího IT vybavení, výpočty prováděné v databázi, minimální přesun dat, neustálý technologický vývoj v rámci portfolia produktů IBM a pravidelné upgrady. Specifikace IBM SPSS Modeler Professional Pochopení dat komplexní přehled proměnných v souboru včetně kontroly jejich kvality, široká škála interaktivních grafů, pavučinový graf pro analýzu vztahů v datech, interaktivní výběr dat z grafu pro vizualizaci nebo modelování, přístup k procedurám a grafům z programu IBM SPSS Statistics přímo v programu Modeler.

Příprava dat přístup k datům z IBM SPSS Collaboration and Deployment Services Repository, Cognos Business Intelligence, Cognos TM1, IBM DB2, Oracle, Microsoft SQLServer, IBM Informix, IBM Netezza, mysql (Oracle), Hadoop Distributed File System, datovým zdrojům Teradata, stejně tak jako k databázím zdb2 a IBM Classic Federation Server Support import textových souborů pevné délky nebo s oddělovači, import datových souborů IBM SPSS Statistics, SAS, IBM SPSS Data Collecton nebo XML paleta nástrojů pro čištění dat od odebrání či nahrazení chybných údajů až po automatické vkládání chybějících hodnot a zmírnění vlivu odlehlých pozorování a extrémních hodnot automatické ověření kvality dat a jejich příprava k modelování výběr proměnných, přejmenování, odvození nových proměnných, kategorizace, nahrazení hodnot a změna pořadí proměnných výběr případů, náhodné výběry, spojení dat a textových řetězců, třídění, agregace a vážení restrukturalizace dat, rozdělení na tréninkovou a testovací množinu a transpozice funkce pro práci s textovými řetězci: tvorba řetězců, nahrazování znaků, vyhledávání, ořezávání a odebírání mezer RFM skórování, agregace transakčních dat pro kompletní RFM analýzu export dat do databází, IBM Cognos Business Intelligence, IBM SPSS Statistics, IBM SPSS Data Collection, textových dokumentů, Excel, SAS, XML. Modelování a ověřování modelů pokročilé data miningové algoritmy pro získání informací z dat, automatická klasifikace a seskupování pro rychlé nalezení vhodných modelů, interaktivní prohlížeč modelů a přehledné statistické výstupy, vizualizace analytických výsledků na geografických mapách, grafické zobrazení relativní důležitosti prediktorů pro závislou proměnnou, kombinace několika modelů (metamodelování), nebo analýza jednoho modelu pomocí druhého, Component-Level Extension Framework (CLEF) pro tvorbu vlastních aplikací, přístup k nástrojům jazyka R včetně hladké implementace procedur v jazyce R do prostředí programu, možnost práce v jazyku Python a Python for Spark, propojení s IBM SPSS Statistics, simulování dat metodou Monte Carlo. Modelovací algoritmy C&RT, C5.0, CHAID & QUEST rozhodovací a klasifikační stromy s možností interaktivního růstu, náhodné lesy, Decision List interaktivní algoritmus pro vytváření pravidel, Kohonenovy sítě, metody K-Means a Two Step, diskriminační analýza a metoda podpůrných vektorů (SVM) seskupovací a segmentační algoritmy, Faktorová analýza, analýza hlavních komponent algoritmy pro redukci dimenzionality, Lineární regrese, zobecněná lineární regrese (GLM) a zobecněné lineární smíšené modely (GLMM) odhady parametrů v lineárních modelech, Logistická regrese - modelování kategorizovaných proměnných, SLRM bayesovský model s postupným učením, Analýza časových řad automatické generování a odhady parametrů časových řad, metody Temporal Causal Modelling, Neuronové sítě vícevrstvá síť se zpětnou propagací, síť s radiální bazickou funkcí, Podpůrné vektory (SVM) a lineární podpůrné vectory (LSVM) pokročilé algoritmy vhodné pro rozsáhlé datové soubory, Bayesovské sítě modely založené na podmíněné pravděpodobnosti, Coxova regrese odhad času do konkrétní události, Detekce anomálií nalezne neobvyklé záznamy pomocí seskupovacích algoritmů, KNN klasifikace metodou nejbližších sousedů,

Apriori oblíbený asociační algoritmus s pokročilými funkcemi pro vyhodnocení výsledků, CARMA asociační algoritmus s možností vícenásobných důsledků, Sequence nalezení asociací v záznamech uspořádaných podle času, Spatio-Temporal Prediction modely pro hledání časových a prostorových vztahů v datech. Vyžaduje IBM SPSS Modeler Server Professional modelovací algoritmy v databázi IBM InfoSphere: Apriori, seskupování, rozhodovací stromy, logistická regrese, naivní bayesovské klasifikátory, regresní modely, hledání asociací v sekvencích a časové řady, modelovací algoritmy v databázi IBM Netezza: bayesovské sítě, naivní bayesovské klasifikátory, rozhodovací a regresní stromy, hierarchické seskupování, seskupování metodou K-Means, zobecněné lineární modely, metoda hlavních komponent a časové řady, modelovací algoritmy pro databázi Microsoft SQL Server: Apriori, seskupování, rozhodovací stromy, lineární regrese, naivní bayesovské klasifikátory, neuronové sítě, sekvenční seskupování a časové řady, modelovací algoritmy pro databázi Oracle: adaptivní bayesovské sítě, naivní bayesovské klasifikátory, Apriori, umělá inteligence (AI), rozhodovací stromy, zobecněný lineární model (GLM), metoda K-Means, minimální popisná vzdálenost (MDL), faktorizace pozitivně semidefinitních matic, O-Cluster (ortogonální seskupování), podpůrné vektory (SVM), přístup k modelovacím nástrojům přímo v databázích, paralelní spuštění proudů a modelů, bezpečný přenos citlivých dat mezi klientem a serverem pomocí kódování Secure Sockets Layer (SSL), převedení transformací a výběrů do SQL a jejich provedení přímo v databázi přes SQL pushback. Závěr SPSS Modeler je platforma pro prediktivní analýzy vyznačující se širokou škálovatelností. Umožňuje nasazení na desktopovou stanici jednoho zaměstnance až po integraci se systémy v organizaci, která přinese relevantní výsledky analýz jednotlivcům, skupinám nebo celé organizaci. Vaše organizace může SPSS Modeler využít k provedení analýz bez ohledu na to, kde jsou data uložena nebo zda jsou data strukturovaná nebo nestrukturovaná. Architektura client server vám umožnuje delegovat datové manipulace a výpočty do datového zdroje, tak aby se minimalizoval pohyb dat a zvýšila se efektivita výpočtu. Copyright 2018, ACREA CR, spol. s r.o. Společnost ACREA CR, spol. s r.o. je výhradním distributorem softwaru IBM SPSS a poskytovatelem analytických a statistických služeb a kurzů v České a Slovenské republice. ACREA CR, spol. s r.o. (t) +420 234 721 400 Krakovská 7, (e) info@acrea.cz Praha 1, 110 00 (w) www.acrea.cz