Newstin Real-time Web Content Categorization. Presentation to WebExpo 2008

Podobné dokumenty
Enterprise Content Management IBM Corporation

VYSOKÁ ŠKOLA HOTELOVÁ V PRAZE 8, SPOL. S R. O.

místo, kde se rodí nápady

Project Life-Cycle Data Management

První brněnská strojírna Velká Bíteš, a.s. was founded in E.g. sales people, purchasing clerks, development workers, designers.

IT4Innovations Centre of Excellence

SAP a SUSE - dokonalá symbióza s open source. Martin Zikmund Technical Account Manager

Jak připravit IBM System x server pro zákazníka

Pomáháme vám využívat vaše informace VYHLEDÁVACÍ TECHNOLOGIE PRO ON-LINE INFORMAČNÍ ZDROJE SEARCH DRIVEN INNOVATION

GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA

Lotus Symposium Interaktivní portál na platformě Lotus Domino. jako nástroj pro zvýšení loajality klientů

Potřebujete mít vaše IS ve shodě s legislativou? Bc. Stanislava Birnerová

Agile leadership in Czech Rep. Agilia Conference 2011 Brno

Enabling Intelligent Buildings via Smart Sensor Network & Smart Lighting

Vývoj informačních systémů. Architektura, návrh Vzory: Doménová logika

Správa a zabezpečení mobilních zařízení. Ochrana/záloha firemních dat. Ctirad Navrátil Client Technical Professional IBM Corporation

Digitální učební materiál

Content management: organizace informací na webových stránkách. Petr Boldiš Studijní a informační centrum Česká zemědělská univerzita v Praze

Gale InfoTrac - Maximize Your E-resources Suweco - webinar

dat 2017 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 4.0 Mezinárodní

Czech Crystal in Chengdu 2016 捷克水晶闪亮成都

Obsah Úvod 11 Jak být úspěšný Základy IT

WWW. Petr Jarolímek, DiS. Školní rok:

Tabulka 1 Stav členské základny SK Praga Vysočany k roku 2015 Tabulka 2 Výše členských příspěvků v SK Praga Vysočany Tabulka 3 Přehled finanční

Vývoj informačních systémů. Architektura, návrh Vzory: Doménová logika

USING VIDEO IN PRE-SET AND IN-SET TEACHER TRAINING

Firemní strategie pro správu mobilních zařízení, bezpečný přístup a ochranu informací. Praha 15. dubna 2015

Nová generace analytik mění zažité způsoby BI

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Počítačová Podpora Studia. Přednáška 4. Nástroje pro vědecko-technické výpočty a zpracování dat. (v rámci PPS) PPS 2014

SGM. Smart Grid Management THE FUTURE FOR ENERGY-EFFICIENT SMART GRIDS


Registrace (obchodní příležitosti i do partnerského programu)

Seznam změn v manuálu

PROSPERITY Programme. OP Enterprise and Innovation. Klára Hanušová

EMOS Company. Energy changing our world

Veritas Information Governance získejte zpět kontrolu nad vašimi daty

Role BI v e-business řešeních pohled do budoucnosti

CZ.1.07/1.5.00/

ESPD & e-certis support on the way o once-only principle in e-procurement

materiál č. šablony/č. sady/č. materiálu: Autor:

CZ.1.07/1.5.00/

Vánoční sety Christmas sets

VÚTS, a.s. Liberec CENTRE OF ENGINEERING RESEARCH AND DEVELOPMENT

Svalová dystrofie. Prezentace technologických řešení registru Petr Brabec

Research infrastructure in the rhythm of BLUES. More time and money for entrepreneurs

Risk Management. Překlad a interpretace pro české prostředí

DOPLNĚK K FACEBOOK RETRO EDICI STRÁNEK MAVO JAZYKOVÉ ŠKOLY MONCHHICHI

System Center Operations Manager

Domino 10 nové komponenty a související témata (node.js, ES )

PÁSOVÉ PILY NA KOV - BAND SAWS MACHINE - ЛЕНТОЧНЫЕ ПИЛЫ SCIES Á BANDE - BANDSAEGEMASCHINEN - PRZECINARKI TAŚMOWE NA KOV SCIES A RUBAN - SIERRAS DE

Litosil - application

PROČ UŽ SE NEOBEJDETE BEZ ANALÝZY DAT

Od Czech POINTu k vnitřní integraci

TechoLED H A N D B O O K

Co vím o Ázerbájdžánu?

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

Database systems. Normal forms

Optimalizace infrastruktury cesta ke kontrole IT. Pavel Salava Specialist Team Unit Lead Microsoft, s.r.o

Microsoft Office 365. SharePoint Online novinky a administrace

Základní škola Marjánka

Zabezpečení infrastruktury

The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into

SenseLab. z / from CeMaS. Otevřené sledování senzorů, ovládání zařízení, nahrávání a přehrávání ve Vaší laboratoři

1, Žáci dostanou 5 klíčových slov a snaží se na jejich základě odhadnout, o čem bude následující cvičení.

Sémantický web 10 let poté

Postup objednávky Microsoft Action Pack Subscription

Digital Transformation of Organization

Petr Vlk KPCS CZ. WUG Days října 2016

a konverze na úřadech Martin Řehořek

Paid parking zones in the capital city of Prague. Ing. Libor Šíma Prague City Hall Krakow

Právní formy podnikání v ČR

Perception Motivated Hybrid Approach to Tone Mapping

GREAT BRITAIN. III/2 Inovace a zkvalitnění výuky prostřednictvím ICT. Anglický jazyk Třída 3.A Téma hodiny Druh materiálu

PODNIKOVÁ INFORMATIKA

Monthly Press Clipping Summary

Introduction to Navision 4.00 Jaromír Skorkovský, MS., PhD.

Efektivní využití SSD v produktech Dell: SSD za cenu HDD. Ondřej Bajer Storage Systems Engineer

BTS and Development of Confidence Indicators

Press book English Language

UNIVERZITA PRO OBCHODNÍ PARTNERY

Moloko ateliér s.r.o. Moloko ateliér s.r.o.

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Technologie, vlastnosti, uplatnění. Martin Suchan

IBM Information Management

IBM BigData Analytics

Defense-in-Depth. Strategie hloubkové ochrany - účinný přístup k ochraně koncových bodů dle kybernetického zákona

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

Biotechnology in the Czech Republic where we are?

Bitdefender GravityZone

Social Media a firemní komunikace

Od klasického reportingu k SAP BO Design studio na BW power by HANA Pavel Strnad

MySQL sežere vaše data

Nová éra diskových polí IBM Enterprise diskové pole s nízkým TCO! Simon Podepřel, Storage Sales

MĚSTA (RODNÉ MĚSTO A DALŠÍ DŮLEŽITÁ MĚSTA) MICHAL KADLEC, DIS

ITICA. SAP Školení přehled Seznam kurzů

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

NABÍDKA BUSINESS A MANAŽERSKÉHO PORADENSTVÍ - BMC Consulting Souhrnná www prezentace ( www BMC Offer Summary )

Anglický jazyk. Specifikace oboru. 1. Prague 1. Co je to polygrafie. DUM číslo: 103 Prague. Co je to polygrafie

Transkript:

Newstin Real-time Web Content Categorization Presentation to WebExpo 2008 October 18, 2008

Company Background Newstin a.s. founded in 1998 as I2S in Prague Team of 30 employees 26 engineers 14 nations Since 2005 Real-time semantic content categorization Multiple patent filings on cross-language solution Past activities Business & government projects in information management and security Partnership with Business Objects/SAP RedHerring Europe 100 Winner Award

What is Newstin? Patented technology Largest news database, catalog of news in the world 150,000+ information sources in 11 languages 250,000+ articles daily fully processed into 1,000,000+ categories US, UK, Indian, French, German, Italian, Spanish, Mexican, Portuguese, Brazilian, Czech, Russian, Arabic, Chinese Japanese, Korean, Turkish coming in Q4 2008 Newstin.com Popular user applications Business Intelligence Enterprise content organization

What is Newstin? (Details) Newstin is an innovative technology that incorporates a completely new approach to content organization. Newstin technology and its service-oriented architecture is the foundation of a unique system that features fully scalable real-time semantic, multi-language and cross-language document categorization. Newstin patented technology has the potential to become the core platform for organizing any unstructured textual data, including data from all sources on the Internet and potentially including the hidden Web. Newstin is a powerful engine which harnesses a variety of cutting-edge technologies and implements linguistic processing with semantic analysis, multilevel content categorization and cross-language taxonomy structures. The applications of Newstin technology utilize an inherent capability to make use of context in addition to conventional key word approaches. Newstin is the largest news database/catalogue in the world currently comprising 40 Million documents & 2.2 Billion metadata items and constantly growing. Newstin article collection is continuously updated from over 160,000 global and weighted sources selected from a pool of over 3 Million preprocessed sources in 12 languages. Daily up to 200,000+ articles are fully processed into 1.1 Million categories in 15 supported editions: US, UK, Indian, French, German, Italian, Spanish, Mexican, Portuguese, Brazilian, Czech, Russian, Arabic, Chinese and Korean; with more languages and editions coming soon. Newstin is a complex system incorporating content retrieval, metadata processing, analysis and visualization. The extensive operation behind Newstin makes it a perfect platform for SaaS solutions. Newstin is a bi-directional application of its own. By imposing order on unstructured data Newstin leverages its own extensive metadata collection for business intelligence and enterprise performance management. It is inevitable to organize content first to maximize knowledge mining capability.

Web Content Chaos An inspiration for Newstin to develop a solution for organizing web content

Semantic Web 2.0 Organization A portion of Newstin s taxonomy structure a step toward organizing web content

Live Demonstration Newstin.com

Live Demonstration NewstinMap

Live Demonstration - Connecting VIP

Live Demonstration BI Example

Live Demonstration BI Example

Live Demonstration - EmergingStories

B2B: Online Categorization Firewall Enterprise Newstin Categorization Engine Unstructured Data Intranet Metadata SaaS Semantic Organization Contextual Search Visual Navigation Cross-language Mash up internal/external Semantic / Web 2.0 Capability to Enterprise Market Standard for Tagging Product synergy / enhancement Competitive advantage

Cross-language Information Retrieval Newstin enables to reach a particluar topic in all supported languages through original definitions

Life Cycle Newstin is a comprehensive information system

Shrnutí Prezentace - CZ Hlavní téma: Kategorizace webového obsahu v reálném čase Newstin a.s. je česká technologická firma se sídlem v Praze, zaměstnávající 30 inženýrů z 15 zemí. Během 3,5 roku vytvořila unikátní technologii na real-time organizování textových dokumentů s využitím sémantických a lingvistických technologií. Stěžejní a patentovanou součástí Newstin technologie je tzv. cross-lingvální řešení umožňující propojovat internetový obsah v různých jazycích bez použití překladů. Newstin vytvořil největší aktuální databázi článků internetového zpravodajství v 11 světových jazycích včetně češtiny, která obsahuje 37 milionů článků za posledních 9 měsíců a 2 miliardy metadat. V současnosti servery Newstin denně zpracují 250 tis. unikátních článků ze 160 tis. nejdůležitějších zdrojů po celém světě. Další využití technologie Newstin leží v oblasti mediálních analýz a organizaci podnikových dat.

Real-time Web Content Categorization Thank you. Julius Rusnak CTO Newstin a.s. Lomnickeho 9 140 00 Prague Czech Republic