Evropský sociální fond Investujeme do vaší budoucnosti Míry podobnosti, základy fuzzy matematiky Matematika pro informatiky, FIT ČVUT Martin Holeňa, 9. týden LS 2010/2011
O čem to bude? Přehled vzdáleností a měr podobnosti souvislost mezi podobností a neurčitostí Fuzzy matematika: matematika neurčitosti fuzzy množiny a operace s nimi souvislost s: fuzzy logikou, rozdělením pravděpodobnsti kombinování neurčitosti fuzzy pravidly a integrálem MPI, 9. týden LS, Martin Holeňa 2 (z 71)
Význam podobnosti pro informatiku Podobnost 2 objektů: malá odlišnost zvolených vlastností body: poloha, obrázky: tvary, dokumenty: text, Nejstarší informatické využití podobnosti: shlukování dat shlukování složitějších objektů (dokumenty, webové stránky) význam: mnoho různých dat několik shluků Další využití: hledání podobných objektů (obrázků, ) MPI, 9. týden LS, Martin Holeňa 3 (z 71)
Připomenutí: shlukování dat Hledáme shluky: C 1, C k X (X-množina dat, k je dáno), tvořící k-složkové rozdělení X : C 1 C k =X, C i C j = + takové, že mezi všemi k-složkovými rozděleními X maximalizuje součet Výsledek shlukování závisí na: 1. počtu k shluků 2. podobnost (x,y) použité míře podobnosti x a y : MPI, 9. týden LS, Martin Holeňa 8 (z 71)
Vzdálenost číselných vektorů Souvislost s podobností: vzdálenost ~ podobnost Vzdálenosti založené na normě vektoru: d(x,y)= x-y x 0, x =0 x =0, αx = α x, x+y x + y obecná: Minkovského p=2: Eukleidova p =1: manhatannská, p= : MPI, 9. týden LS, Martin Holeňa 13 (z 71)
Mahalanobisova vzdálenost Vzdálenost realizací x,y náhodných vektorů X,Y splňujících Var X=VarY=Σ pozitivně definitní eukleidovská vzdálenost Neznáme-li EX, EY, Σ, používáme odhady na základě dat (x 1,y 1 ),,(x m,y m ): MPI, 9. týden LS, Martin Holeňa 16 (z 71)
Další míry podobnosti Podobnost náhodných veličin: dle korelačních koeficientů Pearsonův (= lineární): Spearmanův : Kendallův : Podobnost binárních vektorů (~ nominálním datům) Hammingova vzdálenost : MPI, 9. týden LS, Martin Holeňa 19 (z 71)
Od podobnosti k fuzzy množinám Možná interpretace podobnosti: neurčitá rovnost Zobecnění: neurčitá příslušnost u U (univerzum) k množině A A=(U, μ A ) fuzzy množina, μ A :U [0,1] funkce přísušnosti k A μ A (x) stupeň příslušnosti x, μ > 0 nosič μ, μ = 1 jádro μ jádro { 1 bod interval } fuzzy { číslo interval } Stupňování: μ(x) je fuzzy μ je fuzzy 2. stupně MPI, 9. týden LS, Martin Holeňa 22 (z 71)
Operace s fuzzy množinami A B : μ A B (x) = μ A (x) μ A (x), : [0,1] 2 [0,1] je t-norma A B : μ A B (x) = μ A (x) μ A (x), : [0,1] 2 [0,1] je t-konorma A c =S\A (doplněk fuzy množiny): μ A c (x) = 1-μ A (x) Souvislost s fuzzy logikami μ A modeluje pravdivost φ μ A B modeluje pravdivost φ &ψ (různé fuzzy logiky různé ) μ A B (μ A c ) obecně nemodeluje pravdivost φ ψ ( φ) MPI, 9. týden LS, Martin Holeňa 30 (z 71)
T-normy Vlastnosti: shodné v x 0=0 y =0, x 1=x, 1 y =y, rostoucí v x,y, 0<x,y <1 0 x y min(x,y), komutativní, asociativní Příklady: drastická, minimová = Gödelova ( logika) součinová ( logika) prod(x,y)=xy Łukasiewiczova ( logika) W (x,y)=max(0,x+y-1) rodiny, např. Hamacherova MPI, 9. týden LS, Martin Holeňa 34 (z 71)
T-konormy Vlastnosti: shodné v x 1=1 y =1, x 0=x, 0 y =y, rostoucí v x,y, 0<x,y <1 1 x y max(x,y), komutativní, asociativní Příklady: drastická, maximová (1-max(x,y) = min(1-x,1-y)) Duální pár : 1- (x,y)= (1-x,1-y) 1- (x,y)= (1-x,1-y) de Morganovy zákony: (A B) c =A c B c, (A B) c =A c B c k prod(x,y): x+y-xy, k W(x,y): min(x+y,1), k H 2 : (fyzika) MPI, 9. týden LS, Martin Holeňa 41 (z 71)
Łukasiewicz logic, bell-shaped parametrization 1 truth value 0.9 0.8 0.7 0.6 0.5 0.5 0.4 0.3 0.2 0 x 1 x 2 0.1
Product-Łukasiewicz l., bell-shaped parametrization truth value 0.9 0.8 0.7 0.6 0.5 x 1 x 2 0.4
T-normy jako kopule Kopule C: [0,1] 2 [0,1] s vlastnostmi C (x,0)=c (0,y)=0, C (x,1)=x, C (1,y)=y, C (x 2,y 2 )-C (x 2,y 1 )-C (x 1,y 2 )+C (x 1,y 2 ) 0 někdy t-norma, vždy při C (x,y)=ψ -1 (ψ (x)+ψ (x)), ψ monotónní Příklady: kopule generovaná ψ =ln: prod(x,y)=xy = rodina generovaná ψ =ln a, a 0: x y = (Gumbel) další: min, W, mají vlastnost W(x,y) C (x,y) min(x,y) MPI, 9. týden LS, Martin Holeňa 49 (z 71)
Použití kopulí v pravděpodobnosti X,Y náhodné veličiny, rozložení (= distribuční funkce) X je F, rozložení Y je G, H : R R [0,1]. Může být H rozložení (X,Y )? Sklarova věta. H je rozložení (X,Y ) existuje kopule C splňující H(x,y)=C (F (x),g(y)) s pravděpodobností 1 Při dané t-normě použijeme implikaci např. při prod: H(x,y)=F (x)g(y) nezávislost X a Y MPI, 9. týden LS, Martin Holeňa 55 (z 71)
Fuzzy zobrazení pomocí pravidel Fuzzy zobrazení: pro u U je F (u)=(û,μ F (u) ); různé metody často pravidly: if (U, μ A 1 ) then (Û,μ B1 ),, if (U, μ Ap ) then (Û,μ Bp ) Mamdaniho metoda konstrukce F (u) pomocí pravidel nejčastěji používaná metoda ve fuzzy řízení F (u)=(b 1 μ (u)û ) (B A 1 p μ A (u)û ) v Gödelově logice p μ F (u) (û )= max(min(μ B 1 (û ), μ A1 (u)),, max(min(μ Bp (û )μ Ap (u))) MPI, 9. týden LS, Martin Holeňa 61 (z 71)
a) IF the car speed is low THEN the brake force is moderate b) IF the car speed is medium THEN the brake force is strong
Defuzz{i y}fikace Zobrazení fuzzy množiny do jejího univerza: (U, μ A ) U fuzzy-řízené přístroje potřebují konkrétní hodnotu Při použití na F (u)=(û,μ F (u) ), u U získáme zobrazení U Û Jednoduchá: maximum μ A mrhá informací o (U, μ A ), raději metoda těžiště: moment těžiště = moment tělesa MPI, 9. týden LS, Martin Holeňa 64 (z 71)
Fuzzy integrály Kombinují hodnoty funkce t-normami a t-konormami (jako Riemannův / Lebesgueův násobením a sčítáním) integrují fuzzy mírou m : podmnožiny U [0,1], m ( ), m (U )=1 Sugenův: quasi-sugenův: Choquetův: MPI, 9. týden LS, Martin Holeňa 67 (z 71)