Třídící algoritmy. Insert Sort. Bubble Sort. Select Sort. Shell Sort. Quick Sort. Merge Sort. Heap Sort. Tomáš Bayer bayertom@natur.cuni.cz Katedra aplikované geoinformatiky a kartografie, Přírodovědecká fakulta UK. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 1 / 66
Obsah přednášky 1 Vybrané třídící algoritmy a jejich dělení 2 Třídění přímým vkládáním 3 Třídění binárním vkládáním 4 Bublinkové třídění 5 Třídění přímým výběrem 6 Třídění se zmenšujícím se krokem 7 QuickSort 8 Třídění sléváním 9 Halda a třídění haldou 10 Přehled třídících algoritmů Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 2 / 66
1. Třídění: Vybrané třídící algoritmy a jejich dělení Postup, při kterém uspořádáváme vzestupně nebo sestupně prvky zadané posloupnosti X, X = {x 1,..., x n,n... počet prvků. Nejčastěji se jedná o posloupnost čísel, všechny prvky stejného datového typu. Vzestupné setřídění: Pro x i X x i x i+1,i 0, n 2. Sestupné setřídění: Pro x i X x i x i+1,i 0, n 2. Záměna vzestupného třídění za sestupné: prohození znaménka < za > v třídícím algoritmu. Důvod třídění: Snaha o uspořádání dat a zefektivnění operací s nimi. Nad setříděnými daty lze navíc provádět řadu operací efektivněji (tj. s nižší časovou i pamět ovou složitostí) než nad nesetříděnými daty, Tomáš např. Bayer vyhledávací bayertom@natur.cuni.cz algoritmy. (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 3 / 66
Vybrané třídící algoritmy a jejich dělení 2. Dělení třídících algoritmů: Dvě skupiny třídících algoritmů: vnitřní třídící algoritmy Prvky tříděné posloupnosti nacházejí uvnitř paměti počítače. K jednotlivým prvkům posloupnosti lze přistupovat v libovolném pořadí, Počet prvků n předem znám. vnější třídící algoritmy Data uložena na nějakém periferním zařízení. Počet prvků posloupnosti není znám předem, k prvkům lze přistupovat pouze sekvenčně. Rozsáhlá data, která se nevejdou do paměti počítače. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 4 / 66
Vybrané třídící algoritmy a jejich dělení 3. Efektivita třídících algoritmů: Kritéria efektivity třídících algoritmů: počet přesunů prvků nutný k setřídění posloupnosti, počet porovnání prvků nutný k setřídění posloupnosti. Náročnost kroků: Oba kroky mají různou náročnost. Přesun prvku je výpočetně náročnější než jeho porovnání s jiným prvkem (3 operace vs 1 operace). Minimalizace množství přesunů při třídění. Efektivnější provádět přesuny prvků na větší vzdálenosti: jeden posun o n prvků výhodnější než n posunů o 1 prvek. Časová složitost třídících algoritmů: Nejpomalejší algoritmy dosahují odhadu složitosti O(N 2 ), nejrychlejší O(N log N). Nižší složitosti při třídění nelze dosáhnout, neexistuje tedy algoritmus s Tomáš odhadem Bayer bayertom@natur.cuni.cz složitosti O(N). (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 5 / 66
Vybrané třídící algoritmy a jejich dělení 4. Přehled třídících algoritmů Existuje velmi mnoho třídících algoritmů. V praxi se používá pouze malé procento z nich, ostatní představují spíše akademický problém. Vybrané elementární třídící algoritmy (v praxi nepoužívané): Třídění přímým vkládáním (Insert Sort) Třídění binárním vkládáním (Insert Binary Sort) Bublinkové třídění (Bubble Sort) Třídění přímým výběrem (Select Sort) Třídění se zmenšujícím se krokem (Shell Sort) Vybrané profesionální třídící algoritmy: Quick Sort Třídění slučováním (Merge Sort) Třídění haldou (Heap Sort) Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 6 / 66
Třídění přímým vkládáním 5. Třídění přímým vkládáním: Insert Sort. Vhodný pro částečně setříděné posloupnosti. Rychlejší než ostatní algoritmy s kvadratickou složitostí (Bubble Sort, Select Sort). Složitost O(N 2 ), počet přesunů C max = 0.5(n 2 + n 2), C min = 0.25(n 2 + 9n 10). Inspirován chováním hráče karet při jejich třídění. Hráč si vezme z balíčku karty a na základě jejich velikosti a barvy je zařazuje mezi ostatní karty. Karty má rozděleny na dvě podmnožiny: karty k setřídění a karty již setříděné. Z nesetříděné podmnožiny vezme první kartu a vloží ji na správné místo v setříděné podmnožině. Postup opakuje, dokud má k dispozici nějakou nesetříděnou kartu. Základem dalších algoritmů: Insert Binary Sort či Shell Sort. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 7 / 66
Třídění přímým vkládáním 6. Princip třídění přímým vkládáním: Dvě podmnožiny: podmnožina setříděných prvků S a podmnožina nesetříděných prvků N. Start: dim(s) = 0, dim(n) = n. Prvek x 0 v nesetříděné podmnožině ponecháme na stejné pozici Prvek x 1 porovnáme s prvkem x 0. Je -li x 1 > x 0, ponecháme prvky beze změny. V opačném případě zařadíme x 1 na první pozici a odsuneme x 0 o jednu pozici vpravo. Prvek x 2 porovnáme s prvky x 0, x 1. Zařadíme prvek na správnou pozici, prvek/prvky větší než x 2 odsuneme směrem doprava. Postup opakujeme, dokud nesetříděná část obsahuje alespoň jeden prvek. End: dim(s) = n, dim(n) = 0. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 8 / 66
Třídění přímým vkládáním 6. Porovnávání prvků Již setříděná posloupnost tvořena prvky {x 0,..., x i 1, Vkládaný prvek označen jako x i. Zatím nesetříděná posloupnost tvořena prvky {x i,..., x n 1. Prvek x i 1 představuje zarážku dělící posloupnost na dvě podmnožiny. Princip porovnávání: Prvek x i porovnáme s posledním setříděným prvkem x i 1. Pokud x i x i 1, prvek x i je na správné pozici. Inkrementujeme i = i + 1, opakujeme postup s následující dvojicí prvků. Pokud x i < x i 1, prohodíme prvky x i a x i 1. Prohozený prvek x i 1 porovnáme s předchozím prvkem x i 2. Pokud není splněna podmínka x i 1 x i 2, prohodíme prvky x i 1 a x i 2 Pokračujeme analogickým způsobem, dokud vkládaný prvek není na správné pozici konec. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 9 / 66
Třídění přímým vkládáním 7. Znázornění algoritmu Insert Sort Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 10 / 66
Třídění přímým vkládáním 8. Zdrojový kód Insert Sort: Realizován dvojicí cyklů. Vnější probíhá nad všemi prvky. Vnitřní, dokud není prvek na správném místě. void insertsort(double x []) { for(int i = 0;i < x.length; i++) { int j = i; //Zapamatuj index zpracovávaného prvku double prvek = x[i]; while (j > 0 && x[j-1] > prvek) //Porovnavani s seteridenou cas { temp = x[j]; //Prohozeni za pouziti x[j] = x[j-1]; //pomocne promenne temp x[j-1] = temp; j = j - 1; //Dekrementace indexu Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 11 / 66
Třídění přímým vkládáním 9. Modifikace algoritmu přímého vkládání Nepoužíváme zarážku, v každém porovnávání neprohazujeme testovaný prvek s prvkem předchozím. Prvky pole nacházející se vlevo od testovaného prvku větší než tento prvek posunujeme v každém kroku o 1 pozici vpravo. Do vzniklé mezery zapíšeme testovaný prvek. void insertsort(double x []) { for(int i = 0;i < x.length; i++) { int j = i; double prvek = x[i]; while (j > 0 && x[j-1] > prvek) { x[j] = x[j-1]; j = j - 1; x[j] = prvek; //Posun prvku o 1 pozici vpravo //Dekrementace indexu //Zarazeni prvku na spravne misto Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 12 / 66
Třídění binárním vkládáním 10. Třídění binárním vkládáním =Insert Binary Sort. Vylepšené třídění vkládáním, snaha urychlit nalezení místa, kam prvek patří. Pro urychlení používáme binární vyhledávání (O(log 2 N) vs. O(N) ). Princip algoritmu: Binární vyhledávání probíhá v setříděné části pole v intervalu < 0, i 1 >. V indexu l Binary Search bude uložena správná pozice prvku x[i]. Následně odsuneme všechny prvky v intervalu < l, i 1 > o jednu pozici vpravo. Na pozici l přesuneme kopírovaný prvek. Výrazné navýšení rychlosti algoritmu. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 13 / 66
Třídění binárním vkládáním 11. Zdrojový kód binárního vkládání void insertbinarysort(double x[]) { for (int i = 0; i < x.length; i++) { int j = i; double prvek = x[i]; int l = 0, p = i - 1; //Levy a pravy index while (l <= p) { //Binary Search int k = (l + p) / 2; if (prvek > x[k]) l = k + 1; else p = k - 1; while (j > l) { //Index l = hledana pozice x[j] = x[j - 1]; //Posun prvku o 1 pozici vpravo j = j - 1; //Dekrementace indexu x[l] = prvek; //Zarazeni prvku na spravne misto Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 14 / 66
12. Bublinkové třídění Bublinkové třídění Bubble Sort. Nejpomalejší ze všech uvedených. Nevhodné pro částečně setříděné posloupnosti, běží naprázdno (možné odstranit). Složitost O(N 2 ), počet přesunů C max = 0.75(n 2 n). Popis algoritmu: Odvozen od chování vzduchových bublinek limonádě, které postupně stoupají vzhůru k hladině. Porovnávány dva sousední prvky x i a x i 1. Pokud x i < x i 1, prohodíme oba prvky. V opačném případě je ponecháme ve stejném pořadí a porovnáme následující dvojici prvků. Porovnávání začíná od konce pole. Prvky s menší hodnotou se postupně přesouvají zprava doleva jako bublinky v limonádě. Po prvním průchodu prvek x 0 představuje minimum, v dalším kroku již nemusíme procházet celé pole, ukončíme ho na prvku x 1. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 15 / 66
Bublinkové třídění 13. Znázornění algoritmu Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 16 / 66
Bublinkové třídění 14. Zdrojový kód Realizován dvojicí cyklů. Vnější probíhá nad všemi prvky. Vnitřní o 1x méně. void bubblesort(double x []) { for (int i = 0;i < x.length; i++) { for (int j = x.length-1; j > i; j--) //Prohledavani od konce { if (x[j] < x[j-1]) { double temp = x[j]; //Prohozeni za pouziti x[j] = x[j-1]; //pomocne promenne temp x[j-1] = temp; Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 17 / 66
Bublinkové třídění 15. Zhodnocení algoritmu Nesymetrická rychlost bublání prvků: Prvky malých hodnot stoupají rychleji než prvky velkých hodnot klesají. Po prvním vykonání vnitřního cyklu se minimální hodnota nachází na první pozici, zatímco nejvyšší hodnota se posune pouze o jednu pozici. Nevýhoda třídění bubláním: Značná závislost na vstupních datech. Pokud jsou vstupní data ve tvaru, kdy je většina prvků již setříděna, algoritmus běží v některých krocích naprázdno, neprovádí žádné prohazování. Pokud bychom na vstup dali již setříděná data, proběhnou oba cykly včetně testovací podmínky. Časová složitost: Časová složitost třídění bubláním je O(N 2 ). Nelze použít pro rozsáhlá data. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 18 / 66
Bublinkové třídění 16. Modifikace bublinkového třídění Odstranění prázdných kroků. Pomocná proměnná typu boolean sort, pokud je true, posloupnost je setříděna. void bubblesort(double x []) { bool sort = false; for (int i = 0;!sort; i++) { sort = true; for (int j = x.length - 1; j > i; j--) { if (x[j] < x[j-1]) { double temp = x[j]; x[j] = x[j-1]; x[j-1] = temp; sort = false; //Setridena posloupnost //Prohledavani od konce //Prohozeni za pouziti //pomocne promenne tep //Neni setridena posloupnost Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 19 / 66
Tomáš Nelze Bayer bayertom@natur.cuni.cz použít pro rozsáhlejší (Katedra aplikované data. Třídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 20 / 66 Třídění přímým výběrem 17. Třídění přímým výběrem: Select Sort. Efektivnější než Insert Sort. Používá se na dotřídění krátkých posloupností u algoritmu QuickSort. Složitost O(N 2 ), počet přesunů C max = 0.25N 2 + 3(N 1). Popis algoritmu: Předchozí techniky třídění využívaly porovnání aktuálního prvku x i s ostatními prvky posloupnosti, na základě výsledku této relace s prvkem x i prováděly další operace. Tato metoda třídění nevybírá prvky z nesetříděné části posloupnosti sekvenčně, ale na základě jejich hodnoty. Prvek je vložen do setříděné části na předem známou pozici, která se již v průběhu třídění nemění, v předchozích algoritmech se jeho hodnota měnila (odsouvání či prohazování).
18. Princip algoritmu Třídění přímým výběrem Tříděná posloupnost je rozdělena na dvě části: levá obsahuje již setříděné prvky posloupnosti ve správném pořadí, pravá prvky dosud nesetříděné. Start: dim(s) = 0, dim(n) = n. 1 V prvním kroku nalezneme hodnotu x min = min(x i ), i = 1,.., N, tj. prohledáváme celou posloupnost prvků. 2 Hodnotu x min prohodíme s hodnotou x 0. Prvek x 0 se nachází na správné pozici, jeho poloha se již v průběhu třídění nebude měnit. 3 V druhém kroku hledáme minimum z nesetříděné části prvků, tj. x min = min(x i ), i = 2,.., N. Tento prvek prohodíme s prvkem x 1. Poloha prvku x 1 se již při dalším třídění nebude měnit. 4 Opakujeme. 5 Poslední nesetříděný prvek x n bude umístěn na správném místě. End: dim(s) = n, dim(n) = 0. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 21 / 66
Třídění přímým výběrem 19. Ukázka algoritmu Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 22 / 66
20. Zdrojový kód Třídění realizováno dvojicí cyklů. Třídění přímým výběrem void selectsort(double x []) { for (int i = 0; i < x.length - 1; i++) { double min = x[i]; int index = i; for (int j = i; j < x.length; j++) { if (min > x[j]) { min = x[j]; index = j; double temp = x[i]; x[i] = min; x[index] = temp; //Inicializace minima //Inicializace indexu //Hledani minima //Prohozeni promennych Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 23 / 66
Třídění přímým výběrem 21. Modifikace algoritmu Ve vnitřním cyklu nebudeme hledat minimum, ale pouze index minima. void selectsort(double x []) { for (int i = 0; i < x.length; i++) { int index = i ; for (int j = i; j < x.length; j++) { if (x[index]> x[j]) index = j; double temp = x[i]; x[i] = x[index]; x[index] = temp; //Inicializace indexu //Hledani indexu minima //Prohozeni promennych Modře znázorněno hledání indexu minima. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 24 / 66
Třídění se zmenšujícím se krokem 22. Třídění se zmenšujícím se krokem =Shell Sort. Eliminuje neefektivitu předchozích algoritmů spočívající v prohazování na krátké vzdálenosti. Neprohazuje pouze sousední prvky, provádí prohazování prvků s krokem h. Takový soubor nazýván h setříděný. Krok h se neustále zmenšuje, pro h = 1 je soubor setříděn. Možnosti volby kroku h: h i = 3h i 1 + 1, h i = 2h i 1 + 1. Posloupnosti se střídajícími se lichými a sudými členy: h = {1, 4, 13, 40, 121, 364, 1093, 3280, 9841,... h = {1, 3, 7, 15, 31, 63, 127, 255, 511, 1023,... Pro malé kroky h už zbývá málo prohozů, většina vykonána v předcházejících krocích s větším h. Výhodou snížení složitosti až na O(N 1.2 ), nejpříznivější ze všech elementárních Tomáš algoritmů. Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 25 / 66
Třídění se zmenšujícím se krokem 23. Princip algoritmu Algoritmus je zobecněním Insert Sortu (nejčastější). Pro prohazování však existují i jiné metody (např. bublání). Shell Sort pro h = 1 Insert Sortem nad již částečně setříděnou posloupností. Postup: Výpočet iniciační hodnoty kroku h = 3h + 1, h < n. Opakuj pro h = h/3 Insert Sort s krokem h. Neporovnáváme sousední prvky x[j] a x[j 1], ale x[j] a x[j h]. Důsledky: Ve vnějším cyklu Insert Sort nahradíme inicializaci i=0 za i = h Ve vnitřním cyklu Insert Sortu nahradíme všechny výskyty indexu j 1 za j h. Jednoduchá implementace, pouze malá změna algoritmu Insert Sort přinese značné zvýšení výkonu. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 26 / 66
Třídění se zmenšujícím se krokem 24. Ukázka algoritmu Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 27 / 66
Třídění se zmenšujícím se krokem 25. Ukázka algoritmu Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 28 / 66
26. Zdrojový kód Třídění se zmenšujícím se krokem public void shellsort(double x[]) { int h; for (h = 1; h < x.length - 1; h = 3 * h + 1); //Nastaveni h for (h /= 3; h > 0; h /= 3) { for (int i = h; i < x.length; i++) { //Inkrementace i o int j = i ; double prvek = x[i]; while ((j >= h) && (x[j - h] > prvek)) { x[j] = x[j - h]; //Posun prvku o h pozic j = j - h; //Dekrementace indexu o x[j] = prvek; //Zarazeni prvku na spra Modře znázorněn Insert Sort. Pozor: netestujeme prvky x[j] a x[j-1] ale x[j] a x[j-h]! Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 29 / 66
QuickSort 28. QuickSort Jeden z nejpoužívanějších třídících algoritmů. Využívá principu rozděl a panuj, lze implementovat rekurzivně i nerekurzivně. Vysokého výkonu dosáhne prohazování prvků na velké vzdálenosti. Inspirace: Posloupnost prvků seřazených sestupně: i 1, n platí x i x i+1. Pokud bychom chtěli takovou posloupnost setřídit vzestupně, jako velmi rychlý by se jevil následující postup prohazování: x 1 x n, x 2 x n 1,..., tj. výměna prvního prvek s posledním, druhého s předposledním, atd. V takovém případě nebude potřeba k setřídění n 1 výměn, ale pouze n/2. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 30 / 66
29. Princip QuickSortu QuickSort V prvním kroku je zvolena střední hodnota x, tzv. pivot. Posloupnost je uspořádána rozdělením na dvě části tak, že levá část obsahuje prvky x i < x, pravá část prvky x i > x. Hodnota pivotu x může být zvolena náhodně, představovat medián či aritmetický průměr (viz dále). Každá z těchto částí je stejným způsobem rekurzivně rozdělena. Počty úseků se s každým dělením zdvojnásobují, délky úseků (tj. počty prvků) snižují na polovinu. Dělení provádíme tak dlouho, dokud délky úseků nejsou rovny jedné. V takovém případě je posloupnost setříděna. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 31 / 66
QuickSort 30. Volba pivota B) první prvek x = x 1 Pivot je představován prvním prvkem z posloupnosti. Jedná se o nejméně výhodnou volbu, složitost třídění O(N 2 ). Degenerovaný strom, výška N 1. B) medián x = x Nejlepší varianta, strom s výškou log 2 (N). Ale složitost nalezení mediánu je O(N). Složitost celkem O(N 2 ). C) náhodný prvek x = rand(x i ) Nejčastěji používaná varianta, složitost algoritmu je (N log N), ale O(N 2 )! Algoritmus je ve většině případů téměř tak rychlý, jako při použití mediánu. Pravděpodobnost, že při každém náhodném volání nalezen první prvek, malá. Nevýhodou algoritmu QuickSort je jeho proměnná časová složitost závisející Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 32 / 66
QuickSort 31. QuickSort Pseudokód algoritmu QuickSort QuickSort(double [] pole, int levy, int pravy) { int m = (int)(0.5 * (l + p)); //Prostredni prvek /* Vlastni trideni */ QuickSort(pole, levy, m-1); QuickSort(pole, m+1, pravy); //Setrideni leve poloviny //Setrideni prave poloviny QuickSort lze realizovat s použitím rekurze či převodem na zásobník. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 33 / 66
QuickSort 32. Prohazování prvků v QuickSortu Snaha prohazovat co nejvzdálenější prvky: Od prvku x 1 postupujeme směrem vpravo a hledáme prvek, pro který platí x v > x. Od prvku x n postupujeme směrem vlevo a hledáme prvek, pro který platí x m < x. Oba prvky prohodíme. Uprostřed pole se směry prohledávání setkají, v takovém případě je postup ukončen. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 34 / 66
QuickSort 25. Znázornění algoritmu QuickSort Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 35 / 66
QuickSort 33. Zdrojový kód prohazování prvků Vnější cyklus probíhá, dokud je prvky vlevo od pivotu větší než vpravo od pivotu. while(i < j) { while (x[i] < piv) i = i + 1; while (piv < x[j]) j = j - 1; if (i <= j) { double pom = x[i]; x[i] = x[j]; x[j] = pom; i = i + 1; j = j - 1; //Hledani prvku zleva, ktery se vymeni //Hledani prvku zprava, ktery se vymeni //Prohozeni obou prvku //Posun leveho indexu vpravo //Posun praveho indexu vlevo Určení pivota: piv = [int((l + p)/2)] ve snaze se co nejvíce přiblížit mediánu. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 36 / 66
QuickSort 34. Zdrojový kód QuickSortu void QuickSort(double x [], int l, int p) { int i = l; int j = p; double piv = x[int((l + p) / 2)]; //Urceni pivota while(i < j) { while (x[i] < piv) i = i + 1; //Hledani prvku zleva, ktery se vymeni while (piv < x[j]) j = j - 1; //Hledani prvku zprava, ktery se vymeni if (i <= j) //Prohozeni obou prvku { pom = x[i]; x[i] = x[j]; x[j] = pom; i = i + 1; j = j - 1; if (l < j) QuickSort(x,l,j); //Rekurze if (i < p) QuickSort(x,i,p); //Rekurze //Posun leveho indexu vpravo //Posun praveho indexu vlevo Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 37 / 66
QuickSort 35. Zhodnocení algoritmu QuickSort Algoritmus QuickSort je velmi efektivní pro třídění velkých polí. Nejrychlejší třídící algoritmus. Jeho efektivita velmi výrazně závislá na volbě pivota, nejrychlejší levá a pravá část stejně velké. Z tohoto důvodu není používán v časově kritických aplikacích. Pro třídění malých polí (cca do 12 prvků) je překvapivě málo efektivní, dosahuje horších výsledků než Insert Sort. V praxi je QuickSort ukončován, pokud je délka posloupnosti získaná rekurzivním dělením kratší než 12 prvků. Posloupnost následně dotříděna jiným způsobem, např. Select Sort. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 38 / 66
36. Tříděné sléváním Třídění sléváním = Merge Sort Založen na principu Rozděl a panuj, rekurzivní algoritmus (rozděl = rekurze, spoj = merge). Využívá princip zatřid ování sloučení dvou menších setříděných souborů do jednoho většího setříděného souboru. Složitost algoritmu (na rozdíl od QuickSortu) vždy, není závislá na pivotovi. Ve většině případů je MergeSort pomalejší než QuickSort, není však citlivý vůči vstupním datům, stabilní. Používán jako standardní třídící algoritmus v Javě. Princip algoritmu: Rozdělení posloupnosti s n prvky na dvě podposloupnosti s n 2 prvky. Dělení rekurzivně opakováno, dokud podposloupnosti nejsou tvořeny jedním prvkem (takové jsou považovány za setříděné). Opakované spojování dvou podposloupností v jednu seřazenou podposloupnost, dokud nevznikne setříděná posloupnost s n prvky. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 39 / 66
Třídění sléváním 37. Vlastní algoritmus třídění sléváním Pole je rozděleno na dvě části. Na každou část rekurzivně voláno setřídění. Obě poloviny následně zatříděny (spojeny). void MergeSort (double [] a, int l, int p) { int m = (l + p) / 2; //Prostredni prvek if (p <= l) return; //Prazdny interval, spojeni MergeSort(a, l, m); //Setrid levou polovinu MergeSort(a, l+1, p); //Setrid pravou polovinu merge (a, l, m, p); //Spoj poloviny zatridenim Nevýhodou dodatečná pamět na pole při zatřid ování. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 40 / 66
Třídění sléváním 38. Znázornění algoritmu 6 3 1 5 15 4 8 7 9 0 3 6 1 5 15 4 8 7 9 0 1 3 6 5 15 4 8 7 9 0 1 3 6 5 15 4 8 7 9 0 1 3 5 6 15 4 8 7 9 0 1 3 5 6 15 4 8 7 9 0 1 3 5 6 15 4 7 8 9 0 1 3 5 6 15 4 7 8 0 9 1 3 5 6 15 0 4 7 8 9 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 41 / 66
39. Druhy zatřid ování Třídění sléváním Dvoucestné zatřid ování: Pole a tvořeno n prvky, pole b tvořeno m prvky, slučované pole c tvořeno n + m prvky. Při každém průchodu cyklem nalezneme minimální hodnotu z obou polí a, b a přidáme ji do slučovaného pole c. Nutno vytvořit dvě pomocná pole, dodatečné pamět ové nároky. Režie spojená s kopírováním vstupního pole do obou pomocných polí. V praxi se nepoužívá. Zatřid ování na místě: Pouze jedno pomocné pole, rychlejší. Levá polovina pomocného pole obsahuje kopii levé poloviny vstupního pole. Pravá polovina pomocného pole obsahuje kopii pravé poloviny vstupního pole v opačném pořadí. ˇ ˇ Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikované Třídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 42 / 66
Třídění sléváním 40. Dvoucestné zatřid ování void merge(double [] c, double [] a, double [] b){ int N = a.length; int M = b.length; for (int i = 0, int j = 0, int k = 0; k < N + M; k++) { if (i == N) { //Pole a uz nema dalsi prvky c[k] = b[j]; j++; continue; //Skok na dalsi iteraci if (j == M) { //Pole b uz nema dalsi prvky c[k] = a[i]; i++; continue; //Skok na dalsi iteraci if (a[i] < b[j]) { c[k] = a[i]; //Pridani mensiho prvku i++; else { c[k] = b[j]; j++; //Pridani mensiho prvku Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 43 / 66
Třídění sléváním 41. Upravené dvoucestné zatřid ování public void merge(double[] c, int l, int mid, int p) { int n = mid - l + 1; int m = p - mid; double[] a = new double[n]; //Pomocne pole a double[] b = new double[m]; //Pomocne pole b System.arraycopy(c, l, a, 0, n); //Zkopiruj obsah pole c System.arraycopy(c, mid + 1, b, 0, m); //Zkopiruj obsah pole c int i = 0, j = 0, k = 0; for (; k < n + m; k++) { if (i == n) { c[k+l] = b[j]; j++; continue; if (j == m) { c[k+l] = a[i]; i++; continue; //Pole a uz nema dalsi prvky //Skok na dalsi iteraci //Pole b uz nema dalsi prvky //Skok na dalsi iteraci Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 44 / 66
Třídění sléváním 42. Zatřid ování na místě void merge (double [] a, int l, int m, int p) { double temp[n]; //Pomocne pole int i, j, k; for (i = m + 1; i > 1; i--) { temp[i-1] = a[i -1]; //Kopie prvniho pole // i = 1 for (j = m; j < p; j++) temp[p + m - j] = a[j+1]; //Kopie druheho pole v opacnem poradi //j = r for (k = 1; k <= p; k++) { if (a[i] < a[j]) { //Nalezeni mensiho prvku a[k] = temp[i]; //Pridani do pole i++; else { a[k] = temp[j]; //Pridani do pole j--; Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 45 / 66
Halda a třídění haldou 43. Halda Halda (heap): datová struktura představovaná binárním stromem. Proč Heap Sort použita halda s globálním minimem v kořenu. Definice: Halda představuje takovou posloupnost prvků h l, h l+1, h l+2,..., h r, že pro každý index i = l,..., r/2 platí Příklad: h i h 2i hi h 2i+1. Halda definována posloupností h 1, h 2,..., h n, kde i = n/2. Kořen stromu h 1, h 2 levý potomek, h 3 pravý potomek. Levý potomek uzlu h 2 je h 4, pravý potomek je h 5, atd. Všichni leví potomci mají sudý index, všichni praví potomci levý index. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 46 / 66
44. Ukázka haldy Halda a třídění haldou h1 h2 h3 h4 h5 h6 h7 h8 h9 h10 h11 h12 h13 h14 h15 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 47 / 66
45. Ukázka haldy Halda a třídění haldou 6 10 33 15 19 38 65 25 22 31 30 45 54 85 93 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 48 / 66
Halda a třídění haldou 46. Halda a její reprezentace Důsledky plynoucí z definice: Binární strom je haldou právě když hodnota uzlu je menší nebo rovna hodnotě potomků. Žádný uzel nemá menší hodnotu než kořen. Haldu lze reprezentovat polem, výhodou rychlý přístup. [] 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 x 6 10 33 15 19 38 65 25 22 31 30 45 54 85 93 Vztahy mezi pořadovým číslem uzlui ve stromu a indexy pole[i]: Rodič: [i/2]. Levý potomek: [2i]. Pravý potomek: [2i + 1]. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 49 / 66
Halda a třídění haldou 47. Operace nad heapem Operace nad heapem nutné k setřídění posloupnosti: přidání prvku do heapu, oprava heapu nahoru: fixheapup, oprava heapu dolů: fixheapdown, tisk heapu. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 50 / 66
Halda a třídění haldou 47. Oprava haldy nahoru Pohyb haldou od uzlu U směrem ke kořeni haldy, nemá vliv na potomky U. Stromová reprezentace: Pokud předchůdce P uzlu U má vyšší hodnotu, prohodíme U P. Pokračujeme v předchůdci U = P, dokud U není kořen. Reprezentace polem: Pokud prvek [i/2] má menší hodnotu než prvek [i], prohodíme [i/2] [i]. Pokračujeme v předchůdci i = i/2 dokud i > 1. public void fixheapup(double[] h, int i) { while (i > 1 && (h[i / 2] > h[i])) { //Opakuj pro predchudce double temp = h[i / 2]; //Prohozeni s pouzitim h[i / 2] = h[i]; //lokalni promenne h[i] = temp; i = i / 2; //Jdi na rodice Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 51 / 66
Halda a třídění haldou 48. Ukázka opravy haldy nahoru 6 19 33 15 30 38 65 25 22 31 10 45 54 85 93 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 52 / 66
Halda a třídění haldou 49. Ukázka opravy haldy nahoru (30<->10) 6 19 33 15 10 38 65 25 22 31 30 45 54 85 93 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 53 / 66
Halda a třídění haldou 50. Ukázka opravy haldy nahoru (10<->19) 6 10 33 15 19 38 65 25 22 31 30 45 54 85 93 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 54 / 66
Halda a třídění haldou 51. Oprava haldy dolů Pohyb haldou od uzlu U směrem od kořene k listům haldy, nemá vliv na předchůdce U. Stromová reprezentace: Najdi následníky uzlu U: V L, V P. Pokud V P < V L, následník V = V P, jinak V = V L (přidáváme do menšího). Pokud U > V, prohod U V, jinak ukonči. Pokračuj v prohozeném vrcholu, dokud nedosáhneme listu. Reprezentace polem: Najdi následníky uzlu [i]: [2 i], [2 i + 1]. Pokud [2 i + 1] < [2 i], následník [v] = [2 i + 1], jinak [v] = [2 i] (přidáváme do menšího). Pokud [i] > [v], prohod [i] [v] jinak ukonči. Pokračuj v prohozeném vrcholu, dokud nedosáhneme listu Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 55 / 66
Halda a třídění haldou 52. Algoritmus pro opravu haldy dolů public void fixheapdown(double[] h, int k, int n) { int i; while (2 * k <= n) { i = 2 * k; //Levy potomek if (i < n && h[i + 1] < h[i]) //Porovnani L a P potomka { i++; //Index ukazuje na mensiho potomka if (h[k] > h[i]) //Nesplneny podminky, prohodit { double temp = h[k]; h[k] = h[i]; h[i] = temp; else { k = i; break; //Ukonceny podminky, nepokracuj //Pokracuj od prohozeneho potomka Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 56 / 66
Halda a třídění haldou 53. Ukázka opravy haldy dolů 6 19 33 15 30 38 65 18 22 31 32 45 54 85 93 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 57 / 66
Halda a třídění haldou 54. Ukázka opravy haldy dolů (19<->15) 6 15 33 19 30 38 65 18 22 31 32 45 54 85 93 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 58 / 66
Halda a třídění haldou 55. Ukázka opravy haldy dolů (18<->19) 6 15 33 18 30 38 65 19 22 31 32 45 54 85 93 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 59 / 66
Halda a třídění haldou 56. Přidání prvku a do haldy Opakuj, pro x i x: Nový uzel U s hodnotou x i vytvořen na poslední hladině. Propojení uzlu U s uzlem P ležícím na předposlední hladině co nejvíce vlevo. Oprava haldy nahoru U. Heap představován polem h s délkou n+1, tj. o jednu pozici delší než počet tříděných prvků v x (přidáváme od 1). Heap plněn po řádcích, po každém vložení inkrementován index i o 1. int i = 1; for (int k = 0; k <= x.length - 1; k++) { h[i] = x[k]; //Pridej do heapu fixheapup(h, i); //Oprav heap nahoru do akt. pozice i++; //Inkrement i Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 60 / 66
Halda a třídění haldou 57. Ukázka budování haldy 3 1 3 1 3 1 1 1 3 5 3 5 3 5 6 6 2 1 1 1 2 5 2 5 2 5 6 3 6 3 9 6 3 9 4 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 61 / 66
Halda a třídění haldou 58. Vlastní třídící algoritmus Probíhá nad vybudovanou haldou poměrně triviální. Opakuj, dokud halda neobsahuje pouze kořen: Prohození kořene (minima haldy) s prvkem haldy nejnižší úrovně nejvíce vpravo. Oprava haldy dolů (v kořeni není minimum). Zkrácení haldy o prvek nejnižší úrovně nejvíce vpravo. Nad polem snadno algoritmizovatelné. Opakuj, dokud n > 1 Prohodíme h[1] a h[n]. Provedeme opravu haldy dolů z kořene. Dekrementujeme n. První výběr: nejmenší prvek, druhý výběr: druhý nejmenší prvek, atd. Jsou řazeny za koncem zkracované haldy sestupně. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 62 / 66
Halda a třídění haldou 59. Ukázka činnosti algoritmu 1 5 2 2 4 2 4 3 4 6 3 9 5 6 3 9 1 6 5 9 1 9 3 9 3 4 5 4 5 4 6 5 2 1 6 9 2 1 6 3 2 1 4 6 5 5 9 5 9 6 9 ; 6 3 2 1 4 3 2 1 4 3 2 1 Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 63 / 66
Halda a třídění haldou 59. Algoritmus Heap Sort Pouze třídící procedura: Vlastnosti algoritmu: while (n > 1) { double temp = h[1]; //Vem nejmensi prvek h[1] = h[n]; //Prohod s poslednim h[n] = temp; n--; //Zkrat heap o 1 fixheapdown(h, 1, n); Algoritmus má složitost O(N lg 2 N). Asi o 20% pomalejší než Merge Sort a o 50% pomalejší než Quick Sort. Použití pro hledání k tého nejmenšího prvku. Nevýhodou nestabilita. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 64 / 66
Halda a třídění haldou 60. Zdrojový kód (celek) public void heapsort(double[] x) { int i = 1, n = x.length; double[] h = new double[n + 1]; //Heap o jeden prvek delsi for (int k = 0; k < n; k++) //Pridej vsechny prvky,oprav heap { h[i] = x[k]; //Pridej do heapu fixheapup(h, i); //Oprav heap zdola i++; //Inkrementuj i while (n > 1) { double temp = h[1]; //Vem nejmensi prvek h[1] = h[n]; //Prohod s poslednim h[n] = temp; n--; //Zkrat heap fixheapdown(h, 1, n); Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 65 / 66
Přehled třídících algoritmů 34. Přehled třídících algoritmů Worst case Average case Selection Sort n 2 n 2 Bubble Sort n 2 n 2 Insertion Sort n 2 n 2 Merge Sort n lg n n lg n Quick Sort n 2 n lg n Heap Sort n lg n n lg n Další odkazy: http://en.wikipedia.org/wiki/sorting_algorithm http://coderaptors.com/?all_sorting_algorithms http://www.ida.liu.se/~tddb28/mtrl/demo/sorting/index.sv.shtml http://math.hws.edu/tmcm/java/xsortlab/ Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikovanétřídící geoinformatiky algoritmy. a kartografie, Přírodovědecká fakulta UK.) 66 / 66