SSD v serveru. Pavel Šnajdr InstallFest 2015

Podobné dokumenty
Storage... co je nového (SSD!)... a co se zatím nepovedlo rozbít:-)

PostgreSQL na EXT3/4, XFS, BTRFS a ZFS

PostgreSQL na EXT3/4, XFS, BTRFS a ZFS

SSD vs. HDD / WAL, indexy a fsync

Správa disků (storage) v Linuxu. Milan Brož Software Engineer / Kernel Storage / Red Hat mbroz@redhat.com

Datová úložiště v roce 2017 aneb jak si vybrat to správné?

Souborové systémy Mgr. Josef Horálek

Operační systémy 1. Přednáška číslo Souborové systémy

Efektivní využití SSD v produktech Dell: SSD za cenu HDD. Ondřej Bajer Storage Systems Engineer

Příloha č. 2A Zadávací dokumentace k Veřejné zakázce Dodávka technologického řešení pro Geoportál

Číslo projektu: CZ.1.07/1.5.00/ III/2 Inovace a zkvalitnění výuky prostřednictvím ICT. Zdeněk Dostál Ročník: 1. Hardware.

Hyperkonvergovaná řešení jako základní stavební blok moderního IT

Administrace Unixu a sítí

Když konvenční disky nestačí tempu vašich aplikací

ReDefine Midrange Storage VNX/VNXe. Václav Šindelář, EMC

Paměti Flash. Paměti Flash. Základní charakteristiky

2.1 Obecné parametry Obecné parametry Rack serveru

Pevne disky a SSD disky

nutné smazat zároveň i všechna ostatní zainteresovaná paměťová místa přepisovaném

Uchovávání dat v SSD

Oprava softwarového RAIDu po selhání. Tomáš Matějíček

Solid State Drive SSD polovodičový disk. J. Vrzal, verze 0.8

FLASH NOVÉ HRANICE DOSAŽITELNÉHO

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Technická specifikace

1x server pro distanční vzdělávání (výpočtový server)

Souborové systémy. Architektura disku

Technické a dodací podmínky

Příloha č.2 - Technická specifikace předmětu veřejné zakázky

Přednáška. Úložiště dat: HDD, SDD, RAID, DAS, NAS, SAN. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Linux RAID, LVM. 27. listopadu Uvedené dílo podléhá licenci Creative Commons Uved te autora 3.0 Česko.

Zodpovědná osoba: , do h

Polovodičové paměti. Polovodičové paměti. - Paměti Flash ROM - použití v počítačích k uchování informací o konfiguraci, Princip zápisu a čtení

Milan Heidrich Květen All Flash storage nový fenomém

Specifikace předmětu veřejné zakázky

Město Varnsdorf, nám. E. Beneše 470, Varnsdorf, Česká republika SPECIFIKACE

Paměťová média. Motto dne: Z Berkeley vzešly dvě důležité věci LSD a BSD. Nevěříme, že je to náhoda.

Bloková zařízení v LINUXu Jan Vrbata - GOPAS

RAID, LVM a souborové systémy

PRŮMYSLOVÉ FLASH DISKY

Diskové paměti nové pojmy a technologie

Technická specifikace

HDD + SSD. Autor: Kulhánek Zdeněk

Linux RAID, LVM. Ondřej Caletka

Technická specifikace ČÁST 1. Místo plnění: PČR Kriminalistický ústav Praha, Bartolomějská 10, Praha 1

Organizace a zpracování dat I (NDBI007) RNDr. Michal Žemlička, Ph.D.

BM100. Kompaktní bezventilátorový IPC z rodiny Intel Apollo Lake. REM-Technik je výhradním partnerem společnosti ASEM na českém a slovenském trhu.

Specifikace minimální konfigurace zboží Příloha č. 1. Specifikace minimálních požadavků na vybrané parametry zboží

MARIE PACS S PACSem hezky od podlahy když se data sypou!

Data Sheet Fujitsu PRIMERGY RX100 S6 Jednopaticový server v provedení rack (1U)

Miroslav Flídr Počítačové systémy LS /21- Západočeská univerzita v Plzni

HIGH PERFORMANCE SOLID STATE DRIVES V SERVERECH

Datasheet Server FUJITSU PRIMERGY TX1310 M1 Server v provedení tower

Violin Technologický partner Fujitsu. Bleskově zrychlete váš business. Martin Káňa Storage World. Copyright 2011 FUJITSU

Základní deska (mainboard)

CHARAKTERISTIKA VEŘEJNÉ ZAKÁZKY

Red Hat Enterprise Virtualization

Hardware a komunikační technologie

Specifikace předmětu veřejné zakázky

Technické a dodací podmínky

Zálohovací zařízení pro repozitář jazykových dat a digitálního materiálu pro jazykový výzkum

Datasheet Fujitsu PRIMERGY RX300 S7 Dvoupaticový server v provedení do racku (2U)

SERVERY A STORAGE ABACUS Jan Petrák jp@abacus.cz

Virtualizace koncových stanic Položka Požadováno Nabídka, konkrétní hodnota

Zadávací dokumentace na veřejnou zakázku malého rozsahu s názvem Obměna informačních technologií

MODERNÍ SOUBOROVÉ SYSTÉMY - ZFS. Richard Janča

Herní PC HAL3000 Artemis výkonný lovec pro nekončící zábavu

Datasheet Fujitsu PRIMERGY TX200 S7 Server

Datasheet Fujitsu PRIMERGY TX120 S3p Server

Technická specifikace HW pro Upgrade systému NS-VIS PROD

TECHNICKÁ SPECIFIKACE PŘEDMĚTU VEŘEJNÉ ZAKÁZKY. Pořízení Počítačů a strojů na zpracování dat 2017 pro Vysokou školu polytechnickou Jihlava

Přednáška. Systémy souborů. FAT, NTFS, UFS, ZFS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Dne: AMD Bristol Ridge Athlon X C/4T (3,8GHz,2MB,65W,AM4) box 1 ASUS s.am4 PRIME A320M-R-SI, AMD A320 Ryzen,2xDDR4,mATX 1

Souborový systém (File System FS) Souborové systémy. Souborová fragmentace. Disková fragmentace. Organizace dat na pevném disku

SSD akcelerátor v PCIe slotu. Až 25 SSD/SAS/NL-SAS disků na jeden server

výrobce: Oracle typové a modelové označení: SPARC T7-2 server 2x SPARC M7 4,13 GHz 32 cores min. 256 GB, rozšiřitelná na 512

Příloha č. 3 - k zadávací dokumentaci Technické a dodací podmínky

Forenzní analytická jednotka - technická specifikace (9 ks)

Základní deska (mainboard, motherboard)

Kupní smlouva Dynamický nákupní systém Pk Výpočetní technika Výzva 45 - Dodávka Diskových polí KUPNÍ SMLOUVA

Operační systémy a sítě

Datasheet Server FUJITSU PRIMERGY RX4770 M2 Čtyřpaticový server v provedení do racku (4U)

Administrace OS Unix. filesystém UFS mount snapshot RAID

SMB a Enterprise řešení

Část 1. Technická specifikace. Posílení ochrany demokratické společnosti proti terorismu a extremismu

Výzva k podání nabídky včetně zadávací dokumentace na veřejnou zakázku malého rozsahu

Systémy souborů (File Systems)

RAID. Uživatelská příručka

Datasheet FUJITSU PRIMERGY CX2560 M4 Škálovatelné servery PRIMERGY CX

Příloha č. 1 k čj.: 1/120/ Technická specifikace Zajištění HW a dlouhodobé podpory infrastruktury Intel pro VoZP ČR

Metody připojování periferií

Ing. Šárka Endrlová, starostka. Ing. Jana Dvořáková.

Datasheet SanDisk Řada PCIe-SSD Fusion iomemory PX600 Server

HAL3000 MČR Pro tak hrají skuteční profesionálové

Datasheet Server FUJITSU PRIMERGY BX920 S3 Dvoupaticový modul blade server

» STORAGE A SERVERY ABACUS Jan Petrák jp@abacus.cz

Datasheet Server FUJITSU PRIMERGY TX100 S3p Server v provedení tower

Linux připojování zařízení. 6 praktická část

Průzkum před testováním použitelnosti

Datasheet Fujitsu PRIMERGY RX100 S7 Jednopaticový server v provedení rack (1U)

Transkript:

SSD v serveru Pavel Šnajdr InstallFest 2015

Obsah Historie moderních SSD Jak funguje SSD Vybíráme SSD SSD v serveru pod Linuxem Vlastní zkušenost Diskuze

Historie moderních SSD SSD založené na NAND flash 1989 Toshiba Průkopníkem v oboru SanDisk, první SSD v r. 1991 1995 Simple Technology začíná vyrábět SSD, v r. 2000 se přejmenovává na stec, Inc., 2007 $1B 1999 První 3.5 vlaštovky 2002 Založení OCZ 2008 Intel X25-M, X25-E, 2009 gen. 2, o 60% levnější

Historie moderních SSD

Jak funguje SSD

Jak funguje SSD

Jak funguje SSD SLC MLC TLC Bits per cell 1 2 3 P/E cycles (2x nm) 100 000 3 000 1 000 Read time 25us 50us 75us Program time 200-300us 600-900us 900-1300us Erase time 1.5-2ms 3ms 4.5ms

Jak funguje SSD

Jak funguje SSD

Jak funguje SSD

Správa flash paměti Správa vadných bloků Náhradní bloky (spare area) Wear leveling Garbage collection

Provedení a rozhraní Provedení a rozhraní PCIe PCIe-to-SAS/SATA FP/LP karta NVMe 2.5 disk / karta 3.5 /2.5 /1.8 disk SATA3, SAS2 (6 Gbps) SAS3 (12 Gbps) msata M.2

NVMe SFF

Vybíráme SSD Provedení a rozhraní Kapacita Overprovisioning (spare area, náhradní bloky) Množství zapsaných dat, než odejde IOPS, latence Konzistentnost výkonu v čase Ochrana proti ztrátě napájení AnandTech reviews (http://anandtech.com)

Consumer-grade SSD v serveru Většina není odolná proti ztrátě napájení OK: Crucial MX100, MX200, M500, M550 Ideálně: Intel 530 TLC moc nevydrží Spare area bývá okolo 7% při nejlepším Špatná konzistence výkonu v čase Vhodné max pro méně vytížené servery nebo pro SSD-only konfigurace Ideálně nevyužívat celou kapacitu

Datacenter-grade SSD 2.5 SATA3 Intel 730 Intel DC S3500/S3700 (S3610/S3710) NVMe SFF Samsung XS1715 Intel DC P3600/P3700 (i ve formě PCIe karet) SAS2/SAS3 Hitachi, Seagate, Toshiba Fusion-IO

SSD v serveru pod Linuxem IO je častý bottleneck aplikací Jestli i u Vás, už SSD máte mít :) Data nativně na SSD vs. použití jako cache pro rotační disky Databáze IOPS ~> TPS SATA SSD AHCI mód řadiče (NCQ)

I/O Scheduler Default většinou CFQ Přerovnává I/O v závislosti na LBA Má zbytečnou latenci Použijte deadline/noop # echo deadline > /sys/block/$yourdrive/queue/scheduler

TRIM Informuje SSD o nepoužívaných LBA Na serveru ke zvážení Lepší alternativou je zvýšit overprovisioning (spare area) Případně fstrim v idle periodách (cron) Doporučuje se jednou týdně

Oddíly a LVM Zarovnání na stránky Pokud si nejste jistí, zarovnávejte na 1MB (moderní distra to dělají automaticky) Zarovnání na erase block nedává smysl Vytvářejte FS s velikostí bloku rovnou stránce mkfs.ext4/mkfs.xfs -b 8k mkfs.btrfs -n 8k

Oddíly a LVM TRIM pro LVM v /etc/lvm/lvm.conf V sekci devices: issue_discards = 1

RAID RAID0 pro ještě vyšší výkon RAID1 jako ochrana proti úmrtí elektroniky RAID10 RAID5/RAID6 nedávají příliš smysl (opotřebení NAND bude podobné a začnou umírat najednou) K diskuzi Chunk size!= page size MDRAID umí TRIM, LVM RAID ne

Swap swapon -o discard[=policy] discard=once discard=pages discard /dev/sda1 none swap defaults,discard 0 0

Filesystemy TRIM podporují: Btrfs, Ext4, JFS, VFAT, XFS fstrim nepodporuje VFAT mount flag -o discard podpora na cestě pro ZFSonLinux Btrfs flag -o ssd flag -o ssd_spread

Flashcache https://github.com/facebook/flashcache/ Facebook, 2010 Primárně pro akceleraci InnoDB (MySQL) Read i write cache 3 módy write-back write-through write-around Nastavitelné eviction mechanismy FIFO LRU-2Q, konfigurovatelný middle point

Flashcache Device mapper, ze dvou blkdev dělá jedno Konfigurace přes sysctl dev.cachedev+slowdev.* skip_seq_thresh_kb Nepodporuje TRIM

EnhanceIO https://github.com/stec-inc/enhanceio stec, Inc., 2012, fork Flashcache Přepsaný write-back režim Komprimovaná metadata Nepoužívá device mapper Cache device se dá odebrat za běhu Nyní pozadu oproti Flashcache Podporuje (zatím) až Linux 3.18

bcache V jádře od 3.10 RHEL6 ze hry 2 módy write-trough Write-back Konfigurace v /sys/block/yourcachedev/bcache cache_mode sequential_cutoff Cache zařízení manipulovatelná za běhu

dm-cache V jádře od 3.9 Device mapper modul Umí separátní zařízení na metadata 3 módy write-back write-through pass-through Replacement policies multiqueue cleaner

ZFS ZFSonLinux (https://github.com/zfsonlinux/zfs) L2ARC SLOG pro ZIL

Vlastní zkušenost vpsfree.cz používá SSD od 2011 Začínali jsme s Intel 320 a OCZ Vertex 2 Dobíhají OCZ Vertex 3 (240 GB in prod) Od 2013 kupujeme Intel DC S3700 200 GB Nejstarší Vertex 3 120 GB mají zapsáno ~70TB Na nich jela Flashcache Flashcache do Q2 2014 Větší počet MySQL instancí problém ZFS od Q2 2013 na prvních strojích, Q2 2014 plný přechod Největší benefit je dedicated SLOG device L2ARC

Diskuze Vaše zkušenosti Dotazy RAID a SSD