10GE síťový prvek. switch & router. Radim Roška & Moris Bangoura 3.3. 2012. Installfest 2012 Silicon Hill



Podobné dokumenty
ISPforum 2016 Jezerka NAT++

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

AGP - Accelerated Graphics Port

Kernel a síťové karty. Michal Schmidt

Počítačové sítě internet

Vestavný modul pro počítačové vidění využívající hradlové pole

Bridging na Linuxu - příkaz brctl - demonstrace (všech) voleb na vhodně zvolených topologiích.

Architektura grafických ip pro Xbox 360 a PS3

Směrovací protokoly, propojování sítí

Forenzní analytická jednotka - technická specifikace (9 ks)

Propojování sítí,, aktivní prvky a jejich principy

Systémy pro sběr a přenos dat

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200

1x server pro distanční vzdělávání (výpočtový server)

5. Směrování v počítačových sítích a směrovací protokoly

Informační a komunikační technologie

Mikrovlnné systémy MINI-LINK

Vlastnosti Xen na univerzitě. Michal Švamberg

Projekt Liberouter hardwarová akcelerace pro sledování a analyzování provozu ve vysokorychlostních sítích

Paměti Josef Horálek

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3)

Technická specifikace ČÁST 1. Místo plnění: PČR Kriminalistický ústav Praha, Bartolomějská 10, Praha 1

Distribuované směrovací moduly Gold DFE pro řady Matrix N

Síťové prvky seznámení s problematikou. s problematikou

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Základní deska (motherboard, mainboard)

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

HW počítače co se nalézá uvnitř počítačové skříně

Platforma Juniper QFabric

Sbě b r ě n r i n ce

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Volitelný počet jader

Mikrovlnné systémy MINI-LINK

Kompaktní procesní stanice

Počítačové sítě. Miloš Hrdý. 21. října 2007

Uživatelská příručka

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

udev a kamarádi... Středisko UN*Xových technologií

Hardware 1. Přehled platforem podle procesorů. PC (Wintel) různí výrobci - domácí počítače, pracovní stanice, servery 1-4 procesory Intel, AMD

Řešení jádra sítě ISP na otevřených technologiích

Hardware 1. Přehled platforem podle procesorů

Jak se měří síťové toky? A k čemu to je? Martin Žádník

Specifikace předmětu veřejné zakázky

NMS. Linux na Strahově. Radim Roška & Moris Bangoura InstallFest Silicon Hill

Úvod do síťových technologií

Karel Johanovský Michal Bílek. Operační paměť

Směrování. static routing statické Při statickém směrování administrátor manuálně vloží směrovací informace do směrovací tabulky.

Základní deska (mainboard, motherboard)

Nové technologie v průmyslových PC

Principy ATM sítí. Ing. Vladimír Horák Ústav výpočetní techniky Univerzity Karlovy Operační centrum sítě PASNET

Budování sítě v datových centrech

Pokročilé architektury počítačů

SERVERY A STORAGE ABACUS Jan Petrák jp@abacus.cz

IM151-8 PN/DP CPU 6ES7151-8AB00-0AB0

» STORAGE A SERVERY ABACUS Jan Petrák jp@abacus.cz

Když konvenční disky nestačí tempu vašich aplikací

HP EliteBook 8440p. Záruka: 12 měsíců Cena: 5 690,- kč s DPH

Semestrální práce Úvod do architektury počítačů Základní deska (Motherboard)

CCNA I. 3. Connecting to the Network. CCNA I.: 3. Connecting to the network

Petr Holášek / 1 of 21

Projekt Turris Ondřej Filip 23 října 2014 CIF Praha

Měřicí systémy. Obsah. Systémy složené z autonomních měřicích přístrojů a modulů Sériová rozhraní. Sériová rozhraní - pokračování 1

Komunikace mikroprocesoru s okolím Josef Horálek

Konfigurace síťových stanic

Základní deska (motherboard, mainboard)

Sběrnice/sloty pro zásuvné karty

Město Litvínov se sídlem Městský úřad Litvínov, náměstí Míru 11, Litvínov odbor systémového řízení

5 790,- únor ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

Fujitsu Siemens Lifebook S752

Představení procesorů od firmy Tilera a jejich architektura

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

TECHNICKÁ SPECIFIKACE

MPLS MPLS. Label. Switching) Michal Petřík -

K čemu slouží počítačové sítě

TEMPO průmyslový panelový počítač

Sběrnice PCI, PCI-X, PCI Express

Číslo projektu: CZ.1.07/1.5.00/ III/2 Inovace a zkvalitnění výuky prostřednictvím ICT. Zdeněk Dostál Ročník: 1. Hardware.

SCALANCE XM-400 Více možností pro Vaši síť

Použití Virtual NAT interfaces na Cisco IOS

Počítačové síťě (computer network) Realizují propojení mezi PC z důvodu sdílení SW (informací, programů) a HW(disky, tiskárny..)

Switch - příklady. Příklady konfigurací pro switch.

5 990,- září ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

G R A F I C K É K A R T Y

Jednokamerový systém pro sledování objektů

Základy IOS, Přepínače: Spanning Tree

Virtualizace. Lukáš Krahulec, KRA556

Technická specifikace zařízení

DataLab IO. DataLab PC/IO

5 990,- listopad ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Virtualizace koncových stanic Položka Požadováno Nabídka, konkrétní hodnota

Informační technologie. Název oboru: Školní rok: jarní i podzimní zkušební období 2017/2018

Témata profilové maturitní zkoušky

Technická specifikace předmětu zakázky

Možnosti vylaďování subsecond konvergence EIGRP

Počítačové sítě. Další informace naleznete na :

Základní deska (mainboard)

Příloha č. 1 k čj.: 1/120/ Technická specifikace Zajištění HW a dlouhodobé podpory infrastruktury Intel pro VoZP ČR

Obsah. Kapitola 1 Skříně počítačů 15. Kapitola 2 Základní deska (mainboard) 19. Kapitola 3 Napájecí zdroj 25. Úvod 11

Počítačové sítě I. 9. Internetworking Miroslav Spousta,

Transkript:

10GE síťový prvek switch & router Radim Roška & Moris Bangoura Installfest 2012 Silicon Hill 3.3. 2012

Obsah Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

Povinný začátek

Layer 2 Teoretický úvod L2 - MAC, error control, flow control, fragmentation Ethernet - rodina standardů pro LAN z cca 1980 data unit - frame (rámec) MAC address (00:1d:7d 04:26:ca)

Frame Teoretický úvod IFG = 96 bit times (pro 10GE 96/10 10 = 9.6ns) overhead = 8B + 12B = 20B účinnost - podle velikosti rámce (64B: 76.1%, 1518B: 98.7%)

Komplikace při 10GE počet rámců za sekundu (teoretická propustnost) - per packet delay - počet přerušení 64B rámce: 14880952 pps 1518B rámce: 812723 pps objem dat - per byte delay - rychlost sběrnic,pamětí... např. interrupt live lock - zahlcení přerušeními

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

Co je to? Teoretický úvod 1 agregující síťový prvek, spojuje síťové segmenty 2 přepíná v rámce v rámci jednoho subnetu - 1 hop 3 CAM tabulka (content-addressable memory - asociativní paměť)

CAM tabulka

modprobe bridge flexibilní, funkční switch na linuxu STP L2 filtrování and shapování

Switch v Linuxu - konfigurace linux-sw@root # brctl addbr br0 linux-sw@root # brctl addif br0 eth1 linux-sw@root # brctl addif br0 eth2 linux-sw@root # ip link set br0 up

SW řešení Teoretický úvod přerušení polling NAPI - adaptive interrupt coalescing (přerušení - nízká latence, polling - propustnost) softirq - rozdělení přerušení na kritickou a přerušitelnou část

HW řešení více jader CPU více RX/TX front na síťových kartách a MSI-X (SMP affinity) NUMA PCI-Express (v2): 16x lanes = 16 * 500MB * 2 = 16GB/s (fullduplex) propustnost operačních pamětí: tripple channel DDR3-1333 = 3 * 10666MB/s = 32 GB/s QPI sběrnice: 25GB/s

HW řešení více jader CPU více RX/TX front na síťových kartách a MSI-X (SMP affinity) NUMA PCI-Express (v2): 16x lanes = 16 * 500MB * 2 = 16GB/s (fullduplex) propustnost operačních pamětí: tripple channel DDR3-1333 = 3 * 10666MB/s = 32 GB/s QPI sběrnice: 25GB/s

HW řešení

10GE Síťová karta dual port 10GbE Intel controller 82599 kvalitní chipset Intel 82599 s open source ovladačema MSI-X podpora (definuje až 2048 přerušení na zařízení) RSS (Received Side Scaling) offloading... PCI-Express 8x - dost na 2x10GE 128 TX i RX front

1GE Síťová karta 1GbE NIC s 6 portama a chipsetem Intel 82576 6 portů PCIe 4x

Jak měřit? RFC 2544 10GE měřáky GNU/Linuxové nástroje: pktgen netperf - jednoduchý nástroj na měření propustnosti sar mpstat ethtool - detailní nastavení parametrů ovladače síťové karty modprobe - různé parametry NIC ovladačů modinfo - zobrazí nastavení ovladaču

pktgen Teoretický úvod kernel-space nástroj modul v kernelu velmi užitečný nástroj - dá se nastavit téměř vše (i generování s pomocí více jader na více front) ždímá výpočetní sílu CPU

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

Co to je? Teoretický úvod aktivní síťová jednotka pracující s IP pakety směruje příchozí pakety k cíli (směrovací tabulka) rozhodování podle cílové IP adresy (Layer 3 OSI)

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

SW: NIC, Bus, CPU, RAM

HW: ASIC, TCAM, Crossbar Switch

SW? Teoretický úvod Klady: linux :) Můžeme si hrát... jednoduše rozšířitelný (změnou programu) velká RAM (routovací tabulka... BGP) relativně levný Zápory: vše zpracovává CPU (GPU)... no Tbps wirespeeds elektrická spotřeba?

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

Historie Teoretický úvod AGP/PCI arch.: FastEthernet (133/266MBps sdílená PCI sběrnice) PCIe arch., vícejádrové CPU, QPI/Hypertransport: SMP PCIe: GigabitEthernet (1 PCIe HUB, <32 PCIe linek) NUMA PCIe: 10GigabitEthernet (2 PCIe HUBy, 64 PCIe linek)

Blokové schéma PCIe arch. - Intel 5520 NUMA

10GbE SW router projekty 10GbE SW Routing: Bifrost (tuned Linux Distro): http://bifrost.slu.se/ Click Modular Router (kernelspace/userspace): http://read.cs.ucla.edu/click/click Packet Shader Framework (GPU Accelerated): http://shader.kaist.edu/packetshader/

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

Routing na CPU - omezení? Počet CPU cyklů na 1 packet: cca. 1200 CPU cyklů pro forw. paketu z jednoho interface na druhý): to je hodně i pro multicore CPU (chceme 14.88 Mpps) nezbývá vypočetní výkon na routing a další funcke SW routeru (GPU?) Šířka pásma při zpracování paketu (PCIe 2,0): PCIe: OK (8 linek na 2x10GbE NIC = 4GBps) QPI: OK (25,6GBps) Tripple Channel DDR: OK (32 GBps)

Akcelerace pomocí GPU Proč GPU? vysoká šířka pásma (177GBps GTX 580 vs. 32GBps Xeon 5550) nízká latence paralelních zpracování SIMT (512 vláken) dostupnost, nízká cena userspace... CUDA / OpenCL :-/

Packet Shader Framework GPU akcelerovaný SW Router, 40Gbps při 64B paketech a full BGP routing table. Součásti: Packet Shader I/O modul Packet Shader Userspace aplikace

PS Framework - schéma

Packet Shader: I/O Přepsaný optimalizovaný Intel 82599 ixgbe driver (1200 -> 200 CPU cyklů): propojení mezi kernelem a uživatelskou aplikací huge packet buff: nealokuje linux skb buffer pro každý paket, jsou 2 velké STATICKÉ kruhové buffery (metadata and data) BATCH processing: dávkové zpracování paketů (NIC, PCIe, userspace) 32, 64 chunks najednou CPU AFFINITY: RX a TX fronty spjaty s každým worker jádrem, per queue counters, 64B zarovnání paměti vyhýbáme se NUMA node corssing! (60% výkon dolů) automatic hybrid interrupt/polled packet RX

Per fronta CPU Affinity, Receive Side Scalling (RSS) RSS: src/dst IP/port + proto -> zachovává pořadí per flow

Packet Shader: userspace Multivláknová userspace aplikace: worker vlákno: sběr paketů z I/O master thread: komunikace s GPU komunikace mezi vlákny via fronty (mutexy) optimalizace: zero-copy, pipelining (worker), gather-scatter + concurrent copy-execution (master)

Packet Shader: fáze 3 fáze: pre-shade (worker RX... meta -> master inp.q.) shade (GPU route lookup... output meta -> worker outp.q.) post-shade (worker TX)

Cesta paketu PS, fáze

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

10GbE na DSN Projekt ČVUT FEL, CESNETu. nejsou sources pro PS userspace část: píšeme znova propojení z dynamickým routovacím daemonem: XORP (via click socket) GPU firewalling (ACL like)... a další :) https://dsn.felk.cvut.cz/wiki/projekty/10gbeth

Outline Teoretický úvod 1 Teoretický úvod 2 3 4 5 6 7 8

Teoretický úvod Radim Roška & Moris Bangoura InstallFest 2012

Teoretický úvod Radim Roška & Moris Bangoura InstallFest 2012

Teoretický úvod Radim Roška & Moris Bangoura InstallFest 2012

Teoretický úvod Radim Roška & Moris Bangoura InstallFest 2012

Q/A Teoretický úvod?