
Vysoká dostupnost a trvanlivost dat
Úložiště objektů Ceph dosahuje dostupnosti dat prostřednictvím replikace a pokročilého kódování ztrát, kdy jsou data kombinována s paritními informacemi a poté rozdělena a distribuována po úložném prostoru.
Když dojde k selhání úložného zařízení, stačí pouze podmnožina shardů k obnovení dat, není potřeba čas na obnovu ani nedochází k degradaci výkonu, a selhávaná úložná zařízení mohou být vyměněna, kdykoli je to vhodné.
Ceph kombinuje široce distribuovaná data a technologii čištění dat, která neustále ověřuje data zapsaná na médiích, což vám umožňuje dosáhnout 15 devítek trvanlivosti dat.
Replikace dat, kódování ztrát a čištění
Replikace objektů
Když klient chce zapisovat data, používá identifikátor objektu a název skupiny pro výpočet, na který OSD má zapisovat. Poté, co klient zapíše data do OSD, OSD zkopíruje data na jeden nebo více OSD. Můžete nakonfigurovat libovolný počet replikací, aby data mohla přežít v případě současného selhání více OSD. Replikace je podobná RAID-1 diskového pole, ale umožňuje více kopií dat. Protože při velkém měřítku již jednoduchá replikace RAID-1 nemusí dostatečně pokrýt riziko hardwarového selhání. Jedinou nevýhodou ukládání více replik je náklad na úložiště.
Klienti Cephu zapisují data náhodně do OSD na základě algoritmu CRUSH.Pokud selže disk OSD nebo uzel, Ceph může znovu vyléčit data z jiných replikací uložených ve zdravých OSD.
Můžete definovat doménu selhání, aby Ceph ukládal replikovaná data na různé servery, regály, místnosti nebo datová centra, aby se zabránilo ztrátě dat v důsledku jednoho nebo více selhání celé domény selhání.Například, pokud máte nainstalováno 15 úložných serverů ve 5 skříních (3 servery v každé skříni), můžete použít replikaci tři a skříň jako doménu selhání.Zápis dat do Ceph clusteru bude vždy mít tři kopie uložené ve třech z pěti regálů.Data mohou přežít, i když selžou až 2 z racků, aniž by došlo k degradaci služeb pro klienty.Pravidlo CRUSH je klíčem k tomu, aby Ceph storage mělo žádný jediný bod selhání.
Kódování pro vymazání
Replikace nabízí nejlepší celkový výkon, ale není příliš efektivní z hlediska využití úložného prostoru.Zvlášť pokud potřebujete vyšší míru redundance.
Mít vysokou dostupnost dat je důvod, proč jsme v minulosti používali RAID-5 nebo RAID-6 jako alternativu k RAID-1.Paritní RAID zajišťuje redundanci s mnohem menšími nároky na úložiště na úkor výkonu úložiště (většinou výkonu zápisu).Ceph používá kódování smazáním k dosažení podobného výsledku.Když se rozsah vašeho úložného systému stane velkým, můžete se cítit nejistě, pokud dovolíte, aby selhaly pouze jeden nebo dva disky či domény selhání současně.Algoritmus pro kódování ztrát umožňuje nastavit vyšší úroveň redundance, ale s menším prostorovým přetížením.
Kódování ztrát rozděluje původní data na K datových bloků a vypočítává další M kódovacích bloků.Ceph může obnovit data, pokud selže maximálně M chybových domén.Celkové K+M bloků jsou uloženy v OSD, které se nacházejí v různých oblastech selhání.
Čistění
V rámci udržování konzistence a čistoty dat mohou démoni Ceph OSD procházet objekty v umístěných skupinách. To znamená, že Ceph OSD démoni mohou porovnávat metadata objektu v jedné umístěné skupině s jeho replikami v umístěných skupinách uložených na jiných OSD. Údržba (obvykle prováděná denně) odhaluje chyby nebo chyby v souborovém systému. Ceph OSD démoni také provádějí hlubší kontrolu porovnáváním dat v objektech bit po bitu. Hluboké čištění (obvykle prováděné týdně) odhaluje špatné sektory na disku, které nebyly zřejmé při lehkém čištění.
Oprava dat
Vzhledem k návrhu umístění dat v Cephu jsou data obnovována všemi zdravými OSD. Není potřeba žádný náhradní disk pro obnovení dat. To může zkrátit čas potřebný k obnovení ve srovnání s diskovým polem, které musí obnovit ztracená data na náhradní disk.
- Nakonfigurujte CRUSH mapu a pravidla