Vysoká dostupnost a výdrž dat

Ceph nabízí replikaci, EC kód, CRUSH, scrubbing pro ochranu dat a HA

Ceph nabízí replikaci, EC kód, CRUSH, scrubbing pro ochranu dat a HA

Vysoká dostupnost a výdrž dat

Úložiště objektů Ceph dosahuje dostupnosti dat prostřednictvím replikace a pokročilého kódování výmazu, kdy jsou data kombinována s paritními informacemi a poté sdílena a distribuována v rámci úložiště.
Když selže úložné zařízení, k obnovení dat je potřeba pouze podmnožina úlomků, není čas na obnovu ani se snižuje výkon a vadná úložná zařízení lze vyměnit, když je to vhodné.
Ceph kombinuje široce distribuovaná data a technologii scrubbingu dat, která nepřetržitě ověřuje data zapsaná na médiu, a umožňuje vám dosáhnout 15 devítek trvanlivosti dat.


Replikace dat, kódování výmazu a čištění

Replikace objektů

Když se klient chystá zapisovat data, používá ID objektu a název fondu k výpočtu, do kterého OSD má zapisovat. Poté, co klient zapíše data do OSD, OSD zkopíruje data do jednoho nebo více OSD. Můžete nakonfigurovat tolik replikací, kolik chcete, aby byla data schopna přežít v případě, že selže více OSD současně. Replikace je podobná RAID-1 diskového pole, ale umožňuje více kopií dat. Protože jednoduchá replikace RAID-1 v měřítku již nemusí dostatečně pokrýt riziko selhání hardwaru. Jedinou nevýhodou ukládání více replik jsou náklady na skladování.

Klienti Ceph zapisují data náhodně do OSD na základě algoritmu CRUSH . Pokud OSD disk nebo uzel selže, Ceph může znovu vyléčit data z jiných replikací uložených ve zdravých OSD.

Můžete definovat doménu selhání , aby Ceph ukládal replikovaná data na různých serverech, stojanech, místnostech nebo datových centrech, aby se zabránilo ztrátě dat v důsledku jednoho nebo více selhání celé domény selhání. Pokud máte například 15 úložných serverů nainstalovaných v 5 stojanech (3 servery v každém stojanu), můžete jako doménu selhání použít repliku 3 a stojan. Zápis dat do Ceph clusteru bude mít vždy tři kopie uloženy ve třech z pěti racků. Data mohou přežít, když selžou až 2 stojany, aniž by došlo ke zhoršení klientských služeb. Pravidlo CRUSH je klíčem k tomu, aby Ceph Storage neměl jediný bod selhání .

CRUSH rules ensure replicated data are distributed to different server nodes by following the failure domain

Kódování výmazu

Replikace nabízí nejlepší celkový výkon, ale není příliš efektivní z hlediska úložného prostoru. Zvláště pokud potřebujete vyšší stupeň redundance.
Kvůli vysoké dostupnosti dat jsme v minulosti používali RAID-5 nebo RAID-6 jako alternativu k RAID-1. Paritní RAID zajišťuje redundanci s mnohem menší režií úložiště na úkor výkonu úložiště (většinou výkonu zápisu). Ceph používá k dosažení podobného výsledku kódování výmazu. Když se rozsah vašeho úložného systému zvětší, můžete se cítit nejistí, když dovolíte, aby současně selhal pouze jeden nebo dva disky nebo selhání domén. Algoritmus výmazového kódu umožňuje konfigurovat vyšší úroveň redundance, ale s menším prostorem.
Vymazání kódování rozdělí původní data na K datových bloků a vypočítá extra M kódovacích bloků. Ceph může obnovit data maximálně M domén selhání mezitím. Celkem K+M bloků je uloženo v OSD, které jsou v různých doménách selhání.

use Erasure coding K+M=4+2 for it data protection.

Drhnutí

V rámci zachování konzistence a čistoty dat mohou démoni Ceph OSD smazat objekty ve skupinách umístění. To znamená, že démoni Ceph OSD mohou porovnávat metadata objektů v jedné skupině umístění s jejich replikami ve skupinách umístění uložených v jiných OSD. Scrubbing (obvykle prováděný denně) zachycuje chyby nebo chyby souborového systému. Ceph OSD démoni také provádějí hlubší čištění porovnáním dat v objektech bit po bitu. Hluboké čištění (obvykle prováděné každý týden) najde na disku chybné sektory, které nebyly patrné při lehkém čištění.

Léčení dat

Díky návrhu umístění dat Ceph jsou data uzdravována všemi zdravými OSD. Pro obnovu dat není potřeba žádný náhradní disk. To může výrazně zkrátit dobu re-heal ve srovnání s diskovým polem, které musí znovu sestavit ztracená data na náhradní disk.

one server nodes fails the cluster will self-heal by applying same data protection method.

Konfigurace mapy a pravidel CRUSH

Pomocí správce UVS definujte distribuci dat a doménu selhání.
Ambedded – profesionální řešení úložiště Ceph na trhu.

Nachází se na Tchaj-wanu od roku 2013,Ambedded Technology Co., LTD.je poskytovatel úložných řešení Ceph, který nabízí softwarově definovaná úložná zařízení založená na ARM s 60% úsporou CapEX, o 70% nižší spotřebou energie a 100% škálovatelnými výhodami.

V oblasti softwarově definovaného návrhu a výroby úložišť má tým Ambedded rozsáhlé zkušenosti, aby pomohl zákazníkům zavést řešení ceph do všestranných průmyslových odvětví, jako jsou telekomunikace, lékařství, vojenství, okrajová datová centra a podniková úložiště vyžadující HA.

Společnost Ambedded nabízí zákazníkům řešení úložiště Ceph již od roku 2013, a to jak pokročilé technologie, tak 20 let zkušeností, společnost Ambedded zajišťuje, aby byly splněny požadavky každého zákazníka.