Jak vybrat čísla K a M pro kódování ztrát?
Jak funguje kódování pro vymazání:
Parametry kódování Ceph smazání K & M zahrnují efektivitu využitelné kapacity a redundanci proti selhání hardwaru. K je počet datových bloků a M je počet kódovacích bloků. Když klient zapíše datový objekt do úložiště Ceph, datový objekt bude rozdělen na K stejně velkých datových bloků. Ceph používá datové bloky k zakódování M bloků kódovacích bloků, které budou použity k výpočtu ztracených datových bloků, když dojde k selhání hardwaru.
Datové bloky a kódové bloky budou distribuovány a uloženy v určené doméně selhání K+M. Maximální počet datových bloků, které mohou být ztraceny, je M domén selhání. Dostupné domény selhání závisí na tom, jak jsou servery pro ukládání dat přiděleny v rámci fyzické infrastruktury. U malého Ceph clusteru může být selhání způsobeno diskem nebo servery. U větších clusterů může být doménou selhání serverový rack, serverovna nebo datové centrum atd.
Datový objekt je rekonstruován z datových bloků, když klient chce číst data.
Výkon úložiště
Ve srovnání s algoritmem replikace dat Ceph má kódování smazáním obvykle lepší efektivitu využitelného prostoru. Protože kódování smazáním využívá více diskových I/O operací k dokončení datového I/O, je méně přívětivé pro pracovní zátěže vyžadující vysoký IOPS. Čím větší je počet K+M, tím více diskových IOPS prostředků operace I/O spotřebovávají.
Při použití většího K a menšího M bude celkový počet přenesených bajtů dat na síti Ceph clusteru menší. To by mohlo zvýšit výkon I/O propustnosti velkých datových objektů.
Účinnost prostoru
Účinnost využití prostoru kódu pro vymazání je rovna K/(K+M). Například účinnost prostoru kódu pro vymazání K=4, M=2 je 4/6 = 66,7 %. To je dvakrát efektivnější než replikované pooly 3, které poskytují vyšší výkon IOPS se stejnou úrovní hardwarové redundance.
Rozumné K je větší než M díky efektivitě využití prostoru. Větší (K-M) kód pro vymazání získává lepší efektivitu prostoru.
Počet serverových hostitelů
Počet K+M také určuje počet hostitelů nebo větších domén selhání, které jsou v clusteru vyžadovány.
- Typický pool kódů pro vymazání vyžaduje minimálně K+M serverových hostitelů pro plné rozložení všech EC chunků.
- Pokročilá konfigurace kódu pro vymazání umožňuje ukládat více EC chunků na doménu selhání. Tato konfigurace snižuje požadovaný počet serverů pro distribuci EC chunků.
Shrnutí vlivů kódu pro vymazání K & M:
- M určuje redundantní počet domén selhání.
- Větší K + M vede ke snížení výkonu IOPS pro malé objekty pro klienty, ale zlepšuje propustnost pro větší objekty.
- Efektivita úložného prostoru = K/(K+M)
- Minimální počet požadovaných serverů.