Jak vybrat čísla K a M pro kódování ztrát? | Nákladově efektivní úložiště pro AI a cloud - Ambedded

Jak vybrat čísla K a M pro kódování ztrát? | Kompletní Ceph úložiště s odbornou podporou - Ambedded

Jak vybrat čísla K a M pro kódování ztrát?

Jak funguje kódování pro vymazání:
Parametry kódování Ceph smazání K & M zahrnují efektivitu využitelné kapacity a redundanci proti selhání hardwaru. K je počet datových bloků a M je počet kódovacích bloků. Když klient zapíše datový objekt do úložiště Ceph, datový objekt bude rozdělen na K stejně velkých datových bloků. Ceph používá datové bloky k zakódování M bloků kódovacích bloků, které budou použity k výpočtu ztracených datových bloků, když dojde k selhání hardwaru.


Datové bloky a kódové bloky budou distribuovány a uloženy v určené doméně selhání K+M. Maximální počet datových bloků, které mohou být ztraceny, je M domén selhání. Dostupné domény selhání závisí na tom, jak jsou servery pro ukládání dat přiděleny v rámci fyzické infrastruktury. U malého Ceph clusteru může být selhání způsobeno diskem nebo servery. U větších clusterů může být doménou selhání serverový rack, serverovna nebo datové centrum atd.
Datový objekt je rekonstruován z datových bloků, když klient chce číst data.

Výkon úložiště

Ve srovnání s algoritmem replikace dat Ceph má kódování smazáním obvykle lepší efektivitu využitelného prostoru. Protože kódování smazáním využívá více diskových I/O operací k dokončení datového I/O, je méně přívětivé pro pracovní zátěže vyžadující vysoký IOPS. Čím větší je počet K+M, tím více diskových IOPS prostředků operace I/O spotřebovávají.

Při použití většího K a menšího M bude celkový počet přenesených bajtů dat na síti Ceph clusteru menší. To by mohlo zvýšit výkon I/O propustnosti velkých datových objektů.

Účinnost prostoru

Účinnost využití prostoru kódu pro vymazání je rovna K/(K+M). Například účinnost prostoru kódu pro vymazání K=4, M=2 je 4/6 = 66,7 %. To je dvakrát efektivnější než replikované pooly 3, které poskytují vyšší výkon IOPS se stejnou úrovní hardwarové redundance.

Rozumné K je větší než M díky efektivitě využití prostoru. Větší (K-M) kód pro vymazání získává lepší efektivitu prostoru.

Počet serverových hostitelů

Počet K+M také určuje počet hostitelů nebo větších domén selhání, které jsou v clusteru vyžadovány.

  • Typický pool kódů pro vymazání vyžaduje minimálně K+M serverových hostitelů pro plné rozložení všech EC chunků.
  • Pokročilá konfigurace kódu pro vymazání umožňuje ukládat více EC chunků na doménu selhání. Tato konfigurace snižuje požadovaný počet serverů pro distribuci EC chunků.

Shrnutí vlivů kódu pro vymazání K & M:

  • M určuje redundantní počet domén selhání.
  • Větší K + M vede ke snížení výkonu IOPS pro malé objekty pro klienty, ale zlepšuje propustnost pro větší objekty.
  • Efektivita úložného prostoru = K/(K+M)
  • Minimální počet požadovaných serverů.

Jak vybrat čísla K a M pro kódování ztrát? | Často kladené otázky o Cephu

Naše sekce FAQ se zabývá nejčastějšími dotazy ohledně úložiště Ceph a řešení Ambedded.

Získejte jasnost ohledně nasazení, správy a optimalizace vaší úložné infrastruktury.

Najděte rychlé, odborné odpovědi, které vám pomohou co nejlépe využít naši technologii.