Come scegliere i numeri K e M del codice di cancellazione?

Come funziona il codice di cancellazione:
I parametri del codice di cancellazione Ceph K & M riguardano l'efficienza della capacità utilizzabile e la ridondanza contro i guasti hardware. K è il numero di blocchi di dati e M è il numero di blocchi di codifica. Quando un cliente scrive un oggetto dati nel cluster di archiviazione Ceph, l'oggetto dati verrà suddiviso in K chunk di dati di dimensioni uguali. Ceph utilizza i chunk di dati per codificare M chunk di chunk di codifica che verranno utilizzati per calcolare i chunk di dati persi quando l'hardware fallisce.

I chunk di dati e i chunk di codice saranno distribuiti e memorizzati nel dominio di guasto specificato da K+M. Il numero massimo di chunk di dati che possono andare persi è M domini di guasto. I domini di guasto disponibili dipendono da come i server di archiviazione sono allocati all'interno dell'infrastruttura fisica. Per un cluster Ceph di piccole dimensioni, il guasto potrebbe essere del disco o degli host server. Il dominio di guasto dei cluster di dimensioni maggiori può essere i rack dei server, la sala server o il data center, ecc.
L'oggetto dati viene ricostruito dai frammenti di dati quando il client desidera leggere i dati.

Prestazioni di archiviazione

Rispetto all'algoritmo di replicazione dei dati Ceph, la codifica di cancellazione di solito ha una migliore efficienza dello spazio utilizzabile. Poiché il codice di cancellazione utilizza più operazioni di I/O su disco per completare l'I/O dei dati, è meno adatto ai carichi di lavoro che richiedono elevate IOPS. Maggiore è il numero di K+M, maggiore è il consumo di risorse IOPS su disco per l'operazione di I/O.

Quando si utilizzano K più grandi e M più piccoli, il numero totale di byte di dati trasferiti sulla rete del cluster Ceph sarà minore. Questo potrebbe aumentare le prestazioni di throughput I/O di oggetti di dati di grandi dimensioni.

Efficienza dello spazio

L'efficienza dello spazio utilizzabile di un pool di codici di cancellazione è pari a K/(K+M). Ad esempio, l'efficienza dello spazio del pool di codici di cancellazione K=4, M=2 è 4/6 = 66,7%. Questo è due volte più efficiente dei pool replica 3 che offrono prestazioni IOPS superiori con lo stesso livello di ridondanza hardware.

K ragionevole è maggiore di M a causa dell'efficienza dello spazio utilizzabile. Il codice di cancellazione (K-M) più grande guadagna una migliore efficienza dello spazio.

Numero di host server

Il numero di K+M determina anche il numero di host o domini di guasto più grandi richiesti nel cluster.

Un tipico pool di codici di cancellazione richiede un minimo di K+M host server per distribuire completamente tutti i chunk EC.
Una configurazione avanzata del codice di cancellazione consente di memorizzare più chunk EC per dominio di guasto. Questa configurazione riduce il numero di server richiesti per distribuire i chunk EC.

Riepilogo delle influenze del codice di cancellazione K & M:

M determina il numero ridondante di domini di guasto.
Un K + M più grande si traduce in una riduzione delle prestazioni IOPS per oggetti piccoli per i client, ma migliora il throughput per oggetti più grandi.
Efficienza dello spazio di archiviazione = K/(K+M)
Numero minimo di server richiesti.

Come scegliere i numeri K e M del codice di cancellazione? | Soluzioni di archiviazione Ceph; Apparecchiature e software Ceph|Ambedded

Fondata a Taiwan nel 2013, Ambedded Technology Co., LTD. è un fornitore leader di soluzioni di archiviazione a blocchi, file e oggetti basate su storage definito dal software Ceph. Ci specializziamo nella fornitura di sistemi di archiviazione ad alta efficienza e scalabili per data center, imprese e istituzioni di ricerca. Le nostre offerte includono appliance di archiviazione basate su Ceph, integrazione di server, ottimizzazione dello storage e implementazione economica di Ceph con gestione semplificata.

Ambedded offre soluzioni di storage Ceph chiavi in mano e soluzioni software Ceph full-stack su misura per le organizzazioni B2B. La nostra piattaforma di archiviazione Ceph supporta l'archiviazione unificata di blocchi, file (NFS, SMB, CephFS) e oggetti compatibili con S3, riducendo il costo totale di proprietà (TCO) migliorando al contempo l'affidabilità e la scalabilità. Con la regolazione Ceph integrata, un'interfaccia web intuitiva e strumenti di automazione, aiutiamo i clienti a ottenere uno storage ad alte prestazioni per carichi di lavoro AI, HPC e cloud.

Con oltre 20 anni di esperienza nell'IT aziendale e più di un decennio nella distribuzione di storage Ceph, Ambedded ha realizzato oltre 200 progetti di successo a livello globale. Offriamo consulenza esperta, progettazione di cluster, supporto alla distribuzione e manutenzione continua. Il nostro impegno per un supporto professionale a Ceph e un'integrazione senza soluzione di continuità garantisce che i clienti ottengano il massimo dalla loro infrastruttura di storage basata su Ceph — su larga scala, con rapidità e nel rispetto del budget.

Come scegliere i numeri K e M del codice di cancellazione? | Storage unificato di blocchi, file e oggetti S3 - Ambedded

Come scegliere i numeri K e M del codice di cancellazione? | Gestione semplificata di Ceph, TCO ridotto - Ambedded

Come scegliere i numeri K e M del codice di cancellazione?

Come scegliere i numeri K e M del codice di cancellazione? | Soluzioni di archiviazione Ceph; Apparecchiature e software Ceph|Ambedded

Il nostro indirizzo

UniVirStor 4.19.4 Rilasciato: Servizi di File Unificati,...

Ambedded Versione UniVirStor 4.19.3 Rilasciata

Ambedded Mostra lo storage Ceph di livello enterprise...