Come calcolare la capacità utilizzabile di un cluster Ceph?
Lo spazio di archiviazione utilizzabile di Ceph è influenzato dalla capacità grezza del disco, dai metodi di protezione dei dati come la replicazione o l'Erasure coding, e dall'overhead di sistema. Il thin provisioning, le quote e lo spazio di recupero riservato aiutano a ottimizzare l'uso e garantire la tolleranza ai guasti.
Lo spazio utilizzabile di Ceph è determinato dai seguenti fattori
1.La capacità massima grezza di un cluster Ceph costruito da più server è la somma dello spazio su disco in ciascun server.
Se il cluster include vari tipi di dispositivi di archiviazione, come HDD, SSD o unità NVMe, è necessario calcolare lo spazio su disco grezzo totale per ciascun tipo di dispositivo separatamente.Ceph è in grado di riconoscere la classe di dispositivo designata utilizzata da ciascun pool.
2. La protezione dei dati applicata per ogni pool Ceph determina lo spazio utilizzabile.
- Protezione replicata: spazio utilizzabile = capacità grezza / dimensione della replica
- Protezione dei dati con Erasure Code: spazio utilizzabile = capacità grezza x (K/(K+M))
3. Ceph ha un certo overhead per le operazioni di metadati e di sistema. Lo spazio di overhead utilizzato è di circa il 10-20% a seconda della tua configurazione specifica e dell'uso.
Tutti gli spazi dei dischi sono condivisi da tutti i pool replicati e con Erasure Code.
- I pool possono impostare o non impostare quote. Tutte le quote sono provisioning thin.
- Poiché lo spazio disponibile di Ceph è thin provisioning; lo spazio di archiviazione viene allocato solo quando necessario, piuttosto che allocare tutto lo spazio richiesto in anticipo. Questo può migliorare l'utilizzo dello storage e ridurre i costi di archiviazione.
- Si consiglia di riservare 1/n dello spazio durante l'operazione come spazio di recupero dati in caso di guasto hardware, dove n è il numero di server.
- Il sistema ha avvisi di utilizzo preimpostati dell'85% vicino al pieno e del 95% pieno.