
Raggiungere un recupero rapido degli OSD Ceph utilizzando la tecnologia SBB
Nei moderni data center, la disponibilità continua dei dati è fondamentale. Mentre l'algoritmo CRUSH di Ceph gestisce efficacemente i guasti e protegge l'integrità dei dati, la ridondanza hardware rimane cruciale per garantire un'alta disponibilità. L'introduzione dei server Storage Bridge Bay (SBB) nell'infrastruttura Ceph migliora significativamente la resilienza riducendo al minimo le interruzioni del servizio durante i guasti hardware.
Sfide dei Deployment Tradizionali di Ceph
In un'implementazione convenzionale di Ceph, ogni server di archiviazione ospita tipicamente più Daemon di Archiviazione Oggetti (OSD). Se un singolo server subisce guasti hardware, come un malfunzionamento della scheda madre o un guasto della scheda di rete, tutti gli OSD su quel host vanno offline simultaneamente. Questa situazione attiva un processo di recupero, causando il degrado dei Gruppi di Posizionamento (PG) e potenzialmente compromettendo la ridondanza dei dati.
Riprendersi da un evento del genere può richiedere un tempo significativo, a seconda del volume di dati e delle risorse disponibili, il che può portare a prestazioni degradate prolungate e a un aumento del rischio di perdita di dati o interruzione del servizio.
Introduzione ai server Storage Bridge Bay (SBB)
Storage Bridge Bay (SBB) è un'architettura server a doppio nodo standardizzato progettata per l'alta disponibilità. Un server SBB ospita due nodi di elaborazione indipendenti collegati all'archiviazione condivisa in una configurazione JBOD (solo un mucchio di dischi). In genere, questi server supportano unità NVME o SAS a doppio porto, fornendo una solida ridondanza hardware.
Come SBB migliora l'alta disponibilità di Ceph
In un'implementazione Ceph basata su SBB, ogni nodo opera in modalità attiva-attiva, il che significa che entrambi i nodi eseguono simultaneamente i servizi Ceph OSD. Ad esempio, un tipico server SBB dotato di 24 unità SSD NVMe distribuisce queste equamente tra i due nodi, con ciascun nodo che gestisce inizialmente 12 OSD.
Questo design garantisce che se un nodo fallisce, solo metà degli OSD diventa temporaneamente non disponibile, piuttosto che tutti insieme, riducendo significativamente la gravità e l'impatto del guasto.
Scenario di failover OSD rapido
Quando si verifica un guasto su un nodo all'interno di un server SBB, metà degli OSD diventano inaccessibili. Ambedded Technology ha sviluppato uno script robusto progettato per migrare rapidamente e riattivare gli OSD interessati sul nodo sopravvissuto.
Ecco come avviene il processo di migrazione rapida:
1.Ottieni l'immagine del contenitore Ceph:Recupera rapidamente il riferimento all'immagine del contenitore necessario per le operazioni Ceph.
2.Rimuovi la posizione CRUSH specifica per l'OSD: Aggiorna la configurazione dell'OSD rimuovendo i dettagli della posizione CRUSH specifici per il nodo.
3.Attiva OSD con ceph-volume: Riattiva i servizi OSD utilizzando l'utilità ceph-volume.
4.Adotta OSD utilizzando cephadm: Integra gli OSD attivati di nuovo nel cluster Ceph, ripristinando rapidamente il servizio.
Vantaggi dell'uso di SBB per Ceph
1.Tempo di inattività ridotto: La riattivazione rapida dell'OSD riduce significativamente il tempo trascorso in stati degradati, ripristinando rapidamente i PG in uno stato attivo e pulito.
2.Continuità del Servizio Potenziata: Previene interruzioni prolungate, mantenendo una consegna del servizio costante.
3.Manutenzione Semplificata: Le riparazioni hardware immediate diventano meno urgenti, poiché i servizi rimangono operativi sul nodo sopravvissuto.
4.Ridotto Rischio di Perdita di Dati e Degradazione delle Prestazioni: Processi di recupero accelerati e ridondanza hardware minimizzano i potenziali rischi associati ai guasti hardware.
Riepilogo e Conclusione
L'integrazione dei server Storage Bridge Bay (SBB) con le distribuzioni Ceph migliora notevolmente la resilienza e l'efficienza operativa delle infrastrutture di archiviazione. Sfruttando una configurazione attiva-attiva e le capacità di riattivazione rapida degli OSD, le organizzazioni possono ridurre significativamente i tempi di inattività e semplificare la gestione.
L'appliance Ceph di Ambedded Technology, Mars 624, esemplifica questa integrazione offrendo una soluzione chiavi in mano che sfrutta i vantaggi dell'architettura SBB.Le organizzazioni che desiderano migliorare la disponibilità di Ceph e semplificare la manutenzione dovrebbero considerare l'aggiornamento a Mars 624 per ottenere un'affidabilità e un'efficienza di archiviazione senza pari.
Inoltre, il software full-stack Ceph di UniVirStor di Ambedded supporta completamente qualsiasi server di archiviazione costruito sulla tecnologia SBB, come il SSG-640SP-DE2CR60 di Supermicro, garantendo flessibilità e compatibilità per ambienti infrastrutturali diversi.
- Prodotti correlati
Mars 624 SBB 24x NVMe Due nodi Hot-Swap Appliance di storage Ceph
Mars 624 SBB
Il server Mars624 SBB ospita due nodi server Intel Xeon hot-swappable in un chassis 2U. Due nodi server possono connettersi simultaneamente a tutti i 24 SSD NVMe...
Particolari