Replicazione dei Dati, Codifica per Cancellazione & Scrubbing | Fornitore di soluzioni e servizi di storage Ceph. Software Full-Stack per Ceph.

Ceph offre replicazione, codice EC, CRUSH, scrubbing per la protezione dei dati e HA. | Fornitore di soluzioni e servizi di archiviazione Ceph. Software Full-Stack per Ceph.

Ceph offre replicazione, codice EC, CRUSH, scrubbing per la protezione dei dati e HA.

Alta Disponibilità e Durabilità dei Dati

Lo storage oggetti Ceph raggiunge la disponibilità dei dati attraverso la replicazione e la codifica avanzata per cancellazione, in cui i dati vengono combinati con informazioni di parità e poi suddivisi e distribuiti nel pool di storage.
Quando un dispositivo di storage fallisce, è necessario solo un sottoinsieme dei frammenti per ripristinare i dati, non ci sono tempi di ricostruzione o prestazioni degradate, e i dispositivi di storage guasti possono essere sostituiti quando è conveniente.
Ceph combina dati ampiamente distribuiti e tecnologia di scrubbing dei dati che convalida continuamente i dati scritti sui supporti, permettendoti di raggiungere 15 nove di durabilità dei dati.


Replicazione dei Dati, Codifica per Cancellazione & Scrubbing

Replica degli oggetti

Quando un cliente sta per scrivere dati, utilizza l'ID dell'oggetto e il nome del pool per calcolare a quale OSD deve scrivere. Dopo che il cliente scrive i dati nell'OSD, l'OSD copia i dati su uno o più OSD. È possibile configurare quante repliche si desidera per consentire ai dati di sopravvivere nel caso in cui più OSD falliscano contemporaneamente. La replica è simile al RAID-1 di un array di dischi ma consente più copie dei dati. Perché a grande scala, una semplice replicazione RAID-1 potrebbe non coprire più sufficientemente il rischio di guasti hardware. L'unico svantaggio di conservare più repliche è il costo di archiviazione.

I clienti Ceph scrivono dati in modo casuale su OSD in base all'algoritmo CRUSH.Se il disco OSD o il nodo hanno un guasto, Ceph può riparare i dati da altre repliche memorizzate negli OSD sani.

Puoi definire il dominio di guasto per far sì che Ceph memorizza i dati replicati in server, rack, stanze o data center diversi per evitare la perdita di dati a causa di uno o più guasti dell'intero dominio di guasto.Ad esempio, se hai 15 server di archiviazione installati in 5 rack (3 server in ogni rack), puoi utilizzare replica tre e rack come dominio di errore.I dati scritti nel cluster Ceph saranno sempre conservati in tre copie distribuite in tre dei cinque rack.I dati possono sopravvivere anche se fino a 2 dei rack falliscono senza degradare il servizio al cliente.La regola CRUSH è la chiave per rendere Ceph storage ha nessun singolo punto di errore.

Le regole CRUSH garantiscono che i dati replicati siano distribuiti a diversi nodi server seguendo il dominio di guasto

Codifica di cancellazione

La replica offre le migliori prestazioni complessive, ma non è molto efficiente in termini di spazio di archiviazione.Soprattutto se hai bisogno di un maggior grado di ridondanza.
Avere un'elevata disponibilità dei dati è il motivo per cui in passato abbiamo utilizzato RAID-5 o RAID-6 come alternativa a RAID-1.Il RAID di parità garantisce la ridondanza con un sovraccarico di archiviazione molto inferiore a discapito delle prestazioni di archiviazione (soprattutto delle prestazioni di scrittura).Ceph utilizza la codifica di cancellazione per ottenere un risultato simile.Quando la dimensione del tuo sistema di archiviazione diventa grande, potresti sentirti insicuro nel permettere che uno o due dischi o domini di errore falliscano contemporaneamente.L'algoritmo di codifica di cancellazione ti consente di configurare un livello più elevato di ridondanza ma con meno spazio di overhead.
La codifica di cancellazione suddivide i dati originali in K blocchi di dati e calcola ulteriori M blocchi di codifica.Ceph può recuperare i dati massimi M domini di errore falliscono nel frattempo.Il totale di K+M di chunk è memorizzato negli OSD, che si trovano in domini di guasto diversi.

utilizzare la codifica di cancellazione K+M=4+2 per la protezione dei dati.

Pulizia

Come parte del mantenimento della coerenza e della pulizia dei dati, i demoni Ceph OSD possono eseguire la pulizia degli oggetti all'interno dei gruppi di posizionamento. Ciò significa che i demoni Ceph OSD possono confrontare i metadati degli oggetti in un gruppo di posizionamento con le sue repliche nei gruppi di posizionamento memorizzati su altri OSD. La pulizia (solitamente effettuata quotidianamente) individua errori o problemi del sistema di file. I demoni OSD di Ceph eseguono anche una scansione più approfondita confrontando i dati negli oggetti bit per bit. La pulizia approfondita (solitamente eseguita settimanalmente) individua settori danneggiati su un'unità che non erano evidenti in una pulizia leggera.

Ripristino dei dati

A causa del design del posizionamento dei dati di Ceph, i dati vengono ripristinati da tutti gli OSD sani. Non è necessario un disco di riserva per il ripristino dei dati. Ciò può ridurre notevolmente il tempo di ripristino rispetto a un array di dischi, che deve ricostruire i dati persi sul disco di riserva.

se un nodo server fallisce, il cluster si riparerà automaticamente applicando lo stesso metodo di protezione dei dati.

Configura la mappa CRUSH e le regole

Utilizza il gestore UVS per definire la distribuzione dei dati e il dominio di guasto.




Alta Disponibilità e Durabilità dei Dati | Fornitore di soluzioni e servizi di archiviazione Ceph. Software Full-Stack per Ceph.

Fondata a Taiwan nel 2013, Ambedded Technology Co., LTD. è un fornitore leader di soluzioni di archiviazione a blocchi, file e oggetti basate su storage definito dal software Ceph. Ci specializziamo nella fornitura di sistemi di archiviazione ad alta efficienza e scalabili per data center, imprese e istituzioni di ricerca. Le nostre offerte includono appliance di archiviazione basate su Ceph, integrazione di server, ottimizzazione dello storage e implementazione economica di Ceph con gestione semplificata.

Ambedded offre soluzioni di storage Ceph chiavi in mano e soluzioni software Ceph full-stack su misura per le organizzazioni B2B. La nostra piattaforma di archiviazione Ceph supporta l'archiviazione unificata di blocchi, file (NFS, SMB, CephFS) e oggetti compatibili con S3, riducendo il costo totale di proprietà (TCO) migliorando al contempo l'affidabilità e la scalabilità. Con la regolazione Ceph integrata, un'interfaccia web intuitiva e strumenti di automazione, aiutiamo i clienti a ottenere uno storage ad alte prestazioni per carichi di lavoro AI, HPC e cloud.

Con oltre 20 anni di esperienza nell'IT aziendale e più di un decennio nella distribuzione di storage Ceph, Ambedded ha realizzato oltre 200 progetti di successo a livello globale. Offriamo consulenza esperta, progettazione di cluster, supporto alla distribuzione e manutenzione continua. Il nostro impegno per un supporto professionale a Ceph e un'integrazione senza soluzione di continuità garantisce che i clienti ottengano il massimo dalla loro infrastruttura di storage basata su Ceph — su larga scala, con rapidità e nel rispetto del budget.