Ceph Depolama Silme Kodu SSS | Ceph depolama çözümü ve hizmet sağlayıcısı. Ceph için Tam Yığın yazılım.

Ceph Depolama Silme Kodu SSS | Ceph depolama çözümü ve hizmet sağlayıcısı. Ceph için Tam Yığın yazılım.

Ceph Depolama Silme Kodu SSS

Ceph Depolama Silme Kodu SSS

Son zamanlarda, bir müşteri Ceph depolamanın verileri korumak için Erasure Code'u nasıl kullandığı, donanım arızası durumunda veri bozulmasını nasıl önlediği, veri kurtarma süresi, K+M'yi nasıl seçeceği ve Ceph için gereken minimum sunucu sayısı hakkında birkaç soru sordu. Geleneksel depolama sistemlerine aşina olan birçok BT profesyonelinin, yazılım tanımlı depolamanın yeni nesil özelliklerini anlamakla ilgileneceğine inanıyoruz. Bu makalede müşterilerin sıkça sorduğu birkaç soruyu sizinle paylaşacağım.


Ceph'in bir disk arızasından kurtulması ne kadar sürecek?

Bir depolama cihazı arızasından veri kurtarmak için gereken süre aşağıdaki koşullara bağlıdır:

  • Verilerin kurtarılması için gereken süre, sabit diskin boyutuyla ilgili değildir. Süre, diskte depolanan veri miktarıyla orantılıdır. Ceph yalnızca hasar görmüş verileri geri yüklemesi gerekir. Hasar gören veri ne kadar azsa, onarım o kadar hızlıdır. Ceph, bir RAID denetleyicisi gibi bir diski yeniden inşa etmez.
  • Ceph, verileri kümedeki sağlıklı disklerine yeniden iyileştirir. Kümedeki disk ve ana bilgisayar sayısı arttıkça, iyileşme hızı da artar.
  • İyileşme hızı yazılım parametreleriyle ayarlanabilir. İyileşme hızı ne kadar yüksek ayarlanırsa, iyileşme o kadar hızlı olur. İyileşmeyi hızlandırmak, daha fazla CPU ve ağ donanım kaynağı kullanır.
  • CPU performansı ve ağ bant genişliği de iyileşme hızını etkiler.
  • Bir kopyalanmış havuzun iyileşme hızı, silme kodu havuzundan daha hızlı olacaktır.
  • Genel olarak, yöneticiler sunucu kaynaklarının kullanımını azaltmak için iyileşme hızını yavaşlatabilir.

İyileşme için referans zamanı:

  • NVMe SSD birkaç saat sürebilir.
  • HDD yaklaşık bir gün sürebilir.

Silme Kodu K & M sayıları nasıl seçilir?

Silme kodu nasıl çalışır?

Ceph silme kodu parametreleri K & M, kullanılabilir kapasite verimliliği ve donanım arızalarına karşı yedekliliği içerir. K, veri parçalarının sayısını, M ise kodlama parçalarının sayısını temsil eder. Bir müşteri, bir veri nesnesini Ceph depolama kümesine yazdığında, veri nesnesi K eşit boyutlu veri parçalarına bölünecektir. Ceph, donanım arızalandığında kaybolan veri parçalarını hesaplamak için kullanılacak M parça kodlama parçasını kodlamak üzere veri parçalarını kullanır. Veri parçaları ve kodlama parçaları, K+M belirtilen hata alanında dağıtılacak ve saklanacaktır. Kaybedilebilecek maksimum veri parçası sayısı M arıza alanıdır. Mevcut hata alanları, depolama sunucularının fiziksel altyapı içinde nasıl tahsis edildiğine bağlıdır. Küçük ölçekli bir Ceph kümesi için, arıza disk veya sunucu ana makinelerinde olabilir. Daha büyük ölçekli bir kümenin arıza alanı, sunucu rafları, sunucu odaları veya veri merkezleri gibi unsurları içerebilir. Veri nesnesi, istemci veriyi okumak istediğinde veri parçalarından yeniden oluşturulur.

Depolama performansı

Ceph veri çoğaltma algoritmasıyla karşılaştırıldığında, silme kodlaması genellikle daha iyi kullanılabilir alan verimliliğine sahiptir. Silme kodu, veri I/O'yu tamamlamak için daha fazla disk I/O işlemi kullandığından, IOPS talep eden iş yükleri için daha az dostçadır. K ve M'nin toplamı ne kadar büyükse, I/O işlemleri disk IOPS kaynaklarını o kadar fazla tüketecektir. Büyük K ve küçük M kullanıldığında, Ceph küme ağında iletilen toplam veri baytı sayısı daha az olacaktır. Bu, büyük boyutlu veri nesnelerinin I/O verimliliğini artırabilir.

Uzay verimliliği

Bir silme kodu havuzunun kullanılabilir alan verimliliği K/(K+M) ile eşittir.Örneğin, K=4, M=2 silme kodu havuzunun alan verimliliği 4/6 = %66.7'dir.Bu, aynı donanım yedekliliği seviyesinde daha yüksek IOPS performansı sağlayan replica 3 havuzlarından iki kat daha verimlidir.
K'nın makul değeri, kullanılabilir alan verimliliği nedeniyle M'den büyüktür.Daha büyük (K-M) silme kodu, daha iyi alan verimliliği sağlar.

Sunucu ana bilgisayarlarının sayısı

K+M sayısı, kümede gereken ana bilgisayarların veya daha büyük arıza alanlarının sayısını da belirler.

  • Standart bir silme kodu havuzu, tüm EC parçalarını etkili bir şekilde dağıtmak için en az K + M sunucu ana bilgisayarına ihtiyaç duyar.
  • Gelişmiş bir silme kodu yapılandırması, her arıza alanında birden fazla EC parçası depolamaya olanak tanır. Bu yapılandırma, EC parçalarını dağıtmak için gereken sunucu sayısını azaltır.
Silme kodu K & M etkilerinin özeti:
  • M, yedek arıza alanlarının sayısını belirler.
  • Daha büyük K + M, istemciler için küçük nesne IOPS performansını azaltır ancak daha büyük nesneler için verimliliği artırır.
  • Depolama alanı verimliliği = K/(K+M)
  • Gerekli minimum sunucu sayısı.

Silme kodu havuzunu kullanmak için gereken minimum Ceph OSD ana bilgisayar sayısı nedir?

Ceph depolama kullanmanın en iyi uygulaması, havuz arıza alanını "host"tan daha büyük olarak ayarlamaktır. Bir hostu arıza alanı olarak kullanan bir veri havuzu, Ceph'e verilerin diğer sağlıklı hostlarda kaydedilen diğer parçalar için kurtarılabilir olmasını sağlamak amacıyla parçaları farklı hostlara dağıtıkça yazmasını talimat verir. Kullanıcılar, verileri özellikle disk arızalarına karşı koruyan, geleneksel disk dizilerine benzer şekilde, arıza alanını "disk sürücüsü" olarak yapılandırmaya devam edebilirler.

Bir silme kodu havuzunu kullanmak için gereken minimum ana bilgisayar sayısı için öneriler burada.

En iyi yapılandırma: Sunucu sayısı ≧ K + M +1

  • Bu yapılandırma, Ceph'in her EC parçasını K+M ana bilgisayarı arasında dağıtmasını sağlar.
  • Ana bilgisayarlardan biri arızalandığında, kaybolan parçayı geri yüklemek için yeterli ana bilgisayarınız vardır.

İkinci en iyi yapılandırma: Sunucu sayısı = K + M

  • Bu yapılandırma, her EC parçasının K+M ana bilgisayarı arasında dağıtılmasına olanak tanır.
  • Bir ana bilgisayar arızalandığında, kaybolan EC parçasını geri yüklemek için başka bir ana bilgisayarınız yoktur. Sistemi mümkün olan en kısa sürede sağlıklı bir duruma geri döndürmek için onu zamanında onarmak çok önemlidir.

Bütçe sınırlı yapılandırma: Sunucu sayısı ≧ (K + M) / M
Bu yapılandırma, Ceph'e belirlenen sayıda ana bilgisayar arasında birkaç silme kodlu parça dağıtmasını talimat verir.Bir ana bilgisayar arızalandığında, en fazla M parça bir nesne kaybolacaktır.

Bu yapılandırma izin verir

  • Bir ana makinede aynı anda herhangi bir sayıda disk arızalanabilir.
  • Ya da küme en fazla bir ana makine kaybedebilir.
  • Ya da M ana makinesinin her birinde yalnızca bir disk aynı anda arızalanabilir.

K+M = 4+2 örneği için gereken minimum ana makine sayısı 6/2 = 3'tür. Sadece bir ana makine kaybedebilirsiniz, ancak kaybolan parçaları yeniden iyileştirmek için kümede yeterli sağlıklı ana makine olmayacaktır.

Bir Ceph kümesinin kullanılabilir kapasitesi nasıl hesaplanır?

Ceph'teki kullanılabilir alan birkaç önemli faktöre bağlıdır.

1.Birden fazla sunucu tarafından oluşturulan bir Ceph kümesinin maksimum ham kapasitesi, her sunucudaki disk alanlarının toplamıdır.
Eğer küme HDD, SSD veya NVMe sürücüleri gibi çeşitli depolama cihazı türlerini içeriyorsa, her cihaz türü için toplam ham disk alanını ayrı ayrı hesaplamalısınız.Ceph, her havuz için kullanılan belirlenen cihaz sınıfını tanıma yeteneğine sahiptir.

2. Her Ceph havuzuna uygulanan veri koruma, kullanılabilir alanı belirler.

  • Yinelenmiş koruma: kullanılabilir alan = ham kapasite/yinelenme boyutu
  • Silme Kodu veri koruması: kullanılabilir alan = ham kapasite x (K/(K+M))

3. Ceph, meta veriler ve sistem işlemleri için bazı ek yükler taşır. Kullanılan ek yük alanı, belirli yapılandırmanıza ve kullanımınıza bağlı olarak yaklaşık %10 ile %20 arasındadır.

Tüm disk sürücü alanı, tüm yinelenmiş ve silme kodu havuzları arasında paylaşılır.

  • Havuzlar kota belirleyebilir veya belirlemeyebilir. Tüm kotalar ince tahsisat olarak tanımlanır.
  • Ceph'in mevcut alanı ince tahsisat olduğundan, depolama alanı yalnızca gerektiğinde tahsis edilir, tüm gerekli alan önceden tahsis edilmez. Bu, depolama kullanımını artırabilir ve depolama maliyetlerini azaltabilir.
  • Donanım arızası durumunda veri kurtarma alanı olarak işletim sırasında 1/n alanı ayırmanız önerilir; burada n, sunucu sayısını temsil eder.
  • Sistem, %85 doluluğa yakın ve %95 dolu için önceden ayarlanmış kullanım uyarılarına sahiptir.

Ceph Depolama Silme Kodu SSS | Ceph depolama çözümü ve hizmet sağlayıcısı. Ceph için Tam Yığın yazılım.

2013 yılında Tayvan'da kurulan Ambedded Technology Co., LTD., Ceph yazılım tanımlı depolama tabanlı blok, dosya ve nesne depolama çözümleri sunan önde gelen bir sağlayıcıdır. Veri merkezleri, işletmeler ve araştırma kurumları için yüksek verimli, ölçeklenebilir depolama sistemleri sunma konusunda uzmanız. Ürünlerimiz arasında Ceph tabanlı depolama cihazları, sunucu entegrasyonu, depolama optimizasyonu ve basitleştirilmiş yönetim ile maliyet etkin Ceph dağıtımı bulunmaktadır.

Ambedded B2B organizasyonları için özel olarak tasarlanmış anahtar teslim Ceph depolama cihazları ve tam yığın Ceph yazılım çözümleri sunmaktadır. Ceph depolama platformumuz, toplam sahip olma maliyetini (TCO) azaltırken güvenilirliği ve ölçeklenebilirliği artırarak birleşik blok, dosya (NFS, SMB, CephFS) ve S3 uyumlu nesne depolamayı desteklemektedir. Entegre Ceph ayarları, sezgisel web arayüzü ve otomasyon araçları ile müşterilerin AI, HPC ve bulut iş yükleri için yüksek performanslı depolama elde etmelerine yardımcı oluyoruz.

Kurumsal BT alanında 20 yılı aşkın deneyim ve Ceph depolama dağıtımında on yılı aşkın bir süredir, Ambedded dünya genelinde 200'den fazla başarılı proje gerçekleştirmiştir. Uzman danışmanlık, küme tasarımı, dağıtım desteği ve sürekli bakım hizmetleri sunuyoruz. Profesyonel Ceph desteğine ve sorunsuz entegrasyona olan bağlılığımız, müşterilerin Ceph tabanlı depolama altyapılarından en iyi şekilde yararlanmalarını sağlar — ölçeklenebilir, hızlı ve bütçe dahilinde.