Silme Kodu K & M sayılarını nasıl seçilir?
Silme kodu nasıl çalışır:
Ceph silme kodu parametreleri K & M, kullanılabilir kapasite verimliliği ve donanım arızalarına karşı yedekliliği içerir. K, veri parçalarının sayısını ve M, kodlama parçalarının sayısını temsil eder. Bir müşteri, bir veri nesnesini Ceph depolama kümesine yazdığında, veri nesnesi K eşit boyutlu veri parçalarına bölünecektir. Ceph, donanım arızalandığında kaybolan veri parçalarını hesaplamak için kullanılacak M parça kodlama parçasını kodlamak üzere veri parçalarını kullanır.
Veri parçaları ve kodlama parçaları, K+M belirtilen hata alanında dağıtılacak ve saklanacaktır. Kaybedilebilecek maksimum veri parçası sayısı M hata alanıdır. Mevcut hata alanları, depolama sunucularının fiziksel altyapı içinde nasıl tahsis edildiğine bağlıdır. Küçük ölçekli bir Ceph kümesi için hata, disk veya sunucu ana bilgisayarları olabilir. Daha büyük ölçekli kümelerin hata alanı, sunucu rafları, sunucu odası veya veri merkezi vb. olabilir.
Veri nesnesi, istemci veriyi okumak istediğinde veri parçalarından yeniden oluşturulur.
Depolama performansı
Ceph veri çoğaltma algoritması ile karşılaştırıldığında, silme kodlaması genellikle daha iyi kullanılabilir alan verimliliğine sahiptir. Çünkü silme kodu, veri I/O'yu tamamlamak için daha fazla disk I/O işlemi kullanır, bu nedenle IOPS talep eden iş yüklerine daha az dosttur. K+M sayısı ne kadar büyükse, I/O işlemi o kadar fazla disk IOPS kaynağı tüketir.
Büyük K ve küçük M kullanıldığında, Ceph küme ağında iletilen toplam veri baytı sayısı daha az olacaktır. Bu, büyük boyutlu veri nesnelerinin I/O verimliliğini artırabilir.
Alan verimliliği
Bir silme kodu havuzunun kullanılabilir alan verimliliği K/(K+M) ile eşittir. Örneğin, K=4, M=2 silme kodu havuzunun alan verimliliği 4/6 = %66.7'dir. Bu, aynı donanım yedekliliği seviyesinde daha yüksek IOPS performansı sağlayan 3 kopya havuzlarına göre iki kat daha verimlidir.
Makul K, kullanılabilir alan verimliliği nedeniyle M'den büyüktür. Daha büyük (K-M) silme kodu, daha iyi alan verimliliği sağlar.
Sunucu ana bilgisayarlarının sayısı
K+M sayısı, kümede gereken ana bilgisayarların veya daha büyük arıza alanlarının sayısını da belirler.
- Tipik bir silme kodu havuzu, tüm EC parçalarını tam olarak dağıtmak için en az K+M sunucu ana bilgisayarına ihtiyaç duyar.
- Gelişmiş bir silme kodu yapılandırması, her arıza alanında birden fazla EC parçası depolamaya olanak tanır. Bu yapılandırma, EC parçalarını dağıtmak için gereken sunucu sayısını azaltır.
Silme kodu K & M etkilerinin özeti:
- M, yedek arıza alanlarının sayısını belirler.
- Daha büyük K + M, istemciler için küçük nesne IOPS performansını azaltır ancak daha büyük nesneler için verimliliği artırır.
- Depolama alanı verimliliği = K/(K+M)
- Gerekli minimum sunucu sayısı.