Jak obliczyć użyteczną pojemność klastra Ceph?
Dostępna przestrzeń magazynowa Ceph jest wpływana przez surową pojemność dysku, metody ochrony danych, takie jak replikacja lub kodowanie erasure, oraz narzuty systemowe. Cienkowarstwowe przydziały, kwoty i zarezerwowana przestrzeń do odzyskiwania pomagają optymalizować wykorzystanie i zapewniać odporność na błędy.
Użyteczna przestrzeń Ceph jest określana przez następujące czynniki
1.Maksymalna surowa pojemność klastra Ceph zbudowanego z wielu serwerów to suma przestrzeni dyskowej w każdym serwerze.
Jeśli klaster zawiera różne typy urządzeń pamięci masowej, takie jak HDD, SSD lub dyski NVMe, należy obliczyć całkowitą surową przestrzeń dyskową dla każdego typu urządzenia osobno.Ceph jest w stanie rozpoznać wyznaczoną klasę urządzenia używaną przez każdy zbiornik.
2. Ochrona danych stosowana dla każdego zbioru Ceph określa dostępną przestrzeń.
- Ochrona replikowana: dostępna przestrzeń = pojemność surowa / rozmiar repliki
- Ochrona danych za pomocą kodu erasure: dostępna przestrzeń = pojemność surowa x (K/(K+M))
3. Ceph ma pewne narzuty związane z metadanymi i operacjami systemowymi. Używana przestrzeń narzutowa wynosi około 10 do 20% w zależności od konkretnej konfiguracji i użycia.
Wszystkie przestrzenie dysków są współdzielone przez wszystkie zbiory replikowane i kodowane erasure.
- Zbiory mogą ustalać lub nie ustalać kwot. Wszystkie kwoty są kwotami przydziału.
- Ponieważ dostępna przestrzeń Ceph jest przydzielana w sposób cienkowarstwowy; przestrzeń magazynowa jest przydzielana tylko w razie potrzeby, zamiast przydzielać całą wymaganą przestrzeń z góry. Może to poprawić wykorzystanie pamięci i obniżyć koszty przechowywania.
- Zaleca się rezerwowanie 1/n przestrzeni podczas pracy jako przestrzeni do odzyskiwania danych w przypadku awarii sprzętu, gdzie n to liczba serwerów.
- System ma wstępnie ustawione ostrzeżenia o użyciu na poziomie 85% blisko pełnej i 95% pełnej.