Làm thế nào để tính toán dung lượng sử dụng được của một cụm Ceph?
Không gian lưu trữ sử dụng được của Ceph bị ảnh hưởng bởi dung lượng đĩa thô, các phương pháp bảo vệ dữ liệu như sao chép hoặc mã xóa, và chi phí hệ thống. Cấp phát mỏng, hạn ngạch và không gian phục hồi dự trữ giúp tối ưu hóa việc sử dụng và đảm bảo khả năng chịu lỗi.
Không gian sử dụng của Ceph được xác định bởi các yếu tố sau
1.Dung lượng thô tối đa của một cụm Ceph được xây dựng bởi nhiều máy chủ là tổng hợp dung lượng đĩa trong mỗi máy chủ.
Nếu cụm bao gồm nhiều loại thiết bị lưu trữ khác nhau, chẳng hạn như HDD, SSD hoặc ổ NVMe, bạn nên tính toán tổng dung lượng đĩa thô cho từng loại thiết bị một cách riêng biệt.Ceph có khả năng nhận diện loại thiết bị được chỉ định cho mỗi pool.
2. Bảo vệ dữ liệu áp dụng cho mỗi pool Ceph xác định không gian sử dụng được.
- Bảo vệ sao chép: không gian sử dụng được = dung lượng thô / kích thước bản sao
- Bảo vệ dữ liệu bằng mã xóa: không gian sử dụng được = dung lượng thô x (K/(K+M))
3. Ceph có một số chi phí cho metadat và các hoạt động hệ thống. Không gian chi phí sử dụng khoảng 10 đến 20% tùy thuộc vào cấu hình và cách sử dụng cụ thể của bạn.
Tất cả không gian ổ đĩa được chia sẻ bởi tất cả các pool sao chép và mã xóa.
- Các pool có thể đặt hoặc không đặt hạn ngạch. Tất cả các hạn ngạch đều là cấp phát mỏng.
- Bởi vì không gian có sẵn của Ceph là cấp phát mỏng; không gian lưu trữ chỉ được phân bổ khi cần thiết, thay vì phân bổ tất cả không gian cần thiết trước. Điều này có thể cải thiện việc sử dụng lưu trữ và giảm chi phí lưu trữ.
- Khuyến nghị dự trữ 1/n không gian trong quá trình hoạt động như không gian phục hồi dữ liệu trong trường hợp phần cứng gặp sự cố, trong đó n là số lượng máy chủ.
- Hệ thống có cảnh báo sử dụng được cài đặt sẵn là 85% gần đầy và 95% đầy.