Làm thế nào để chọn các số K & M của mã xóa?
Cách mà mã xóa hoạt động:
Các tham số mã xóa Ceph K & M liên quan đến hiệu suất dung lượng sử dụng và độ dư thừa chống lại sự cố phần cứng. K là số lượng các khối dữ liệu và M là số lượng các khối mã hóa. Khi một khách hàng ghi một đối tượng dữ liệu vào cụm lưu trữ Ceph, đối tượng dữ liệu sẽ được chia thành K phần dữ liệu có kích thước bằng nhau. Ceph sử dụng các khối dữ liệu để mã hóa M khối mã hóa sẽ được sử dụng để tính toán các khối dữ liệu bị mất khi phần cứng gặp sự cố.
Các khối dữ liệu và khối mã sẽ được phân phối và lưu trữ trong miền lỗi được chỉ định bởi K+M. Số lượng tối đa các khối dữ liệu có thể bị mất là M miền lỗi. Các miền lỗi có sẵn phụ thuộc vào cách mà các máy chủ lưu trữ được phân bổ trong hạ tầng vật lý. Đối với một cụm Ceph quy mô nhỏ, lỗi có thể là do đĩa hoặc máy chủ. Miền lỗi của các cụm quy mô lớn hơn có thể là các giá máy chủ, phòng máy chủ hoặc trung tâm dữ liệu, v.v.
Đối tượng dữ liệu được tái cấu trúc từ các khối dữ liệu khi khách hàng muốn đọc dữ liệu.
Hiệu suất lưu trữ
So với thuật toán sao chép dữ liệu Ceph, mã xóa thường có hiệu suất không gian sử dụng tốt hơn. Bởi vì mã xóa sử dụng nhiều thao tác I/O đĩa hơn để hoàn thành I/O dữ liệu, nó ít thân thiện hơn với các khối lượng công việc yêu cầu IOPS. Số lượng K+M càng lớn, thao tác I/O tiêu tốn nhiều tài nguyên IOPS của đĩa hơn.
Khi sử dụng K lớn hơn và M nhỏ hơn, tổng số byte dữ liệu được truyền trên mạng cụm Ceph sẽ ít hơn. Điều này có thể tăng hiệu suất thông lượng I/O của các đối tượng dữ liệu có kích thước lớn.
Hiệu quả không gian
Hiệu suất không gian sử dụng của một nhóm mã xóa bằng K/(K+M). Ví dụ, hiệu suất không gian của nhóm mã xóa K=4, M=2 là 4/6 = 66,7%. Điều này hiệu quả gấp đôi so với các nhóm bản sao 3, cung cấp hiệu suất IOPS cao hơn với cùng mức độ dự phòng phần cứng.
K hợp lý lớn hơn M do hiệu quả không gian sử dụng. Mã xóa (K-M) lớn hơn mang lại hiệu quả không gian tốt hơn.
Số lượng máy chủ
Số lượng K+M cũng xác định số lượng máy chủ hoặc miền lỗi lớn hơn cần thiết trong cụm.
- Một nhóm mã xóa điển hình yêu cầu tối thiểu K+M máy chủ để phân phối đầy đủ tất cả các khối EC.
- Một cấu hình mã xóa nâng cao cho phép lưu trữ nhiều khối EC trên mỗi miền lỗi. Cấu hình này giảm số lượng máy chủ cần thiết để phân phối các khối EC.
Tóm tắt ảnh hưởng của mã xóa K & M:
- M xác định số lượng miền lỗi dư thừa.
- K + M lớn hơn dẫn đến hiệu suất IOPS của đối tượng nhỏ giảm cho khách hàng nhưng cải thiện thông lượng cho các đối tượng lớn hơn.
- Hiệu quả không gian lưu trữ = K/(K+M)
- Số lượng máy chủ tối thiểu cần thiết.