
أسئلة شائعة حول كود محو تخزين Ceph
مؤخراً، طرح أحد العملاء عدة أسئلة حول كيفية استخدام تخزين Ceph لرمز الحذف لحماية البيانات، وتجنب تلف البيانات في حالة فشل الأجهزة، ووقت استعادة البيانات، وكيفية اختيار K+M، والحد الأدنى لعدد الخوادم المطلوبة لـ Ceph. نعتقد أن العديد من محترفي تكنولوجيا المعلومات الذين يعرفون أنظمة التخزين التقليدية سيكونون مهتمين بفهم ميزات الجيل الجديد من التخزين المعرف بالبرمجيات. سأشارككم عدة أسئلة يطرحها العملاء غالبًا في هذه المقالة.
كم من الوقت سيستغرق Ceph للتعافي من فشل قرص Ceph؟
الوقت المطلوب لاستعادة البيانات من فشل جهاز التخزين يعتمد على الشروط التالية:
- وقت استعادة البيانات لا يتعلق بحجم القرص الصلب. الوقت يتناسب مع كمية البيانات المخزنة على القرص. يحتاج Ceph فقط إلى استعادة البيانات التالفة. كلما كانت البيانات التالفة أقل، كانت عملية الإصلاح أسرع. لا يقوم Ceph بإعادة بناء القرص مثل وحدة التحكم RAID.
- يستعيد Ceph البيانات إلى الأقراص الصحية في الكتلة. كلما زاد عدد الأقراص والمضيفين في الكتلة، زادت سرعة الاستعادة.
- يمكن ضبط سرعة الاستعادة من خلال معلمات البرمجيات. كلما كانت سرعة الاستعادة أعلى، كانت الاستعادة أسرع. تسريع الاستعادة سيشغل المزيد من موارد المعالج وموارد الشبكة.
- ستؤثر أداء المعالج وعرض النطاق الترددي للشبكة أيضًا على سرعة الاستعادة.
- ستكون سرعة استعادة مجموعة مكررة أسرع من مجموعة رمز الحذف.
- بشكل عام، يمكن للمسؤولين إبطاء سرعة الاستعادة لتقليل استخدام موارد الخادم.
الوقت المرجعي للاستعادة:
- قد تستغرق SSD NVMe بضع ساعات.
- قد تستغرق HDD حوالي يوم واحد.
كيف تختار أرقام رمز الحذف K و M؟
كيف يعمل رمز الحذف.
تشير معلمات كود الحذف Ceph K و M إلى كفاءة السعة القابلة للاستخدام والازدواجية ضد فشل الأجهزة. K هو عدد قطع البيانات، و M هو عدد قطع الترميز. عندما يكتب العميل كائن بيانات إلى مجموعة تخزين Ceph، سيتم تقسيم كائن البيانات إلى K قطع بيانات متساوية الحجم. يستخدم Ceph قطع البيانات لترميز M قطع من قطع الترميز، والتي ستستخدم لحساب قطع البيانات المفقودة عند فشل الأجهزة. ستتم توزيع كتل البيانات وكتل التعليمات البرمجية وتخزينها في نطاق الفشل المحدد K+M. الحد الأقصى لعدد أجزاء البيانات التي يمكن فقدانها هو M مجالات الفشل. تعتمد مجالات الفشل المتاحة على كيفية تخصيص خوادم التخزين ضمن البنية التحتية المادية. بالنسبة لمجموعة Ceph صغيرة، يمكن أن يكون الفشل في القرص أو خوادم الاستضافة. يمكن أن تشمل منطقة فشل مجموعة أكبر نطاقات الخوادم، وغرف الخوادم، أو مراكز البيانات، من بين أمور أخرى. يتم إعادة بناء كائن البيانات من أجزاء البيانات عندما يريد العميل قراءة البيانات.
أداء التخزين
مقارنةً بخوارزمية تكرار بيانات Ceph، فإن ترميز الحذف عادةً ما يكون له كفاءة أفضل في استخدام المساحة. لأن كود الحذف يستخدم المزيد من عمليات الإدخال/الإخراج على القرص لإكمال إدخال/إخراج البيانات، فإنه أقل ملاءمة للأحمال التي تتطلب IOPS. كلما زادت قيمة K و M، زادت عمليات الإدخال والإخراج التي ستستهلك موارد IOPS الخاصة بالقرص. عند استخدام K أكبر وM أصغر، سيكون إجمالي عدد بايتات البيانات المنقولة على شبكة مجموعة Ceph أقل. يمكن أن يزيد هذا من أداء نقل الإدخال/الإخراج لكائنات البيانات الكبيرة الحجم.
كفاءة الفضاء
كفاءة مساحة الاستخدام لمجموعة رموز الحذف تساوي K/(K+M).على سبيل المثال، كفاءة المساحة لمجموعة رموز الحذف K=4، M=2 هي 4/6 = 66.7%.هذا أكثر كفاءة مرتين من تجمعات النسخة 3، التي توفر أداء IOPS أعلى مع نفس مستوى التكرار في الأجهزة.
K المعقول أكبر من M بسبب كفاءة المساحة القابلة للاستخدام.كود الحذف الأكبر (K-M) يحقق كفاءة أفضل في استخدام المساحة.
عدد مضيفي الخادم
يحدد عدد K + M أيضًا عدد المضيفين أو مجالات الفشل الأكبر المطلوبة في الكتلة.
- تتطلب مجموعة رموز الحذف القياسية على الأقل K + M من مضيفي الخادم لتوزيع جميع قطع EC بفعالية.
- تسمح تكوينات رموز الحذف المتقدمة بتخزين عدة قطع EC لكل مجال فشل. يقلل هذا التكوين من عدد الخوادم المطلوبة لتوزيع قطع EC.
ملخص تأثيرات رموز الحذف K و M:
- تحدد M عدد مجالات الفشل الزائدة.
- يؤدي K + M الأكبر إلى تقليل أداء IOPS للأشياء الصغيرة للعملاء ولكنه يحسن من الإنتاجية للأشياء الأكبر.
- كفاءة مساحة التخزين = K/(K+M)
- الحد الأدنى لعدد الخوادم المطلوبة.
ما هو الحد الأدنى لعدد مضيفي Ceph OSD المطلوبين لاستخدام مجموعة رموز الحذف؟
أفضل ممارسة لاستخدام تخزين Ceph هي تعيين نطاق فشل التجمع أكبر من "المضيف". تجمع البيانات الذي يستخدم مضيفًا كنطاق فشل يوجه Ceph لكتابة الأجزاء بشكل موزع إلى مضيفين مختلفين لضمان إمكانية استرداد البيانات للأجزاء الأخرى المحفوظة على مضيفين صحيين آخرين. لا يزال بإمكان المستخدمين تكوين نطاق الفشل إلى "قرص صلب"، مما يحمي البيانات بشكل خاص ضد أعطال الأقراص، مشابهًا لمصفوفات الأقراص التقليدية.
إليك التوصيات للحد الأدنى من عدد المضيفين المطلوبين لاستخدام مجموعة رمز الإزالة.
أفضل تكوين: عدد الخوادم ≧ K + M +1
- تتيح هذه الإعدادات لـ Ceph توزيع كل جزء EC عبر K+M مضيف.
- عندما يفشل أحد المضيفين، لديك عدد كافٍ من المضيفين لاستعادة الجزء المفقود.
ثاني أفضل تكوين: عدد الخوادم = K + M
- تسمح هذه الإعدادات بتوزيع كل جزء من EC عبر K+M مضيف.
- عندما يفشل مضيف، ليس لديك مضيف آخر لاستعادة جزء EC المفقود. من الضروري إصلاحه بسرعة لاستعادة النظام إلى حالة صحية في أسرع وقت ممكن.
تكوين محدود الميزانية: عدد الخوادم ≧ (K + M) / M
هذا التكوين يوجه Ceph لتوزيع عدة قطع مشفرة عبر العدد المحدد من المضيفين.عندما يفشل مضيف، سيتم فقدان ما يصل إلى M أجزاء من كائن.
تسمح هذه الإعدادات
- يمكن أن تفشل أي عدد من الأقراص في وقت واحد في مضيف واحد.
- أو يمكن أن يفقد العنقود مضيفًا واحدًا كحد أقصى.
- أو يمكن أن يفشل قرص واحد فقط في كل من المضيفين M في وقت واحد.
في مثال K+M = 4+2، الحد الأدنى لعدد المضيفين المطلوب هو 6/2 = 3. يمكنك فقدان مضيف واحد فقط، ولكن لن يكون لديك عدد كافٍ من المضيفين الأصحاء في العنقود لإعادة شفاء الأجزاء المفقودة.
كيف تحسب السعة القابلة للاستخدام في عنقود Ceph؟
تعتمد المساحة القابلة للاستخدام في Ceph على عدة عوامل مهمة.
1.أقصى سعة خام لمجموعة Ceph المكونة من عدة خوادم هي مجموع مساحة القرص في كل خادم.
إذا كانت المجموعة تتضمن أنواعًا مختلفة من أجهزة التخزين، مثل الأقراص الصلبة HDD، والأقراص الصلبة SSD، أو محركات NVMe، يجب عليك حساب إجمالي مساحة القرص الخام لكل نوع من الأجهزة بشكل منفصل.يمكن لـ Ceph التعرف على فئة الجهاز المحددة المستخدمة من قبل كل مجموعة.
2. تحدد حماية البيانات المطبقة على كل مجموعة Ceph المساحة القابلة للاستخدام.
- حماية مكررة: المساحة القابلة للاستخدام = السعة الخام / حجم النسخة
- حماية بيانات رمز الإزالة: المساحة القابلة للاستخدام = السعة الخام × (K/(K+M))
3. يحتوي Ceph على بعض التكاليف الإضافية للبيانات الوصفية وعمليات النظام. المساحة الإضافية المستخدمة تتراوح بين 10 إلى 20% حسب تكوينك واستخدامك المحدد.
تتم مشاركة جميع مساحة محركات الأقراص بين جميع مجموعات النسخ المكررة ورموز الإزالة
- يمكن للمجموعات تعيين أو عدم تعيين الحصص. جميع الحصص هي توفير رقيق
- نظرًا لأن المساحة المتاحة في Ceph هي توفير رقيق، يتم تخصيص مساحة التخزين فقط عند الحاجة، بدلاً من تخصيص كل المساحة المطلوبة مسبقًا. يمكن أن يحسن ذلك من استخدام التخزين ويقلل من تكاليف التخزين.
- يوصى بحجز 1/n من المساحة أثناء التشغيل كمساحة لاستعادة البيانات في حالة فشل الأجهزة، حيث n هو عدد الخوادم.
- يمتلك النظام تحذيرات مسبقة للاستخدام عند 85% قريبة من الامتلاء و95% ممتلئة.