توازن تحميل تخزين S3 للذكاء الاصطناعي مع Ceph RGW | حل تخزين Ceph ومزود الخدمة. برنامج كامل لCeph.

تعتبر خيارات موازن التحميل المفتوحة المصدر Ingress و LVS TUN خيارين لموازن التحميل لـ Ceph RGW. Ingress مثالي للسحابة العامة أو البيئات متعددة المستأجرين، بينما يناسب LVS TUN الكتل الخاصة بالذكاء الاصطناعي أو HPC حيث تكون السرعة العالية والكمون المنخفض أمرين حاسمين. | مزود حل وخدمة تخزين Ceph. برنامج كامل لتخزين Ceph.

تعتبر خيارات موازن التحميل المفتوحة المصدر Ingress و LVS TUN خيارين لموازن التحميل لـ Ceph RGW. Ingress مثالي للسحابة العامة أو البيئات متعددة المستأجرين، بينما يناسب LVS TUN الكتل الخاصة بالذكاء الاصطناعي أو HPC حيث تكون السرعة العالية والكمون المنخفض أمرين حاسمين.

توازن تحميل تخزين S3 للذكاء الاصطناعي مع Ceph RGW

تتطلب أحمال العمل الخاصة بالذكاء الاصطناعي تخزين S3 قابل للتوسع وعالي الإنتاجية لبيانات التدريب والنماذج ومخرجات الاستدلال. يوفر Ceph RGW واجهة خلفية موثوقة ومتوافقة مع S3، ولكن الأداء يعتمد بشكل كبير على توازن الحمل. لأجهزة الذكاء الاصطناعي الخاصة التي تستخدم NVMe، يوفر LVS TUN عرض نطاق ترددي قريب من معدل الخط وزمن وصول منخفض. يدعم UniVirStor الخاص بـ Ambedded بشكل أصلي LVS TUN مع إعداد تلقائي وتصميم عالي التوفر، مما يجعله مثالياً لبيئات تخزين الذكاء الاصطناعي الحساسة للأداء.


تلخص النقاط الرئيسية التالية الحاجة والتبرير لكل خيار تصميم.

لماذا تحتاج الذكاء الاصطناعي إلى تخزين قابل للتوسع وفعال

تتطلب أحمال العمل الحديثة في الذكاء الاصطناعي الوصول السريع إلى بيانات التدريب وتخزين طويل الأمد بتكلفة فعالة. يوفر تخزين كائنات S3، الذي يتم الوصول إليه عبر NVMe أو HDD، خلفية قابلة للتوسع لإدارة مجموعات البيانات الكبيرة ونقاط التحقق ونماذج الاستدلال.

  • NVMe عالي السرعة لمجموعات بيانات التدريب والوصول منخفض الكمون
  • HDD بتكلفة فعالة للتخزين طويل الأمد والأرشيفات

لماذا يعد S3 مثالياً لأحمال عمل الذكاء الاصطناعي

يتم اعتماد التخزين المتوافق مع S3 على نطاق واسع في خطوط أنابيب الذكاء الاصطناعي بسبب واجهة برمجة التطبيقات RESTful الخاصة به، وقابليته للتوسع، وتكامله مع أطر التعلم الآلي. يدعم:

  • تخزين مجموعات البيانات والنماذج
  • نقاط التحقق وإصدار العناصر
  • تقديم النماذج إلى نقاط نهاية الاستدلال
  • التكامل مع TensorFlow ، Pytorch ، MLFlow

لماذا تعتبر Ceph RGW مناسبة قوية لتخزين S3 للذكاء الاصطناعي

Ceph RGW هو خدمة تخزين كائنات مفتوحة المصدر ومتوافقة مع S3 تقدم توافرًا عاليًا، واتساقًا قويًا، وقابلية التوسع على نطاق البيتابايت. تشمل الميزات الرئيسية:

  • يدعم قابلية التوسع عبر مئات العقد
  • يقدم اتساقًا قويًا وترميز محو لضمان المتانة
  • يوفر تكرارًا متعدد المواقع مدمجًا لحالات استخدام السحابة الهجينة
  • يمكن نشره على أجهزة الكمبيوتر التجارية ذات التكلفة الفعالة

هذا يجعل Ceph RGW خلفية قوية لتخزين الكائنات الموجهة نحو الذكاء الاصطناعي على نطاق البيتابايت وفي البيئات الحرجة من حيث الأداء.

الحاجة إلى توازن تحميل عالي التوفر في Ceph RGW

Ceph RGW بلا حالة، مما يسمح بالتوسع الأفقي. ومع ذلك، لتقديم:

  • توافر عالي
  • دعم التبديل الفاشل
  • قابلية أداء التوسع

تحتاج إلى موازن تحميل أمامي يمكنه توزيع طلبات S3 الواردة (GET، PUT، DELETE) بشكل موثوق وفعال عبر عدة مثيلات RGW.

بدون موازنة تحميل مناسبة، قد يصبح عقدة RGW واحدة أو خادم أمامي نقطة اختناق أو نقطة فشل واحدة.

خيارات موازن التحميل مفتوحة المصدر لـ Ceph RGW

تستخدم عادةً مع موازني تحميل مفتوح المصدر معماريتان رئيسيتان:

  1. مبني على المدخلات (HAProxy + Keepalived + Multi-VIP + DNS RR)
    • دعم الطبقة 7 (HTTP)
    • يدعم إنهاء TLS، وتوجيه متعدد المستأجرين بناءً على SNI
    • مناسب للسحابة العامة أو نشرات متعددة المستأجرين
    • زمن استجابة أعلى قليلاً ويتطلب ضبطًا دقيقًا لتجنب نقاط الاختناق
    • عند مقاييس نشر أكبر، تتطلب عدة خوادم أجهزة عالية الأداء لمنع HAProxy من أن يصبح عنق الزجاجة.
  2. LVS TUN + conntrackd + أقل الاتصالات وزناً (WLC)
    • توجيه IP في IP في الطبقة الرابعة
    • عالية الإنتاجية واستخدام منخفض لوحدة المعالجة المركزية
    • يتجاوز الموازن لحركة المرور العائدة
    • الأفضل للشبكات الداخلية الخاصة عالية السرعة

لماذا يعتبر LVS TUN أفضل لتخزين AI S3 الخاص القائم على NVMe

بالنسبة لمجموعات تدريب الذكاء الاصطناعي الداخلية المعتمدة على NVMe، فإن الأداء هو الأولوية القصوى:

  • تحقق LVS TUN عرض نطاق قريب من معدل الخط
  • لا تنهي TLS، مما يقلل من عبء وحدة المعالجة المركزية
  • يضمن conntrackd انتقالاً سلساً دون انقطاع للعميل
  • عدم وجود فحص على مستوى التطبيق يقلل من زمن الاستجابة

لذا، فإن LVS TUN هو الخيار الأفضل من HAProxy لتخزين كائنات الذكاء الاصطناعي عالي السرعة (مثل، خطوط تدريب مجموعات GPU).

مقارنة بين LVS TUN و Ingress لتطبيقات AI السحابية الخاصة والعامة

الميزةدخول (هابروكسي)LVS TUN CONNTRACKD
إنهاء TLS✅ نعم❌ لا
توجيه متعدد المستأجرين✅ نعم❌ لا
معدل النقل❌ محدود✅ معدل الخط
الكمون❌ أعلى✅ أقل
فحوصات الصحة✅ HTTP❌ TCP/ICMP
تكامل DNS✅ مطلوب❌ غير مطلوب
حالة الاستخدام المثاليةالسحابة العامةالذكاء الاصطناعي الخاص / الحوسبة عالية الأداء

كيف يدعم UniVirStor الخاص بـ Ambedded موازن تحميل LVS لـ Ceph RGW

يوفر UniVirStor دعمًا أصليًا لوضع LVS TUN، بما في ذلك:

  • إعداد تلقائي يعتمد على Ansible
  • توافر عالي مع الاحتفاظ
  • خطافات فحص الصحة ومقاييس الأداء
  • توجيه محسن لبوابات S3 عالية الإنتاجية

هذا يجعل UniVirStor مثاليًا للعملاء الذين يبنون بحيرات بيانات الذكاء الاصطناعي أو مجموعات الذكاء الاصطناعي المعتمدة على وحدات معالجة الرسوميات التي تتطلب الأداء والموثوقية من Ceph RGW.

الخاتمة

اختيار بنية موازن الحمل المناسبة أمر ضروري لبناء واجهة تخزين S3 قوية وقابلة للتوسع للذكاء الاصطناعي.

  • للمجموعات الخاصة بالذكاء الاصطناعي، استخدم LVS TUN + conntrackd لتعظيم الأداء.
  • لخدمات الواجهة العامة أو S3 متعددة المستأجرين، استخدم HAProxy المعتمد على Ingress للحصول على مرونة أفضل وإدارة TLS.

يساعدك UniVirStor من Ambedded على نشر كلا السيناريوهين بكفاءة مع ضبط على مستوى الإنتاج ودعم عالي التوفر.


توازن تحميل تخزين S3 للذكاء الاصطناعي مع Ceph RGW | مزود حل وخدمة تخزين Ceph. برنامج كامل لتخزين Ceph.

تأسست في تايوان عام 2013، Ambedded Technology Co., LTD. هي مزود رائد لحلول التخزين الكتلي والملف والكائنات المعتمدة على تخزين Ceph المعرف بالبرمجيات. نحن متخصصون في تقديم أنظمة تخزين عالية الكفاءة وقابلة للتوسع لمراكز البيانات والشركات والمؤسسات البحثية. تشمل عروضنا أجهزة تخزين قائمة على Ceph، ودمج الخوادم، وتحسين التخزين، ونشر Ceph بتكلفة فعالة مع إدارة مبسطة.

Ambedded تقدم أجهزة تخزين Ceph جاهزة وحلول برمجيات Ceph كاملة مخصصة للمنظمات B2B. تدعم منصة تخزين Ceph لدينا التخزين الموحد للكتل والملفات (NFS، SMB، CephFS) وتخزين الكائنات المتوافق مع S3، مما يقلل من إجمالي تكلفة الملكية (TCO) مع تحسين الموثوقية وقابلية التوسع. مع ضبط Ceph المتكامل، وواجهة المستخدم الويب البديهية، وأدوات الأتمتة، نساعد العملاء على تحقيق تخزين عالي الأداء لتطبيقات الذكاء الاصطناعي، والحوسبة عالية الأداء، وأعباء العمل السحابية.

مع أكثر من 20 عامًا من الخبرة في تكنولوجيا المعلومات المؤسسية وأكثر من عقد من الزمان في نشر تخزين Ceph، قدمت Ambedded أكثر من 200 مشروع ناجح على مستوى العالم. نحن نقدم استشارات متخصصة، وتصميم الكتل، ودعم النشر، والصيانة المستمرة. تضمن التزامنا بدعم Ceph الاحترافي والتكامل السلس أن يحصل العملاء على أقصى استفادة من بنية التخزين المعتمدة على Ceph — على نطاق واسع، وبسرعة، وضمن الميزانية.