Балансировка нагрузки для хранения S3 для ИИ с Ceph RGW | Решение для хранения Ceph и поставщик услуг. Полноценное программное обеспечение для Ceph.

Ingress и LVS TUN — это два варианта балансировщиков нагрузки с открытым исходным кодом для Ceph RGW. Ingress идеально подходит для публичных облаков или многопользовательских сред, в то время как LVS TUN подходит для частных кластеров ИИ или HPC, где критически важны высокая пропускная способность и низкая задержка. | Провайдер решений и услуг хранения Ceph. Полнофункциональное программное обеспечение для Ceph.

Ingress и LVS TUN — это два варианта балансировщиков нагрузки с открытым исходным кодом для Ceph RGW. Ingress идеально подходит для публичных облаков или многопользовательских сред, в то время как LVS TUN подходит для частных кластеров ИИ или HPC, где критически важны высокая пропускная способность и низкая задержка.

Балансировка нагрузки для хранения S3 для ИИ с Ceph RGW

Рабочие нагрузки ИИ требуют масштабируемого, высокопроизводительного S3-хранилища для обучающих данных, моделей и выходных данных вывода. Ceph RGW предлагает надежный бэкенд, совместимый с S3, но производительность сильно зависит от балансировки нагрузки. Для частных ИИ-кластеров, использующих NVMe, LVS TUN обеспечивает пропускную способность, близкую к линии, и низкую задержку. Ambedded UniVirStor нативно поддерживает LVS TUN с автоматической настройкой и дизайном высокой доступности, что делает его идеальным для критически важных по производительности сред хранения данных для ИИ.


Следующие ключевые моменты подводят итоги необходимости и обоснования каждого выбора дизайна.

Почему ИИ нуждается в масштабируемом и эффективном хранилище

Современные AI рабочие нагрузки требуют как быстрого доступа к данным для обучения, так и экономичного долгосрочного хранения. Объектное хранилище S3, доступное через NVMe или HDD, предоставляет масштабируемую инфраструктуру для управления большими наборами данных, контрольными точками и моделями вывода.

  • Высокоскоростной NVMe для наборов данных для обучения и низкая задержка доступа
  • Экономичный HDD для долгосрочного хранения и архивов

Почему S3 идеально подходит для рабочих нагрузок ИИ

Совместимое с S3 хранилище широко используется в AI пайплайнах благодаря своему RESTful API, масштабируемости и интеграции с ML фреймворками. Оно поддерживает:

  • Хранение наборов данных и моделей
  • Контрольные точки и версионирование артефактов
  • Обслуживание моделей для конечных точек вывода
  • Интеграция с Tensorflow, Pytorch, Mlflow

Почему Ceph RGW является отличным выбором для хранения S3 для ИИ

Ceph RGW — это сервис объектного хранения с открытым исходным кодом, совместимый с S3, который предлагает высокую доступность, сильную согласованность и масштабируемость до петабайтов. Ключевые особенности включают:

  • Поддержка масштабируемости на сотнях узлов
  • Предлагает сильную согласованность и кодирование с удалением для надежности
  • Обеспечивает интегрированную многосайтовую репликацию для гибридных облачных сценариев использования
  • Может быть развернут на недорогом стандартном оборудовании

Это делает Ceph RGW мощным бэкендом для объектного хранения, ориентированного на ИИ, как на уровне петабайтов, так и в критически важных для производительности средах.

Необходимость балансировки нагрузки с высокой доступностью в Ceph RGW

Ceph RGW без состояния, что позволяет горизонтальное масштабирование. Однако для обеспечения:

  • Высокой доступности
  • Поддержка отказоустойчивости
  • Масштабируемость производительности

Вам нужен балансировщик нагрузки на уровне фронтенда, который может надежно и эффективно распределять входящие запросы S3 (GET, PUT, DELETE) между несколькими экземплярами RGW.

Без надлежащей балансировки нагрузки один узел RGW или сервер фронтенда могут стать узким местом или единой точкой отказа.

Опции балансировщиков нагрузки с открытым исходным кодом для Ceph RGW

Две основные архитектуры, которые обычно используются с балансировщиками нагрузки с открытым исходным кодом:

  1. На основе Ingress (HAProxy + Keepalived + Multi-VIP + DNS RR)
    • Поддержка уровня 7 (HTTP)
    • Поддерживает завершение TLS, маршрутизацию на основе SNI для нескольких арендаторов
    • Подходит для публичного облака или развертываний с несколькими арендаторами
    • Немного более высокая задержка и требует тщательной настройки, чтобы избежать узких мест
    • При больших масштабах развертывания требуется несколько высокопроизводительных серверов, чтобы предотвратить узкое место в HAProxy.
  2. LVS TUN + conntrackd + Взвешенные наименьшие соединения (WLC)
    • Туннелирование IP-in-IP на уровне 4
    • Высокая пропускная способность и низкое использование ЦП
    • Обходит балансировщик для обратного трафика
    • Лучше всего подходит для частных высокоскоростных внутренних сетей

Почему LVS TUN лучше для частного AI S3 хранилища на основе NVMe

Для внутренних кластеров обучения ИИ на базе NVMe производительность является главным приоритетом:

  • LVS TUN достигает пропускной способности, близкой к линии
  • Не завершает TLS, снижая нагрузку на ЦП
  • conntrackd обеспечивает бесшовный переход без прерывания клиента
  • Отсутствие инспекции на уровне приложения снижает задержку

Таким образом, LVS TUN лучше подходит, чем HAProxy, для высокоскоростного внутреннего хранения объектов ИИ (например, для обучения кластеров GPU).

Сравнение LVS TUN и Ingress для частных и публичных облачных AI приложений

ФункцияВход (Haproxy)LVS TUN CONNTRACKD
Завершение TLS✅ Да❌ Нет
Многоарендный маршрутизация✅ Да❌ Нет
Пропускная способность❌ Ограниченный✅ Линейная скорость
Задержка❌ Выше✅ Ниже
Проверки состояния✅ http❌ TCP/ICMP
Интеграция DNS✅ Обязательно❌ Не нужно
Идеальный случай использованияОблачные технологииЧастный ИИ/Вычислительные кластеры

Как UniVirStor от Ambedded поддерживает LVS балансировщик нагрузки для Ceph RGW

UniVirStor предлагает нативную поддержку режима LVS TUN, включая:

  • Автоматическая настройка на основе Ansible
  • Высокая доступность с keepalived и conntrackd
  • Проверка состояния и метрики производительности
  • Оптимизированная маршрутизация для высокопроизводительных S3 шлюзов

Это делает UniVirStor идеальным для клиентов, создающих озера данных ИИ или кластеры ИИ на базе GPU, которые требуют как производительности, так и надежности от Ceph RGW.

Заключение

Выбор правильной архитектуры балансировщика нагрузки имеет решающее значение для создания надежного и масштабируемого S3 хранилища для ИИ.

  • Для частных кластеров ИИ используйте LVS TUN + conntrackd для максимизации производительности.
  • Для публичных сервисов или многопользовательского S3 используйте HAProxy на основе Ingress для лучшей гибкости и обработки TLS.

Ambedded's UniVirStor помогает вам эффективно развертывать оба сценария с настройкой уровня производства и поддержкой высокой доступности.


Балансировка нагрузки для хранения S3 для ИИ с Ceph RGW | Провайдер решений и услуг хранения Ceph. Полнофункциональное программное обеспечение для Ceph.

Основанная в Тайване в 2013 году, Ambedded Technology Co., LTD. является ведущим поставщиком решений для блочного, файлового и объектного хранения на основе программно-определяемого хранения Ceph. Мы специализируемся на предоставлении высокоэффективных, масштабируемых систем хранения для дата-центров, предприятий и исследовательских учреждений. В наш ассортимент входят устройства хранения на основе Ceph, интеграция серверов, оптимизация хранения и экономически эффективное развертывание Ceph с упрощенным управлением.

Ambedded предоставляет готовые решения по хранению данных на базе Ceph и полные программные решения Ceph, адаптированные для B2B организаций. Наша платформа хранения Ceph поддерживает унифицированное блочное, файловое (NFS, SMB, CephFS) и совместимое с S3 объектное хранилище, снижая общую стоимость владения (TCO) и одновременно улучшая надежность и масштабируемость. С интегрированной настройкой Ceph, интуитивно понятным веб-интерфейсом и инструментами автоматизации мы помогаем клиентам достигать высокопроизводительного хранения для ИИ, ВКС и облачных нагрузок.

С более чем 20-летним опытом в корпоративной ИТ и более чем десятилетним опытом развертывания хранилищ Ceph, Ambedded реализовала более 200 успешных проектов по всему миру. Мы предлагаем экспертные консультации, проектирование кластеров, поддержку развертывания и постоянное обслуживание. Наша приверженность профессиональной поддержке Ceph и бесшовной интеграции гарантирует, что клиенты получают максимальную отдачу от своей инфраструктуры хранения на базе Ceph — в масштабах, с высокой скоростью и в рамках бюджета.