Cân bằng tải lưu trữ S3 cho AI với Ceph RGW | Nhà cung cấp thiết bị Ceph trọn gói | Ambedded

Ingress-based và LVS TUN là hai tùy chọn bộ cân bằng tải mã nguồn mở cho Ceph RGW. Ingress lý tưởng cho môi trường đám mây công cộng hoặc đa người dùng, LVS TUN phù hợp với các cụm AI hoặc HPC riêng tư nơi thông lượng cao và độ trễ thấp là rất quan trọng. | Thiết bị lưu trữ Ceph cho doanh nghiệp

Ingress-based và LVS TUN là hai tùy chọn bộ cân bằng tải mã nguồn mở cho Ceph RGW. Ingress lý tưởng cho môi trường đám mây công cộng hoặc đa người dùng, LVS TUN phù hợp với các cụm AI hoặc HPC riêng tư nơi thông lượng cao và độ trễ thấp là rất quan trọng.

Cân bằng tải lưu trữ S3 cho AI với Ceph RGW

Các khối lượng công việc AI yêu cầu lưu trữ S3 có khả năng mở rộng và thông lượng cao cho dữ liệu đào tạo, mô hình và đầu ra suy diễn. Ceph RGW cung cấp một backend đáng tin cậy, tương thích với S3, nhưng hiệu suất phụ thuộc nhiều vào việc cân bằng tải. Đối với các cụm AI riêng tư sử dụng NVMe, LVS TUN cung cấp băng thông gần như theo tỷ lệ đường truyền và độ trễ thấp. UniVirStor của Ambedded hỗ trợ LVS TUN một cách tự nhiên với thiết lập tự động và thiết kế HA, làm cho nó trở thành lý tưởng cho các môi trường lưu trữ AI quan trọng về hiệu suất.


Các điểm chính sau đây tóm tắt nhu cầu và lý do cho mỗi lựa chọn thiết kế.

Tại sao AI cần lưu trữ có thể mở rộng và hiệu quả

Các khối lượng công việc AI hiện đại yêu cầu cả việc truy cập nhanh vào dữ liệu đào tạo và lưu trữ lâu dài tiết kiệm chi phí. Lưu trữ đối tượng S3, được truy cập qua NVMe hoặc HDD, cung cấp một backend có thể mở rộng để quản lý các tập dữ liệu lớn, điểm kiểm tra và mô hình suy diễn.

  • NVMe tốc độ cao cho các tập dữ liệu đào tạo và truy cập độ trễ thấp
  • HDD tiết kiệm chi phí cho lưu trữ lâu dài và lưu trữ hồ sơ

Tại sao S3 là lý tưởng cho khối lượng công việc AI

Lưu trữ tương thích S3 được áp dụng rộng rãi trong các quy trình AI nhờ vào API RESTful, khả năng mở rộng và tích hợp với các khung ML. Nó hỗ trợ:

  • Lưu trữ tập dữ liệu và mô hình
  • Điểm kiểm tra và phiên bản hóa đối tượng
  • Cung cấp mô hình cho các điểm suy diễn
  • Tích hợp với tenorflow, pytorch, mlflow

Tại sao Ceph RGW là sự lựa chọn mạnh mẽ cho lưu trữ AI S3

Ceph RGW là một dịch vụ lưu trữ đối tượng mã nguồn mở, tương thích với S3, cung cấp khả năng sẵn sàng cao, tính nhất quán mạnh mẽ và khả năng mở rộng quy mô petabyte. Các tính năng chính bao gồm:

  • Hỗ trợ khả năng mở rộng trên hàng trăm nút
  • Cung cấp tính nhất quán mạnh mẽ và mã hóa xóa để đảm bảo độ bền
  • Cung cấp sao chép đa địa điểm tích hợp cho các trường hợp sử dụng đám mây lai
  • Có thể triển khai trên phần cứng thương mại tiết kiệm chi phí

Điều này làm cho Ceph RGW trở thành một backend mạnh mẽ cho lưu trữ đối tượng tập trung vào AI ở cả quy mô petabyte và môi trường yêu cầu hiệu suất cao.

Nhu cầu về cân bằng tải có độ sẵn sàng cao trong Ceph RGW

Ceph RGW là không trạng thái, cho phép mở rộng theo chiều ngang. Tuy nhiên, để cung cấp:

  • Khả năng sẵn sàng cao
  • Hỗ trợ chuyển đổi dự phòng
  • Khả năng mở rộng hiệu suất

Bạn cần một bộ cân bằng tải phía trước có thể phân phối đáng tin cậy và hiệu quả các yêu cầu S3 đến (GET, PUT, DELETE) trên nhiều phiên bản RGW.

Nếu không có cân bằng tải hợp lý, một nút RGW hoặc máy chủ phía trước có thể trở thành nút thắt cổ chai hoặc điểm thất bại duy nhất.

Các tùy chọn cân bằng tải mã nguồn mở cho Ceph RGW

Hai kiến trúc chính thường được sử dụng với các bộ cân bằng tải mã nguồn mở:

  1. Dựa trên Ingress (HAProxy + Keepalived + Multi-VIP + DNS RR)
    • Hỗ trợ lớp 7 (HTTP)
    • Hỗ trợ kết thúc TLS, định tuyến đa người dùng dựa trên SNI
    • Phù hợp cho các triển khai đám mây công cộng hoặc đa người dùng
    • Độ trễ hơi cao hơn và yêu cầu điều chỉnh cẩn thận để tránh nút thắt cổ chai.
    • Ở quy mô triển khai lớn hơn, cần nhiều máy chủ phần cứng hiệu suất cao để ngăn HAProxy trở thành nút thắt cổ chai.
  2. LVS TUN + conntrackd + Kết nối ít nhất có trọng số (WLC)
    • Tunneling IP-in-IP lớp 4
    • Băng thông cao và mức sử dụng CPU thấp
    • Bỏ qua bộ cân bằng cho lưu lượng trả về
    • Tốt nhất cho mạng nội bộ tốc độ cao, riêng tư

Tại sao LVS TUN tốt hơn cho lưu trữ AI S3 riêng tư dựa trên NVMe

Đối với các cụm đào tạo AI dựa trên NVMe nội bộ, hiệu suất là ưu tiên hàng đầu:

  • LVS TUN đạt được băng thông gần như theo tỷ lệ đường truyền
  • Không kết thúc TLS, giảm tải CPU
  • conntrackd đảm bảo chuyển đổi liền mạch mà không làm gián đoạn khách hàng
  • Không kiểm tra lớp ứng dụng giảm độ trễ

Do đó, LVS TUN phù hợp hơn HAProxy cho lưu trữ đối tượng AI nội bộ tốc độ cao (ví dụ: quy trình đào tạo cụm GPU).

So sánh LVS TUN và Ingress cho các ứng dụng AI trên đám mây riêng và công cộng

Tính năngIngress (HaProxy)LVS Tun Conntrackd
Kết thúc TLS✅ Có❌ Không
Định tuyến đa người dùng✅ Có❌ Không
Băng thông❌ Hạn chế✅ Tốc độ dòng
Độ trễ❌ Cao hơn✅ Thấp hơn
Kiểm tra sức khỏe✅ HTTP❌ TCP/ICMP
Tích hợp DNS✅ Cần thiết❌ Không cần thiết
Trường hợp sử dụng lý tưởngĐám mây công cộngAI/HPC riêng tư

Cách mà Ambedded's UniVirStor hỗ trợ LVS Load Balancer cho Ceph RGW

UniVirStor cung cấp hỗ trợ gốc cho chế độ LVS TUN, bao gồm:

  • Thiết lập tự động dựa trên Ansible
  • Tính khả dụng cao với keepalived và conntrackd
  • Các móc kiểm tra sức khỏe và chỉ số hiệu suất
  • Định tuyến tối ưu cho các cổng S3 có băng thông cao

Điều này làm cho UniVirStor trở nên lý tưởng cho khách hàng xây dựng hồ dữ liệu AI hoặc cụm AI dựa trên GPU yêu cầu cả hiệu suất và độ tin cậy từ Ceph RGW.

Kết luận

Chọn kiến trúc bộ cân bằng tải phù hợp là điều cần thiết để xây dựng một backend lưu trữ S3 mạnh mẽ, có thể mở rộng cho AI.

  • Đối với các cụm AI riêng tư, sử dụng LVS TUN + conntrackd để tối đa hóa hiệu suất.
  • Đối với các dịch vụ công cộng hoặc S3 đa người dùng, hãy sử dụng HAProxy dựa trên Ingress để có tính linh hoạt và xử lý TLS tốt hơn.

UniVirStor của Ambedded giúp bạn triển khai cả hai kịch bản một cách hiệu quả với tinh chỉnh cấp sản xuất và hỗ trợ tính sẵn sàng cao.


Cân bằng tải lưu trữ S3 cho AI với Ceph RGW | Giải pháp Lưu trữ Ceph; Thiết bị & Phần mềm Ceph|Ambedded

Được thành lập tại Đài Loan vào năm 2013, Ambedded Technology Co., LTD. là nhà cung cấp hàng đầu về các giải pháp lưu trữ khối, tệp và đối tượng dựa trên lưu trữ định nghĩa phần mềm Ceph. Chúng tôi chuyên cung cấp các hệ thống lưu trữ hiệu quả cao, có thể mở rộng cho các trung tâm dữ liệu, doanh nghiệp và các tổ chức nghiên cứu. Các sản phẩm của chúng tôi bao gồm các thiết bị lưu trữ dựa trên Ceph, tích hợp máy chủ, tối ưu hóa lưu trữ và triển khai Ceph tiết kiệm chi phí với quản lý đơn giản.

Ambedded cung cấp các thiết bị lưu trữ Ceph trọn gói và các giải pháp phần mềm Ceph toàn diện được thiết kế riêng cho các tổ chức B2B. Nền tảng lưu trữ Ceph của chúng tôi hỗ trợ lưu trữ khối, tệp (NFS, SMB, CephFS) và lưu trữ đối tượng tương thích S3, giảm tổng chi phí sở hữu (TCO) trong khi cải thiện độ tin cậy và khả năng mở rộng. Với việc tinh chỉnh Ceph tích hợp, giao diện web trực quan và các công cụ tự động hóa, chúng tôi giúp khách hàng đạt được lưu trữ hiệu suất cao cho AI, HPC và các khối lượng công việc đám mây.

Với hơn 20 năm kinh nghiệm trong lĩnh vực CNTT doanh nghiệp và hơn một thập kỷ triển khai lưu trữ Ceph, Ambedded đã thực hiện hơn 200 dự án thành công trên toàn cầu. Chúng tôi cung cấp tư vấn chuyên nghiệp, thiết kế cụm, hỗ trợ triển khai và bảo trì liên tục. Cam kết của chúng tôi đối với hỗ trợ Ceph chuyên nghiệp và tích hợp liền mạch đảm bảo rằng khách hàng nhận được nhiều nhất từ hạ tầng lưu trữ dựa trên Ceph của họ — với quy mô, tốc độ và trong ngân sách.