S3 Vyrovnávání zatížení S3 pro AI s Cephem RGW | Poskytovatel zařízení Ceph na klíč | Ambedded

Ingress-based a LVS TUN jsou dvě možnosti open-source load balancerů pro Ceph RGW. Ingress je ideální pro veřejné cloudové nebo multi-tenant prostředí, LVS TUN se hodí pro soukromé AI nebo HPC clustery, kde jsou vysoký průchod a nízká latence kritické. | Zařízení pro úložiště Ceph pro podniky

Ingress-based a LVS TUN jsou dvě možnosti open-source load balancerů pro Ceph RGW. Ingress je ideální pro veřejné cloudové nebo multi-tenant prostředí, LVS TUN se hodí pro soukromé AI nebo HPC clustery, kde jsou vysoký průchod a nízká latence kritické.

S3 Vyrovnávání zatížení S3 pro AI s Cephem RGW

AI pracovní zátěže vyžadují škálovatelné, vysoce propustné S3 úložiště pro tréninková data, modely a výstupy inference. Ceph RGW nabízí spolehlivé, S3-kompatibilní pozadí, ale výkon silně závisí na vyvažování zátěže. Pro soukromé AI clustery využívající NVMe poskytuje LVS TUN téměř linkovou šířku pásma a nízkou latenci. UniVirStor od Ambedded nativně podporuje LVS TUN s automatizovaným nastavením a návrhem HA, což ho činí ideálním pro výkonově kritická AI úložiště.


Následující klíčové body shrnují potřebu a odůvodnění pro každou designovou volbu.

Proč AI potřebuje škálovatelné a efektivní úložiště

Moderní AI pracovní zátěže vyžadují rychlý přístup k tréninkovým datům a nákladově efektivní dlouhodobé úložiště. S3 objektové úložiště, přístupné přes NVMe nebo HDD, poskytuje škálovatelné zázemí pro správu velkých datových sad, kontrolních bodů a modelů inference.

  • Vysokorychlostní NVMe pro tréninkové datové sady a nízkou latenci přístupu
  • Nákladově efektivní HDD pro dlouhodobé úložiště a archivy

Proč je S3 ideální pro pracovní zátěže AI

Úložiště kompatibilní se S3 je široce přijímáno v AI pipelinech díky svému RESTful API, škálovatelnosti a integraci s ML frameworky. Podporuje:

  • Úložiště datových sad a modelů
  • Kontrolování a verzování artefaktů
  • Poskytování modelů pro inference koncové body
  • Integrace s Tensorflow, Pytorch, MLFLOW

Proč je Ceph RGW silně vhodný pro AI S3 úložiště

Ceph RGW je open-source, S3-kompatibilní služba pro ukládání objektů, která nabízí vysokou dostupnost, silnou konzistenci a škálovatelnost na petabajtové úrovni. Hlavní funkce zahrnují:

  • Podporuje škálovatelnost napříč stovkami uzlů
  • Nabízí silnou konzistenci a kódování pro odstranění pro trvanlivost
  • Poskytuje integrovanou replikaci na více místech pro hybridní cloudové případy použití
  • Může být nasazen na nákladově efektivním běžném hardwaru

To dělá z Ceph RGW silný backend pro ukládání objektů zaměřených na AI jak na petabajtové úrovni, tak v prostředích kritických na výkon.

Potřeba vysoce dostupného vyvažování zátěže v Ceph RGW

Ceph RGW je bezstavový, což umožňuje horizontální škálování. Nicméně, pro zajištění:

  • Vysoké dostupnosti
  • Podpora přepnutí při selhání
  • Škálovatelnost výkonu

Potřebujete front-end vyvažovač zátěže, který může spolehlivě a efektivně rozdělovat příchozí S3 požadavky (GET, PUT, DELETE) mezi více instancemi RGW.

Bez správného vyvažování zátěže může být jediný uzel RGW nebo front-end server úzkým hrdlem nebo jediným bodem selhání.

Možnosti vyvažovače zátěže s otevřeným zdrojovým kódem pro Ceph RGW

Dvě hlavní architektury se běžně používají s open-source vyvažovači zátěže:

  1. Na základě Ingress (HAProxy + Keepalived + Multi-VIP + DNS RR)
    • Podpora vrstvy 7 (HTTP)
    • Podporuje ukončení TLS, směrování na základě SNI pro více nájemců
    • Vhodné pro veřejný cloud nebo nasazení s více nájemci
    • O něco vyšší latence a vyžaduje pečlivé ladění, aby se předešlo úzkým hrdlům.
    • Při větších nasazeních jsou vyžadovány více výkonné hardwarové servery, aby se zabránilo tomu, že se HAProxy stane úzkým hrdlem.
  2. LVS TUN + conntrackd + Vážené nejmenší připojení (WLC)
    • Tunneling IP-in-IP vrstvy 4
    • Vysoký průtok a nízké využití CPU
    • Obchází vyvažovač pro návratový provoz
    • Nejlepší pro soukromé, vysokorychlostní interní sítě

Proč je LVS TUN lepší pro NVMe-založené soukromé AI S3 úložiště

Pro interní AI tréninkové clustery založené na NVMe je výkon nejvyšší prioritou:

  • LVS TUN dosahuje téměř linkové šířky pásma
  • Nekončí TLS, čímž snižuje zátěž CPU
  • conntrackd zajišťuje bezproblémový přechod bez přerušení klienta
  • Žádná inspekce na aplikační vrstvě snižuje latenci

Takže LVS TUN je lepší volba než HAProxy pro vysokorychlostní interní AI objektové úložiště (např. tréninkové pipeline GPU clusteru).

Porovnání LVS Tun vs Ingress pro soukromé & amp; Veřejné cloudové aplikace AI

FunkceIngress (Haproxy)LVS TUN + conntrackd
Ukončení TLS✅ Ano❌ Ne
Víceuživatelské směrování✅ Ano❌ Ne
Průchodnost❌ Omezeno✅ Rychlost linky
Latence❌ Vyšší✅ Nižší
Kontroly zdraví✅ http❌ TCP/ICMP
Integrace DNS✅ Požadováno❌ Není potřeba
Ideální případ použitíVeřejný cloudSoukromá AI/HPC

Jak UniVirStor společnosti Ambedded podporuje LVS Load Balancer pro Ceph RGW

UniVirStor nabízí nativní podporu pro LVS TUN režim, včetně:

  • Automatizované nastavení založené na Ansible
  • Vysoká dostupnost s keepalived a conntrackd
  • Zdravotní kontrolní háčky a výkonnostní metriky
  • Optimalizované směrování pro S3 brány s vysokým průtokem

To činí UniVirStor ideálním pro zákazníky, kteří budují AI datová jezera nebo AI clustery založené na GPU, které vyžadují jak výkon, tak spolehlivost od Ceph RGW.

Závěr

Výběr správné architektury vyrovnávače zátěže je zásadní pro vybudování robustního, škálovatelného S3 úložiště pro AI.

  • Pro soukromé AI clustery použijte LVS TUN + conntrackd pro maximalizaci výkonu.
  • Pro veřejné služby nebo multi-tenant S3 použijte HAProxy založený na Ingress pro lepší flexibilitu a zpracování TLS.

Ambedded's UniVirStor vám pomůže efektivně nasadit oba scénáře s laděním na úrovni produkce a podporou vysoké dostupnosti.


S3 Vyrovnávání zatížení S3 pro AI s Cephem RGW | Řešení úložiště Ceph; zařízení a software Ceph|Ambedded

Založena na Tchaj-wanu v roce 2013, Ambedded Technology Co., LTD. je předním poskytovatelem blokových, souborových a objektových úložných řešení založených na softwarově definovaném úložišti Ceph. Specializujeme se na dodávání vysoce efektivních, škálovatelných úložných systémů pro datová centra, podniky a výzkumné instituce. Naše nabídky zahrnují úložná zařízení založená na Ceph, integraci serverů, optimalizaci úložiště a nákladově efektivní nasazení Ceph s zjednodušenou správou.

Ambedded poskytuje kompletní úložné zařízení Ceph a plně integrovaná softwarová řešení Ceph přizpůsobená pro B2B organizace. Naše platforma pro ukládání dat Ceph podporuje jednotné blokové, souborové (NFS, SMB, CephFS) a objektové úložiště kompatibilní se S3, čímž snižuje celkové náklady na vlastnictví (TCO) a zároveň zlepšuje spolehlivost a škálovatelnost. S integrovaným laděním Ceph, intuitivním webovým rozhraním a automatizačními nástroji pomáháme zákazníkům dosáhnout vysokovýkonného úložiště pro AI, HPC a cloudové pracovní zátěže.

S více než 20 lety zkušeností v podnikové IT a více než desetiletou praxí v nasazení úložiště Ceph, Ambedded realizoval více než 200 úspěšných projektů po celém světě. Nabízíme odborné poradenství, návrh clusterů, podporu při nasazení a průběžnou údržbu. Naše závazek k profesionální podpoře Ceph a bezproblémové integraci zajišťuje, že zákazníci získají maximum ze své infrastruktury úložiště založené na Ceph — ve velkém měřítku, s rychlostí a v rámci rozpočtu.