Zálohování a archivace Veeam pro práci s Ceph

Proč a jak používat úložiště Ceph jako úložiště Veeam Backup & Replication

Proč a jak používat úložiště Ceph jako úložiště Veeam Backup & Replication

Zálohování a archivace Veeam pro práci s Ceph

Tato případová studie vysvětluje, jak používat úložné zařízení Mars 400 ceph jako zálohovací úložiště zálohování a replikace Veeam.
Ceph podporuje ukládání objektů, blokové úložiště a souborový systém POSIX v jednom clusteru. Podle požadavků na zálohování si zákazníci mohou vybrat různé protokoly úložiště pro podporu potřeb různých strategií zálohování úložiště.
 
V tomto článku používáme úložiště bloků Ceph (Ceph RBD) a souborový systém Ceph (Cephfs) jako úložiště záloh a porovnáváme trvání jejich úloh zálohování virtuálních počítačů z Hyper-V a VMWare.


Architektura řešení zálohování pomocí Veeam a Ceph

Architektura zálohování virtuálních strojů na VMWare a Hyper-V je podobná. Veeam používá data movers k přenosu dat ze zdrojových hostitelů do úložišť záloh. Přesuny dat běží na serveru proxy a serveru úložiště. Chcete-li použít Ceph jako backendové úložiště úložiště záloh, můžete připojit RBD nebo CephFS na fyzický server Linux nebo virtuální počítač jako server úložiště. 

Pokud jsou servery proxy a úložiště virtuálními počítači uvnitř clusteru hypervizorů, můžete získat výhodu vysokorychlostního přenosu dat bez sítě mezi diskem virtuálního počítače, serverem proxy a serverem úložiště. Nejlepší konfigurací velkého klastru hypervizorů je nasazení jednoho virtuálního počítače proxy serveru a jednoho virtuálního počítače serveru úložiště na každém hostiteli VMWare. Jinak můžete nasadit jeden záložní proxy virtuální počítač na každého hostitele VMWare a jednoho hostitele úložiště mimo hostitele, abyste odstranili zátěž z vašeho produkčního VMWare.

Zařízení Ambbedded Ceph lze použít jako úložiště pro Veeam Backup and Replication třemi způsoby. Bloková zařízení CephFS a RBD lze použít jako místní úložiště záloh. Úložiště objektů S3 lze použít jako kapacitní vrstvu pro vzdálené umístění.

Podrobnosti o tom, jak nastavit blokové zařízení Ceph RBD a souborový systém CephFS jako zálohovací úložiště společnosti Veeam pro zálohování virtuálních počítačů a souborů, naleznete v dokumentu white paper na konci této stránky.


Veeam proxy and repository servers are virtual machines inside the hypervisor cluster, with Mars 400 ceph storage to provide RBD and cephfs
a large hypervisor cluster is to deploy one proxy server VM and one repository server VM on each VMWare host, to have backup data to save into ceph RBD or cephfs

Testovací prostředí

ceph cluster

  • Tři Mars 400 s 3x monitory, 20 OSD a 1x MDS (metadatový server)
  • Každý démon Ceph běží na jednom dvoujádrovém mikroserveru Arm A72
  • Operační systém: CentOS 7
  • Ceph software: Nautilus 14.2.9 Arm64
  • Síť: 4x 10Gb síť na Mars 400 

Veeam Backup & Replication 10, verze: 10.0.1.4854

Zálohovací server Veeam

  • CPU: Intel Xeon E5-2630 2,3 GHz DUAL
  • DRAM: 64 GB
  • Síť: 2x 10Gb sfp+ propojení
  • Disk: 1TB pro systém, 256GB SATA3 SSD pro svazek
  • Windows Server 2019

 Proxy server Veeam

  • propojit se serverem Veeam Backup Server

 Server úložiště

  • Virtuální stroj

◇ CPU: 4 jádra 2,3 GHz

◇ DRAM: 8 GB

◇ Síť: most

◇ Disk: 50GB virtuální disk

◇ OS: CentOS 7.8.2003

  • Baremetal Server

◇ CPU: Intel Xeon X5650 2,67 GHz DUAL

◇ DRAM: 48 GB

◇ Síť: 2portové 10Gb sfp+ propojení

◇ Disk: 1 TB pro systém

◇ OS: CentOS 7.6.1810

Hostitel Hyper-V

◇   CPU: Intel Xeon E5-2630 2,3 GHz DUAL

◇   DRAM: 64 GB

◇   Síť: 2portové 10Gb sfp+ propojení

◇   Disk: 1 TB pro systém

◇   Windows Server 2019

Hostitel VMWare

◇   CPU: Intel Xeon E5-2630 2,3 GHz DUAL

◇   DRAM: 64 GB

◇   Síť: 2portové 10Gb sfp+ propojení

◇   Disk: 1 TB pro systém

◇   ESXi 6.5

Síť: 10GbE přepínač

Srovnání různých nastavení

Abychom porovnali výkon zálohování různých úložišť záloh, nastavili jsme testy s různými úložišti záloh a třemi zdroji záloh. 

Záložní zdroje, které používáme pro testy, jsou svazek založený na SATA SSD na serveru, Windows VM Hyper-V a CentOS 7 VM a Windows VM VMWare.

(1)Zálohujte svazek na jednotku SSD

Tabulka 1. Zálohujte svazek ze serveru se SATA SSD.

Velikost disku (zpracovaná data)237,9 GB
Data Čtená ze zdroje200,1 GB
Data přenesená do Ceph po deduplikaci a kompresi69,7 GB
Deduplikace1,3X
Komprese2,7X


Tabulka 2

Záložní
úložiště
Doba trvání
(s)
Zdroj
(%)
Proxy
(%)
Síť
(%)
Cíl
(%)
Rychlost zpracování (MB/s)
Průměrná rychlost
zápisu dat (MB/s)
Linux VM,
RBD-replika 3
64683338421554110
Linux VM,
replika CephFS 3
5219725315564137
Linux VM,
RBD, EC
64582348324554111
Linux VM,
CephFS, EC
5369726274564133
Linuxový server,
RBD, EC
5269721163561136

Poznámka: Průměrné rychlosti zápisu dat se vypočítávají jako podíl přenesených dat vydělený dobou trvání. Tyto rychlosti představují zátěž clusteru Ceph v těchto úlohách zálohování.

(2)Zálohujte virtuální počítač Windows 10 na Hyper-V na HDD

V tomto benchmarku zálohujeme instanci Hyper-V, která je uložena na pevném disku SATA. Rychlosti zpracování těchto úloh dosahují horní hranice šířky pásma HDD. Můžeme také zjistit, že úzké místo je na zdroji, protože jejich zátěže jsou zaneprázdněny během 99 % trvání úlohy. Cluster Ceph, cíl, pracovní zátěž zálohovacích úloh Veeam je nízká. Ceph cluster je zaneprázdněn pouze na 6 % až 1 % pracovní doby.

Ve srovnání s předchozím benchmarkem je rychlost zpracování zálohy VM mnohem nižší než zálohy SSD. Je to hlavně proto, že data VM jsou uložena na pevném disku. 

Tabulka 3.

Velikost disku (HDD)127 GB
Data čtená ze zdroje37,9 GB
Data přenesená do Ceph po
deduplikaci a kompresi
21,4 GB
Deduplikace3,3X
Komprese1,8X


Tabulka 4. Zálohování obrazu virtuálního stroje na pevný disk SATA3

Záložní
úložiště
Doba trvání
(s)
Zdroj
(%)
Proxy
(%)
Síť
(%)
Cíl
(%)
Rychlost zpracování (MB/s)
Průměrná rychlost
zápisu dat (MB/s)
Linux VM,
svazek RBD, EC
3639973614560
Linux VM,
svazek CephFS,
EC
3779972114258,1
Linux Server,
svazek RBD, EC
3759962214058,4

Poznámka: Průměrné rychlosti zápisu dat se vypočítávají jako podíl přenesených dat vydělený dobou trvání. Tyto rychlosti představují zátěž clusteru Ceph v těchto úlohách zálohování.

(3) Zálohujte virtuální stroje na ESXi na HDD

Tento test zálohuje virtuální počítače CentOS 7 a Windows 10 běžící na HDD hostitele VMWare ESXi 6.5 do úložiště podporovaného Ceph RBD s ochranou 4+2 kódem pro vymazání. 

Tabulka 5.

ZdrojCentOS VMWindows 10 VM
Velikost disku (HDD)40 GB32 GB
Data čtená ze zdroje1,8 GB12,9 GB
Data přenesená do Ceph po
deduplikaci a kompresi
966 MB7,7 GB
Deduplikace22,1X2,5X
Komprese1,9X1,7X


Tabulka 6.

Záložní
zdroj
Doba trvání
(s)
Zdroj
(%)
Proxy
(%)
Síť
(%)
Cíl
(%)
Rychlost zpracování (MB/s)
Průměrná rychlost
zápisu dat (MB/s)
CentOS 7122991050888
Windows 102449911519332

Poznámka: Průměrné rychlosti zápisu dat se vypočítávají jako podíl přenesených dat vydělený dobou trvání. Tyto rychlosti představují zátěž clusteru Ceph v těchto úlohách zálohování.

Závěry

Podle výsledků testu mají Ceph RBD a CephFS podobný výkon. To odpovídá našim zkušenostem ohledně benchmarku výkonnosti RBD a CephFS. Při porovnání charakteristik CephFS a RBD mají své výhody a nevýhody. Pokud potřebujete nasadit více serverů úložiště, musíte vytvořit obraz RBD pro každý server úložiště záloh, protože Ceph RBD můžete připojit pouze k jednomu hostiteli. Ve srovnání s CephFS je používání RBD jednodušší, protože nepotřebuje servery metadat. Při vytváření musíme přiřadit velikost kapacity RBD, takže když potřebujete více místa, musíte její kapacitu změnit.

Pokud používáte CephFS jako úložiště, musíte nasadit alespoň jeden metadatový server (MDS) v clusteru Ceph. Pro vysokou dostupnost potřebujeme také záložní metadatový server. Ve srovnání s Ceph RBD nemusíte souborovému systému přidělovat kvótu. S CephFS tedy můžete zacházet jako s neomezeným úložištěm.

V této ukázce případu použití naše testuje zálohování pouze jednoho virtuálního počítače v každé úloze zálohování. Podle výše uvedených testovacích zpráv víme, že průměrná rychlost zápisu dat souvisí s rychlostí zpracování a deduplikací dat a účinností komprese. Rychlejší zdrojový disk zkracuje dobu zálohování a vede k rychlejšímu zpracování. V závislosti na infrastruktuře uživatelů mohou uživatelé nasadit několik souběžných úloh pro současné zálohování různých objektů. Úložiště Ceph funguje velmi dobře při podpoře více souběžných úloh. 

Cluster 20x HDD OSD Ceph poháněný 3x Ambedded Mars 400 může nabídnout až 700 MB/s agregovanou propustnost zápisu do fondu 4+2 vymazávacích kódů. Nasazení více aktuálních úloh zálohování přináší výhodu snížení celkové doby zálohování. Maximální výkon clusteru Ceph je téměř lineárně úměrný celkovému počtu diskových jednotek v clusteru.

V tomto případě použití jsme netestovali použití objektového úložiště S3 jako úložiště záloh. Objektové úložiště S3 lze použít jako kapacitní vrstvu v úložišti záloh Veeam Scale-Out a cílovém archivním úložišti pro zálohování NAS. Můžete snadno nastavit bránu RADOS a snadno vytvořit uživatele úložiště objektů pomocí správce Ambedded UVS, webového GUI pro správu ceph.

Stažení
Použijte Ceph jako úložiště pro bílou knihu Veeam Backup & Replication
Použijte Ceph jako úložiště pro bílou knihu Veeam Backup & Replication

Jak nastavit blokové zařízení Ceph RBD a souborový systém CephFS jako úložiště záloh společnosti Veeam pro zálohování virtuálních počítačů...

Stažení
Související produkty
Úložné zařízení Ceph - Ceph Storage Appliance Mars 400 přední.
Úložné zařízení Ceph
Mars 400PRO

UniVirStor je softwarově definované úložné zařízení založené na ceph. Vestavěné úložné zařízení Ceph integruje vyladěný software Ceph,...

Podrobnosti
Enterprise Storage Appliance Mars 400SES SUSE - Zařízení Mars 400SES SUSE Enterprise Storage 6 (Nautilus).
Enterprise Storage Appliance Mars 400SES SUSE
Mars 400SES

Mars400SES SUSE Enterprise Storage Appliance se skládá z hardwaru mikroserveru ARM, 3letého předplatného SUSE Enterprise Storage a SUSE Linux Enterprise...

Podrobnosti

Ambedded – profesionální řešení úložiště Ceph na trhu.

Nachází se na Tchaj-wanu od roku 2013,Ambedded Technology Co., LTD.je poskytovatel úložných řešení Ceph, který nabízí softwarově definovaná úložná zařízení založená na ARM s 60% úsporou CapEX, o 70% nižší spotřebou energie a 100% škálovatelnými výhodami.

V oblasti softwarově definovaného návrhu a výroby úložišť má tým Ambedded rozsáhlé zkušenosti, aby pomohl zákazníkům zavést řešení ceph do všestranných průmyslových odvětví, jako jsou telekomunikace, lékařství, vojenství, okrajová datová centra a podniková úložiště vyžadující HA.

Společnost Ambedded nabízí zákazníkům řešení úložiště Ceph již od roku 2013, a to jak pokročilé technologie, tak 20 let zkušeností, společnost Ambedded zajišťuje, aby byly splněny požadavky každého zákazníka.