Copia de seguridad y archivo de Veeam para trabajar con Ceph

Por qué y cómo utilizar Ceph Storage Appliance como repositorios de Veeam Backup & Replication

Por qué y cómo utilizar Ceph Storage Appliance como repositorios de Veeam Backup & Replication

Copia de seguridad y archivo de Veeam para trabajar con Ceph

Este estudio de caso explica cómo utilizar el dispositivo de almacenamiento ceph Mars 400 como repositorios de copia de seguridad y replicación de Veeam.
Ceph admite almacenamiento de objetos, almacenamiento de bloques y el sistema de archivos POSIX, todo en un solo clúster. De acuerdo con los requisitos de respaldo, los clientes pueden seleccionar diferentes protocolos de almacenamiento para satisfacer las necesidades de varias estrategias de respaldo de almacenamiento.
 
En este artículo, usamos el almacenamiento en bloque Ceph (Ceph RBD) y el sistema de archivos Ceph (Cephfs) como repositorios de copia de seguridad y comparamos la duración de los trabajos de copia de seguridad de las máquinas virtuales de Hyper-V y VMWare.


Arquitectura de la solución de copia de seguridad mediante el uso de Veeam y Ceph

La arquitectura de copia de seguridad de máquinas virtuales en VMWare e Hyper-V es similar. Veeam utiliza transportadores de datos para transferir datos desde hosts de origen a repositorios de respaldo. Los transportadores de datos se ejecutan en el servidor proxy y el servidor de repositorio. Para usar Ceph como almacenamiento de back-end de un repositorio de copia de seguridad, puede montar RBD o CephFS en un servidor físico Linux o una máquina virtual como servidor de repositorio. 

Si los servidores proxy y de repositorio son máquinas virtuales dentro del clúster de hipervisor, puede beneficiarse del transporte de datos de alta velocidad sin red entre el disco de la VM, el servidor proxy y el servidor de repositorio. La mejor configuración de un clúster de hipervisor grande es implementar una VM de servidor proxy y una VM de servidor de repositorio en cada host VMWare. De lo contrario, puede implementar una VM de proxy de respaldo en cada host de VMWare y un host de repositorio fuera del host para eliminar la carga de trabajo de su VMWare de producción.

Hay tres formas de usar el dispositivo Ambedded Ceph como repositorios para Veeam Backup and Replication. Los dispositivos de bloque CephFS y RBD se pueden utilizar como repositorio de copia de seguridad local. El almacenamiento de objetos de S3 se puede utilizar como nivel de capacidad para una ubicación remota.

Para saber cómo configurar el dispositivo de bloques Ceph RBD y el sistema de archivos CephFS como el repositorio de respaldo de Veeam para respaldar máquinas virtuales y archivos, puede encontrar los detalles en el documento técnico al final de esta página.


Veeam proxy and repository servers are virtual machines inside the hypervisor cluster, with Mars 400 ceph storage to provide RBD and cephfs
a large hypervisor cluster is to deploy one proxy server VM and one repository server VM on each VMWare host, to have backup data to save into ceph RBD or cephfs

Entorno de prueba

Clúster de Ceph

  • Tres Mars 400 con 3 monitores, 20 OSD y 1 MDS (servidor de metadatos)
  • Cada demonio de Ceph se ejecuta en un microservidor Arm A72 de doble núcleo
  • Sistema Operativo: CentOS 7
  • Software Ceph: Nautilus 14.2.9 Arm64
  • Red: 4 redes de 10 Gb por Mars 400 

Veeam Backup & Replication 10, Versión: 10.0.1.4854

Servidor de copia de seguridad de Veeam

  • CPU: Intel Xeon E5-2630 2,3 GHz DOBLE
  • DRAM: 64GB
  • Red: 2 conexiones sfp+ de 10 Gb
  • Disco: 1 TB para sistema, SSD SATA3 de 256 GB para volumen
  • Servidor Windows 2019

 Servidor proxy de Veeam

  • ubicar con Veeam Backup Server

 Servidor de repositorio

  • Máquina virtual

◇ CPU: 4 núcleos 2,3 GHz

◇ DRAM: 8GB

◇ Red: puente

◇ Disco: disco virtual de 50GB

◇ SO: CentOS 7.8.2003

  • Servidor básico

◇ CPU: Intel Xeon X5650 2,67 GHz DOBLE

◇ DRAM: 48GB

◇ Red: enlace sfp+ de 10 Gb de 2 puertos

◇ Disco: 1 TB para el sistema

◇ SO: CentOS 7.6.1810

Anfitrión de Hyper-V

◇   CPU: Intel Xeon E5-2630 2,3 GHz DOBLE

◇   DRAM: 64GB

◇   Red: enlace sfp+ de 10 Gb de 2 puertos

◇   Disco: 1 TB para el sistema

◇   Servidor Windows 2019

Host de VMware

◇   CPU: Intel Xeon E5-2630 2,3 GHz DOBLE

◇   DRAM: 64GB

◇   Red: enlace sfp+ de 10 Gb de 2 puertos

◇   Disco: 1 TB para el sistema

◇   ESXi 6.5

Red: conmutador de 10 GbE

Punto de referencia en varias configuraciones

Para comparar el rendimiento de respaldo de varios repositorios de respaldo, configuramos pruebas con diferentes repositorios de respaldo y tres fuentes de respaldo. 

Las fuentes de respaldo que usamos para las pruebas son un volumen basado en SSD SATA en un servidor, una VM de Windows de Hyper-V y una VM de CentOS 7 y una VM de Windows de VMWare.

(1) Copia de seguridad de un volumen en una unidad SSD

Tabla 1. Copia de seguridad de un volumen desde un servidor con un SSD SATA.

Tamaño del disco (datos procesados) 237,9 GB
Lectura de datos de la fuente 200,1 GB
Datos transferidos a Ceph después de la deduplicación y compresión 69,7 GB
Deduplicación 1.3X
Compresión 2.7X


Tabla 2.

Repositorio de respaldo
Duración
(seg)
Fuente
(%)
Apoderado
(%)
Red
(%)
Objetivo
(%)
Tasa de procesamiento (MB/s)
Velocidad promedio
de escritura de datos
(MB/s)
Máquina virtual Linux,
RBD-réplica 3
646 83 33 84 21 554 110
Máquina virtual Linux,
CephFS-réplica 3
521 97 25 31 5 564 137
Máquina virtual Linux,
RBD, EC
645 82 34 83 24 554 111
Máquina virtual Linux,
CephFS, CE
536 97 26 27 4 564 133
Servidor Linux,
RBD, CE
526 97 21 dieciséis 3 561 136

Nota: Las tasas promedio de escritura de datos se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster de Ceph en estos trabajos de copia de seguridad.

(2) Copia de seguridad de una máquina virtual con Windows 10 en Hyper-V en HDD

En este punto de referencia, hacemos una copia de seguridad de una instancia de Hyper-V que está almacenada en un disco duro SATA. Las velocidades de procesamiento de estos trabajos alcanzan el límite superior del ancho de banda del HDD. También podemos encontrar que el cuello de botella está en la fuente porque sus cargas están ocupadas durante el 99% de la duración del trabajo. El clúster de Ceph, el destino, la carga de trabajo de los trabajos de copia de seguridad de Veeam es ligero. El clúster de Ceph solo está ocupado entre el 6 % y el 1 % del tiempo de trabajo.

En comparación con el punto de referencia anterior, la tasa de procesamiento de la copia de seguridad de VM es mucho más baja que la de la copia de seguridad de SSD. Esto se debe principalmente a que los datos de la máquina virtual se almacenan en un disco duro. 

Tabla 3.

Tamaño del disco (HDD) 127GB
Lectura de datos de la fuente 37,9 GB
Datos transferidos a Ceph después de la
deduplicación y compresión
21,4 GB
Deduplicación 3.3X
Compresión 1.8X


Tabla 4. Copia de seguridad de una imagen de máquina virtual en SATA3 HDD

Repositorio de respaldo
Duración
(seg)
Fuente
(%)
Apoderado
(%)
Red
(%)
Objetivo
(%)
Tasa de procesamiento (MB/s)
Velocidad promedio
de escritura de datos
(MB/s)
Máquina virtual Linux,
volumen RBD, EC
363 99 7 3 6 145 60
Máquina virtual Linux,
volumen CephFS,
EC
377 99 7 2 1 142 58.1
Servidor Linux,
volumen RBD, CE
375 99 6 2 2 140 58.4

Nota: Las tasas promedio de escritura de datos se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster de Ceph en estos trabajos de copia de seguridad.

(3) Copia de seguridad de máquinas virtuales en ESXi en HDD

Esta prueba realiza una copia de seguridad de las máquinas virtuales CentOS 7 y Windows 10 que se ejecutan en un HDD del host VMWare ESXi 6.5 en un repositorio respaldado por un Ceph RBD con protección de código de borrado 4+2. 

Tabla 5.

Fuente Máquina virtual CentOS Máquina virtual de Windows 10
Tamaño del disco (HDD) 40GB 32 GB
Lectura de datos de la fuente 1,8 GB 12,9 GB
Datos transferidos a Ceph después de la
deduplicación y compresión
966MB 7,7 GB
Deduplicación 22.1X 2.5X
Compresión 1.9X 1.7X


Tabla 6.

Fuente de copia de seguridad
Duración
(seg)
Fuente
(%)
Apoderado
(%)
Red
(%)
Objetivo
(%)
Tasa de procesamiento (MB/s)
Velocidad promedio
de escritura de datos
(MB/s)
CentOS 7 122 99 10 5 0 88 8
ventanas 10 244 99 11 5 1 93 32

Nota: Las tasas promedio de escritura de datos se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster de Ceph en estos trabajos de copia de seguridad.

Conclusiones

Según los resultados de las pruebas, Ceph RBD y CephFS tienen un rendimiento similar. Esto cumple con nuestra experiencia con respecto al punto de referencia del rendimiento de RBD y CephFS. Comparando las características de CephFS y RBD, tienen sus ventajas y desventajas. Si necesita implementar varios servidores de repositorio, debe crear una imagen RBD para cada servidor de repositorio de copia de seguridad, ya que solo puede montar Ceph RBD en un host. Comparado con CephFS, usar RBD es más simple ya que no necesita los servidores de metadatos. Tenemos que asignar el tamaño de capacidad de RBD cuando se crea, por lo que debe cambiar el tamaño de su capacidad cuando necesite más espacio.

Si usa CephFS como repositorio, debe implementar al menos un servidor de metadatos (MDS) en el clúster de Ceph. También necesitamos un servidor de metadatos en espera para una alta disponibilidad. En comparación con Ceph RBD, no es necesario asignar una cuota al sistema de archivos. Por lo tanto, puede tratar el CephFS como un grupo de almacenamiento ilimitado.

En esta demostración de caso de uso, nuestras pruebas respaldan solo una máquina virtual en cada trabajo de respaldo. De acuerdo con los informes de prueba anteriores, sabemos que la tasa promedio de escritura de datos está relacionada con la tasa de procesamiento y la eficiencia de compresión y deduplicación de datos. Un disco de origen más rápido reduce la duración del trabajo de respaldo y da como resultado una tasa de procesamiento más rápida. Dependiendo de la infraestructura de los usuarios, los usuarios pueden implementar varios trabajos simultáneos para respaldar diferentes objetos simultáneamente. El almacenamiento de Ceph funciona muy bien al admitir varios trabajos simultáneos. 

Un clúster Ceph OSD HDD 20x con tecnología 3x Ambedded Mars 400 puede ofrecer un rendimiento de escritura agregado de hasta 700 MB/s al conjunto de códigos de borrado 4+2. La implementación de varios trabajos de copia de seguridad actuales tiene la ventaja de reducir la duración total de la copia de seguridad. El rendimiento máximo de un clúster de Ceph es casi linealmente proporcional al número total de unidades de disco en el clúster.

En este caso de uso, no probamos el uso del almacenamiento de objetos S3 como repositorio de respaldo. El almacenamiento de objetos de S3 se puede utilizar como nivel de capacidad en el repositorio de respaldo Veeam Scale-Out y en el repositorio de archivos de destino para el respaldo NAS. Puede configurar fácilmente una puerta de enlace RADOS y crear usuarios de almacenamiento de objetos fácilmente utilizando el administrador de UVS incorporado, la GUI web de administración de ceph.

Descargar
Use Ceph como repositorio para el informe técnico de Veeam Backup & Replication
Use Ceph como repositorio para el informe técnico de Veeam Backup & Replication

Cómo configurar el dispositivo de bloques Ceph RBD y el sistema de archivos CephFS como repositorio de respaldo de Veeam para respaldar máquinas virtuales...

Descargar
Productos relacionados
Dispositivo de almacenamiento Ceph - Dispositivo de almacenamiento Ceph Mars 400 frontal.
Dispositivo de almacenamiento Ceph
Marte 400PRO

UniVirStor es un dispositivo de almacenamiento definido por software basado en ceph. El dispositivo de almacenamiento Ceph incorporado integra el software...

Detalles
Dispositivo de almacenamiento empresarial Mars 400SES SUSE - Dispositivo Mars 400SES SUSE Enterprise Storage 6 (Nautilus).
Dispositivo de almacenamiento empresarial Mars 400SES SUSE
Marte 400SES

Mars400SES SUSE Enterprise Storage Appliance consiste en hardware de microservidor ARM, 3 años de suscripción a SUSE Enterprise Storage y SUSE Linux...

Detalles

Ambedded: una solución de almacenamiento Ceph profesional para el mercado.

Ubicado en Taiwán desde 2013,Ambedded Technology Co., LTD.es un proveedor de soluciones de almacenamiento de Ceph que ofrece dispositivos de almacenamiento definidos por software basados ​​en ARM con un 60 % de ahorro de CapEX, un 70 % menos de consumo de energía y un 100 % de ventajas de escalabilidad horizontal.

Para el diseño y la fabricación de almacenamiento definido por software, el equipo de Ambedded tiene una amplia experiencia para ayudar a los clientes a adoptar la solución ceph en industrias versátiles, como telecomunicaciones, médica, militar, centro de datos perimetral y almacenamiento empresarial que requiere alta disponibilidad.

Ambedded ha estado ofreciendo a los clientes soluciones de almacenamiento Ceph desde 2013, tecnología avanzada y 20 años de experiencia, Ambedded garantiza que se cumplan las demandas de cada cliente.