Copia de seguridad y archivo de Veeam para trabajar con Ceph / El dispositivo de almacenamiento Ceph integra una pila de software optimizada y un servidor Arm diseñado específicamente que ofrece un rendimiento, confiabilidad, interfaz de usuario web y reducción del TCO sobresalientes.

Este caso de estudio explica cómo utilizar el dispositivo de almacenamiento Mars 400 ceph como repositorios de respaldo de la copia de seguridad y la replicación de Veeam. Ceph admite el almacenamiento de objetos, el almacenamiento en bloques y el sistema de archivos POSIX, todo en un solo clúster. De acuerdo con los requisitos de respaldo, los clientes pueden seleccionar diferentes protocolos de almacenamiento para satisfacer las necesidades de diversas estrategias de respaldo de almacenamiento. En este artículo, utilizamos el almacenamiento en bloque Ceph (Ceph RBD) y el sistema de archivos Ceph (Cephfs) como repositorios de respaldo y comparamos la duración de los trabajos de respaldo de las máquinas virtuales de Hyper-V y VMWare. Con más de 20 años de experiencia en almacenamiento definido por software, integrado con el talentoso equipo experimentado en el diseño y fabricación de dispositivos de almacenamiento definidos por software basados ​​en ARM.

service@ambedded.com.tw

Horario de atención: de 9 a. M. A 6 p. M.

Por qué y cómo utilizar Ceph Storage Appliance como repositorios de Veeam Backup & Replication

Copia de seguridad y archivo de Veeam para trabajar con Ceph

Este caso de estudio explica cómo utilizar el dispositivo de almacenamiento Mars 400 ceph como repositorios de respaldo de la copia de seguridad y la replicación de Veeam.
Ceph admite el almacenamiento de objetos, el almacenamiento en bloques y el sistema de archivos POSIX, todo en un solo clúster. De acuerdo con los requisitos de respaldo, los clientes pueden seleccionar diferentes protocolos de almacenamiento para satisfacer las necesidades de diversas estrategias de respaldo de almacenamiento.
 
En este artículo, utilizamos el almacenamiento en bloque Ceph (Ceph RBD) y el sistema de archivos Ceph (Cephfs) como repositorios de respaldo y comparamos la duración de los trabajos de respaldo de las máquinas virtuales de Hyper-V y VMWare.


Arquitectura de la solución de copia de seguridad mediante el uso de Veeam y Ceph

La arquitectura de la copia de seguridad de las máquinas virtuales en VMWare e Hyper-V es similar. Veeam utiliza transportadores de datos para transferir datos desde los hosts de origen a los repositorios de respaldo. Los transportadores de datos se ejecutan en el servidor proxy y en el servidor de depósito. Para usar Ceph como almacenamiento de backend de un repositorio de respaldo, puede montar RBD o CephFS en un servidor físico Linux o una máquina virtual como servidor de repositorio. 

Si los servidores proxy y de repositorio son máquinas virtuales dentro del clúster de hipervisor, puede obtener el beneficio del transporte de datos de alta velocidad sin red entre el disco de la máquina virtual, el servidor proxy y el servidor de repositorio. La mejor configuración de un clúster de hipervisor grande es implementar una VM de servidor proxy y una VM de servidor de repositorio en cada host VMWare. De lo contrario, puede implementar una máquina virtual proxy de respaldo en cada host de VMWare y un host de repositorio fuera del host para eliminar la carga de trabajo de su VMWare de producción.

Hay tres formas de utilizar el dispositivo Ambedded Ceph como repositorios para Veeam Backup and Replication. Los dispositivos de bloque CephFS y RBD se pueden usar como repositorio de respaldo local. El almacenamiento de objetos de S3 se puede utilizar como nivel de capacidad para una ubicación remota.

Para saber cómo configurar el dispositivo de bloque Ceph RBD y el sistema de archivos CephFS como el repositorio de respaldo de Veeam para respaldar archivos y máquinas virtuales, puede encontrar los detalles en el documento técnico al final de esta página.


Veeam proxy and repository servers are virtual machines inside the hypervisor cluster, with Mars 400 ceph storage to provide RBD and cephfs
a large hypervisor cluster is to deploy one proxy server VM and one repository server VM on each VMWare host, to have backup data to save into ceph RBD or cephfs

Entorno de prueba

Clúster Ceph -

  • Tres Mars 400 con 3 monitores, 20 OSD y 1 MDS (servidor de metadatos)
  • Cada daemon de Ceph se ejecuta en un microservidor Arm A72 de doble núcleo
  • Sistema operativo: CentOS 7
  • Software Ceph: Nautilus 14.2.9 Arm64
  • Red: 4 redes de 10 Gb por Mars 400 

Veeam Backup & Replication 10, versión: 10.0.1.4854

Servidor de copia de seguridad de Veeam

  • CPU: Intel Xeon E5-2630 2.3GHz DUAL
  • DRAM: 64 GB
  • Red: 2x 10Gb sfp + enlace
  • Disco: 1 TB para el sistema, SSD SATA3 de 256 GB para el volumen
  • Windows Server 2019

 Servidor proxy de Veeam

  • Colocar con Veeam Backup Server

 Servidor de repositorio

  • Máquina virtual

◇ CPU: 4 núcleos a 2,3 GHz

◇ DRAM: 8GB

◇ Red: puente

◇ Disco: disco virtual de 50GB

◇ SO: CentOS 7.8.2003

  • Servidor Baremetal

◇ CPU: Intel Xeon X5650 2.67GHz DUAL

◇ DRAM: 48GB

◇ Red: sfp de 2 puertos de 10 Gb + enlace

◇ Disco: 1TB para el sistema

◇ SO: CentOS 7.6.1810

Host de Hyper-V

◇   CPU: Intel Xeon E5-2630 2.3GHz DUAL

◇   DRAM: 64 GB

◇   Red: sfp de 2 puertos de 10 Gb + enlace

◇   Disco: 1TB para el sistema

◇   Windows Server 2019

Host VMWare

◇   CPU: Intel Xeon E5-2630 2.3GHz DUAL

◇   DRAM: 64 GB

◇   Red: sfp de 2 puertos de 10 Gb + enlace

◇   Disco: 1TB para el sistema

◇   ESXi 6.5

Red: conmutador de 10 GbE

Benchmark en varias configuraciones

Para comparar el rendimiento de la copia de seguridad de varios repositorios de copia de seguridad, configuramos pruebas con diferentes repositorios de copia de seguridad y tres fuentes de copia de seguridad. 

Las fuentes de respaldo que usamos para las pruebas son un volumen basado en SSD SATA en un servidor, una VM de Windows de Hyper-V y una VM de CentOS 7 y una VM de Windows de VMWare.

(1) Copia de seguridad de un volumen en una unidad SSD

Tabla 1. Copia de seguridad de un volumen desde un servidor con un SSD SATA.

Tamaño del disco (datos procesados) 237,9 GB
Lectura de datos de la fuente 200,1 GB
Datos transferidos a Ceph después de la deduplicación y la compresión 69,7 GB
Deduplicación 1.3X
Compresión 2,7 veces


Tabla 2.

Repositorio de respaldo
Duración
(seg)
Fuente
(%)
Proxy
(%)
Red
(%)
Objetivo
(%)
Tasa de procesamiento
(MB / s)
Tasa de
escritura de datos promedio
(MB / s)
VM Linux,
RBD-réplica 3
646 83 33 84 21 554 110
VM Linux,
réplica 3 de CephFS
521 97 25 31 5 564 137
Linux VM,
RBD, EC
645 82 34 83 24 554 111
VM Linux,
CephFS, EC
536 97 26 27 4 564 133
Servidor Linux,
RBD, EC
526 97 21 dieciséis 3 561 136

Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.

(2) Copia de seguridad de una máquina virtual de Windows 10 en Hyper-V en HDD

En este punto de referencia, realizamos una copia de seguridad de una instancia de Hyper-V que se almacena en un disco duro SATA. Las velocidades de procesamiento de estos trabajos alcanzan el límite superior del ancho de banda del disco duro. También podemos encontrar que el cuello de botella está en la fuente porque sus cargas están ocupadas durante el 99% de la duración del trabajo. El clúster de Ceph, el objetivo, la carga de trabajo de los trabajos de respaldo de Veeam es liviano. El grupo Ceph solo está ocupado entre el 6% y el 1% del tiempo de trabajo.

En comparación con el punto de referencia anterior, la tasa de procesamiento de la copia de seguridad de la máquina virtual es mucho más baja que la de la copia de seguridad SSD. Esto se debe principalmente a que los datos de la máquina virtual se almacenan en un disco duro. 

Tabla 3.

Tamaño de disco (HDD) 127 GB
Lectura de datos de la fuente 37,9 GB
Datos transferidos a Ceph después de la
deduplicación y la compresión
21,4 GB
Deduplicación 3.3X
Compresión 1.8X


Tabla 4. Copia de seguridad de una imagen de máquina virtual en SATA3 HDD

Repositorio de respaldo
Duración
(seg)
Fuente
(%)
Proxy
(%)
Red
(%)
Objetivo
(%)
Tasa de procesamiento
(MB / s)
Tasa de
escritura de datos promedio
(MB / s)
VM Linux,
volumen RBD, EC
363 99 7 3 6 145 60
VM Linux,
volumen CephFS,
EC
377 99 7 2 1 142 58,1
Servidor Linux,
volumen RBD, EC
375 99 6 2 2 140 58,4

Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.

(3) Copia de seguridad de máquinas virtuales en ESXi en HDD

Esta prueba realiza una copia de seguridad de máquinas virtuales CentOS 7 y Windows 10 que se ejecutan en un disco duro de VMWare ESXi 6.5 en un repositorio respaldado por un Ceph RBD con protección de código de borrado 4 + 2. 

Cuadro 5.

Fuente VM de CentOS VM de Windows 10
Tamaño de disco (HDD) 40 GB 32 GB
Lectura de datos de la fuente 1,8 GB 12,9 GB
Datos transferidos a Ceph después de la
deduplicación y la compresión
966 MB 7,7 GB
Deduplicación 22,1 veces 2,5 veces
Compresión 1,9 veces 1,7 veces


Cuadro 6.

Fuente de respaldo
Duración
(seg)
Fuente
(%)
Proxy
(%)
Red
(%)
Objetivo
(%)
Tasa de procesamiento
(MB / s)
Tasa de
escritura de datos promedio
(MB / s)
CentOS 7 122 99 10 5 0 88 8
Windows 10 244 99 11 5 1 93 32

Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.

Conclusiones

Según los resultados de la prueba, Ceph RBD y CephFS tienen un rendimiento similar. Esto cumple con nuestra experiencia con respecto al punto de referencia del rendimiento de RBD y CephFS. Comparando las características de CephFS y RBD, tienen sus ventajas y desventajas. Si necesita implementar varios servidores de repositorio, debe crear una imagen RBD para cada servidor de repositorio de respaldo, ya que solo puede montar Ceph RBD en un host. En comparación con CephFS, usar RBD es más simple ya que no necesita servidores de metadatos. Tenemos que asignar el tamaño de capacidad de RBD cuando se crea, por lo que debe cambiar el tamaño de su capacidad cuando necesite más espacio.

Si usa CephFS como repositorio, debe implementar al menos un servidor de metadatos (MDS) en el clúster de Ceph. También necesitamos un servidor de metadatos en espera para una alta disponibilidad. En comparación con Ceph RBD, no es necesario asignarle una cuota al sistema de archivos. Por lo tanto, puede tratar CephFS como un grupo de almacenamiento ilimitado.

En esta demostración de caso de uso, nuestras pruebas respaldan solo una máquina virtual en cada trabajo de respaldo. De acuerdo con los informes de prueba anteriores, sabemos que la tasa de escritura de datos promedio está relacionada con la tasa de procesamiento y la deduplicación de datos y la eficiencia de compresión. Un disco de origen más rápido reduce la duración del trabajo de respaldo y da como resultado una tasa de procesamiento más rápida. Según la infraestructura de los usuarios, los usuarios pueden implementar varios trabajos simultáneos para realizar copias de seguridad de diferentes objetos simultáneamente. El almacenamiento Ceph funciona muy bien para admitir múltiples trabajos simultáneos. 

Un clúster Ceph de 20x HDD OSD con 3x Ambedded Mars 400 puede ofrecer hasta 700 MB / s de rendimiento de escritura agregado al grupo de códigos de borrado 4 + 2. La implementación de múltiples trabajos de respaldo actuales tiene el beneficio de reducir la duración general del respaldo. El rendimiento máximo de un clúster Ceph es casi linealmente proporcional al número total de unidades de disco en el clúster.

En este caso de uso, no probamos el uso del almacenamiento de objetos S3 como repositorio de respaldo. El almacenamiento de objetos S3 se puede usar como nivel de capacidad en el repositorio de respaldo Veeam Scale-Out y el repositorio de archivos de destino para respaldo NAS. Puede configurar fácilmente una puerta de enlace RADOS y crear usuarios de almacenamiento de objetos fácilmente utilizando el administrador Ambedded UVS, la GUI web de administración de ceph.

Descargar
Use Ceph as the repository for Veeam Backup & Replication white paper
Use Ceph as the repository for Veeam Backup & Replication white paper

How to set up the Ceph RBD block device and the CephFS file system as the backup repository of Veeam for backing up virtual machines and files

Download
Productos relacionados
Dispositivo de almacenamiento Ceph - Ceph Storage Appliance Mars 400 frontal.
Dispositivo de almacenamiento Ceph
Mars 400PRO

UniVirStor es un dispositivo de almacenamiento definido por software basado en ceph. El dispositivo de almacenamiento Ambedded Ceph integra el software...

Detalles
Dispositivo de almacenamiento empresarial Mars 400SES SUSE - Dispositivo Mars 400SES SUSE Enterprise Storage 6 (Nautilus).
Dispositivo de almacenamiento empresarial Mars 400SES SUSE
Mars 400SES

Mars400SES SUSE Enterprise Storage Appliance consta de hardware de microservidor ARM, 3 años de suscripción a SUSE Enterprise Storage y SUSE Linux Enterprise...

Detalles

Ambedded: una solución de almacenamiento Ceph profesional para el mercado.

Ubicado en Taiwán desde 2013, Ambedded Technology Co., LTD. es un proveedor de soluciones de almacenamiento de Ceph que ofrece dispositivos de almacenamiento definidos por software basados ​​en ARM con un 60% de ahorro de CapEX, un 70% menos de consumo de energía y un 100% de ventajas de escalamiento horizontal.

Para el diseño y la fabricación de almacenamiento definido por software, el equipo de Ambedded tiene una amplia experiencia para ayudar a los clientes a adoptar la solución ceph en industrias versátiles, como telecomunicaciones, médica, militar, centro de datos de borde y almacenamiento empresarial requerido de alta disponibilidad.

Ambedded ha estado ofreciendo a los clientes soluciones de almacenamiento Ceph desde 2013, tanto tecnología avanzada como 20 años de experiencia, Ambedded garantiza que se cumplan las demandas de cada cliente.