
Copia de seguridad y archivo de Veeam para trabajar con Ceph
Este estudio de caso explica cómo utilizar el dispositivo de almacenamiento ceph Mars 400 como repositorios de copia de seguridad y replicación de Veeam.
Ceph admite almacenamiento de objetos, almacenamiento de bloques y el sistema de archivos POSIX, todo en un solo clúster. De acuerdo con los requisitos de respaldo, los clientes pueden seleccionar diferentes protocolos de almacenamiento para satisfacer las necesidades de varias estrategias de respaldo de almacenamiento.
En este artículo, usamos el almacenamiento en bloque Ceph (Ceph RBD) y el sistema de archivos Ceph (Cephfs) como repositorios de copia de seguridad y comparamos la duración de los trabajos de copia de seguridad de las máquinas virtuales de Hyper-V y VMWare.
Arquitectura de la solución de copia de seguridad mediante el uso de Veeam y Ceph
La arquitectura de copia de seguridad de máquinas virtuales en VMWare e Hyper-V es similar. Veeam utiliza transportadores de datos para transferir datos desde hosts de origen a repositorios de respaldo. Los transportadores de datos se ejecutan en el servidor proxy y el servidor de repositorio. Para usar Ceph como almacenamiento de back-end de un repositorio de copia de seguridad, puede montar RBD o CephFS en un servidor físico Linux o una máquina virtual como servidor de repositorio.
Si los servidores proxy y de repositorio son máquinas virtuales dentro del clúster de hipervisor, puede beneficiarse del transporte de datos de alta velocidad sin red entre el disco de la VM, el servidor proxy y el servidor de repositorio. La mejor configuración de un clúster de hipervisor grande es implementar una VM de servidor proxy y una VM de servidor de repositorio en cada host VMWare. De lo contrario, puede implementar una VM de proxy de respaldo en cada host de VMWare y un host de repositorio fuera del host para eliminar la carga de trabajo de su VMWare de producción.
Hay tres formas de usar el dispositivo Ambedded Ceph como repositorios para Veeam Backup and Replication. Los dispositivos de bloque CephFS y RBD se pueden utilizar como repositorio de copia de seguridad local. El almacenamiento de objetos de S3 se puede utilizar como nivel de capacidad para una ubicación remota.
Para saber cómo configurar el dispositivo de bloques Ceph RBD y el sistema de archivos CephFS como el repositorio de respaldo de Veeam para respaldar máquinas virtuales y archivos, puede encontrar los detalles en el documento técnico al final de esta página.
Entorno de prueba
Clúster de Ceph
- Tres Mars 400 con 3 monitores, 20 OSD y 1 MDS (servidor de metadatos)
- Cada demonio de Ceph se ejecuta en un microservidor Arm A72 de doble núcleo
- Sistema Operativo: CentOS 7
- Software Ceph: Nautilus 14.2.9 Arm64
- Red: 4 redes de 10 Gb por Mars 400
Veeam Backup & Replication 10, Versión: 10.0.1.4854
Servidor de copia de seguridad de Veeam
- CPU: Intel Xeon E5-2630 2,3 GHz DOBLE
- DRAM: 64GB
- Red: 2 conexiones sfp+ de 10 Gb
- Disco: 1 TB para sistema, SSD SATA3 de 256 GB para volumen
- Servidor Windows 2019
Servidor proxy de Veeam
- ubicar con Veeam Backup Server
Servidor de repositorio
- Máquina virtual
◇ CPU: 4 núcleos 2,3 GHz
◇ DRAM: 8GB
◇ Red: puente
◇ Disco: disco virtual de 50GB
◇ SO: CentOS 7.8.2003
- Servidor básico
◇ CPU: Intel Xeon X5650 2,67 GHz DOBLE
◇ DRAM: 48GB
◇ Red: enlace sfp+ de 10 Gb de 2 puertos
◇ Disco: 1 TB para el sistema
◇ SO: CentOS 7.6.1810
Anfitrión de Hyper-V
◇ CPU: Intel Xeon E5-2630 2,3 GHz DOBLE
◇ DRAM: 64GB
◇ Red: enlace sfp+ de 10 Gb de 2 puertos
◇ Disco: 1 TB para el sistema
◇ Servidor Windows 2019
Host de VMware
◇ CPU: Intel Xeon E5-2630 2,3 GHz DOBLE
◇ DRAM: 64GB
◇ Red: enlace sfp+ de 10 Gb de 2 puertos
◇ Disco: 1 TB para el sistema
◇ ESXi 6.5
Red: conmutador de 10 GbE
Punto de referencia en varias configuraciones
Para comparar el rendimiento de respaldo de varios repositorios de respaldo, configuramos pruebas con diferentes repositorios de respaldo y tres fuentes de respaldo.
Las fuentes de respaldo que usamos para las pruebas son un volumen basado en SSD SATA en un servidor, una VM de Windows de Hyper-V y una VM de CentOS 7 y una VM de Windows de VMWare.
(1) Copia de seguridad de un volumen en una unidad SSD
Tabla 1. Copia de seguridad de un volumen desde un servidor con un SSD SATA.
Tamaño del disco (datos procesados) | 237,9 GB |
Lectura de datos de la fuente | 200,1 GB |
Datos transferidos a Ceph después de la deduplicación y compresión | 69,7 GB |
Deduplicación | 1.3X |
Compresión | 2.7X |
Tabla 2.
Repositorio de respaldo |
Duración (seg) |
Fuente (%) |
Apoderado (%) |
Red (%) |
Objetivo (%) |
Tasa de procesamiento (MB/s) |
Velocidad promedio de escritura de datos (MB/s) |
Máquina virtual Linux, RBD-réplica 3 |
646 | 83 | 33 | 84 | 21 | 554 | 110 |
Máquina virtual Linux, CephFS-réplica 3 |
521 | 97 | 25 | 31 | 5 | 564 | 137 |
Máquina virtual Linux, RBD, EC |
645 | 82 | 34 | 83 | 24 | 554 | 111 |
Máquina virtual Linux, CephFS, CE |
536 | 97 | 26 | 27 | 4 | 564 | 133 |
Servidor Linux, RBD, CE |
526 | 97 | 21 | dieciséis | 3 | 561 | 136 |
Nota: Las tasas promedio de escritura de datos se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster de Ceph en estos trabajos de copia de seguridad.
(2) Copia de seguridad de una máquina virtual con Windows 10 en Hyper-V en HDD
En este punto de referencia, hacemos una copia de seguridad de una instancia de Hyper-V que está almacenada en un disco duro SATA. Las velocidades de procesamiento de estos trabajos alcanzan el límite superior del ancho de banda del HDD. También podemos encontrar que el cuello de botella está en la fuente porque sus cargas están ocupadas durante el 99% de la duración del trabajo. El clúster de Ceph, el destino, la carga de trabajo de los trabajos de copia de seguridad de Veeam es ligero. El clúster de Ceph solo está ocupado entre el 6 % y el 1 % del tiempo de trabajo.
En comparación con el punto de referencia anterior, la tasa de procesamiento de la copia de seguridad de VM es mucho más baja que la de la copia de seguridad de SSD. Esto se debe principalmente a que los datos de la máquina virtual se almacenan en un disco duro.
Tabla 3.
Tamaño del disco (HDD) | 127GB |
Lectura de datos de la fuente | 37,9 GB |
Datos transferidos a Ceph después de la deduplicación y compresión |
21,4 GB |
Deduplicación | 3.3X |
Compresión | 1.8X |
Tabla 4. Copia de seguridad de una imagen de máquina virtual en SATA3 HDD
Repositorio de respaldo |
Duración (seg) |
Fuente (%) |
Apoderado (%) |
Red (%) |
Objetivo (%) |
Tasa de procesamiento (MB/s) |
Velocidad promedio de escritura de datos (MB/s) |
Máquina virtual Linux, volumen RBD, EC |
363 | 99 | 7 | 3 | 6 | 145 | 60 |
Máquina virtual Linux, volumen CephFS, EC |
377 | 99 | 7 | 2 | 1 | 142 | 58.1 |
Servidor Linux, volumen RBD, CE |
375 | 99 | 6 | 2 | 2 | 140 | 58.4 |
Nota: Las tasas promedio de escritura de datos se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster de Ceph en estos trabajos de copia de seguridad.
(3) Copia de seguridad de máquinas virtuales en ESXi en HDD
Esta prueba realiza una copia de seguridad de las máquinas virtuales CentOS 7 y Windows 10 que se ejecutan en un HDD del host VMWare ESXi 6.5 en un repositorio respaldado por un Ceph RBD con protección de código de borrado 4+2.
Tabla 5.
Fuente | Máquina virtual CentOS | Máquina virtual de Windows 10 |
Tamaño del disco (HDD) | 40GB | 32 GB |
Lectura de datos de la fuente | 1,8 GB | 12,9 GB |
Datos transferidos a Ceph después de la deduplicación y compresión |
966MB | 7,7 GB |
Deduplicación | 22.1X | 2.5X |
Compresión | 1.9X | 1.7X |
Tabla 6.
Fuente de copia de seguridad |
Duración (seg) |
Fuente (%) |
Apoderado (%) |
Red (%) |
Objetivo (%) |
Tasa de procesamiento (MB/s) |
Velocidad promedio de escritura de datos (MB/s) |
CentOS 7 | 122 | 99 | 10 | 5 | 0 | 88 | 8 |
ventanas 10 | 244 | 99 | 11 | 5 | 1 | 93 | 32 |
Nota: Las tasas promedio de escritura de datos se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster de Ceph en estos trabajos de copia de seguridad.
Conclusiones
Según los resultados de las pruebas, Ceph RBD y CephFS tienen un rendimiento similar. Esto cumple con nuestra experiencia con respecto al punto de referencia del rendimiento de RBD y CephFS. Comparando las características de CephFS y RBD, tienen sus ventajas y desventajas. Si necesita implementar varios servidores de repositorio, debe crear una imagen RBD para cada servidor de repositorio de copia de seguridad, ya que solo puede montar Ceph RBD en un host. Comparado con CephFS, usar RBD es más simple ya que no necesita los servidores de metadatos. Tenemos que asignar el tamaño de capacidad de RBD cuando se crea, por lo que debe cambiar el tamaño de su capacidad cuando necesite más espacio.
Si usa CephFS como repositorio, debe implementar al menos un servidor de metadatos (MDS) en el clúster de Ceph. También necesitamos un servidor de metadatos en espera para una alta disponibilidad. En comparación con Ceph RBD, no es necesario asignar una cuota al sistema de archivos. Por lo tanto, puede tratar el CephFS como un grupo de almacenamiento ilimitado.
En esta demostración de caso de uso, nuestras pruebas respaldan solo una máquina virtual en cada trabajo de respaldo. De acuerdo con los informes de prueba anteriores, sabemos que la tasa promedio de escritura de datos está relacionada con la tasa de procesamiento y la eficiencia de compresión y deduplicación de datos. Un disco de origen más rápido reduce la duración del trabajo de respaldo y da como resultado una tasa de procesamiento más rápida. Dependiendo de la infraestructura de los usuarios, los usuarios pueden implementar varios trabajos simultáneos para respaldar diferentes objetos simultáneamente. El almacenamiento de Ceph funciona muy bien al admitir varios trabajos simultáneos.
Un clúster Ceph OSD HDD 20x con tecnología 3x Ambedded Mars 400 puede ofrecer un rendimiento de escritura agregado de hasta 700 MB/s al conjunto de códigos de borrado 4+2. La implementación de varios trabajos de copia de seguridad actuales tiene la ventaja de reducir la duración total de la copia de seguridad. El rendimiento máximo de un clúster de Ceph es casi linealmente proporcional al número total de unidades de disco en el clúster.
En este caso de uso, no probamos el uso del almacenamiento de objetos S3 como repositorio de respaldo. El almacenamiento de objetos de S3 se puede utilizar como nivel de capacidad en el repositorio de respaldo Veeam Scale-Out y en el repositorio de archivos de destino para el respaldo NAS. Puede configurar fácilmente una puerta de enlace RADOS y crear usuarios de almacenamiento de objetos fácilmente utilizando el administrador de UVS incorporado, la GUI web de administración de ceph.
- Descargar
-
Use Ceph como repositorio para el informe técnico de Veeam Backup & Replication
Cómo configurar el dispositivo de bloques Ceph RBD y el sistema de archivos CephFS como repositorio de respaldo de Veeam para respaldar máquinas virtuales...
Descargar - Productos relacionados
-
Dispositivo de almacenamiento Ceph
Marte 400PRO
UniVirStor es un dispositivo de almacenamiento definido por software basado en ceph. El dispositivo de almacenamiento Ceph incorporado integra el software...
DetallesDispositivo de almacenamiento empresarial Mars 400SES SUSE
Marte 400SES
Mars400SES SUSE Enterprise Storage Appliance consiste en hardware de microservidor ARM, 3 años de suscripción a SUSE Enterprise Storage y SUSE Linux...
Detalles