Veeam backup y archivo para trabajar con Ceph| Gestión de almacenamiento Ceph rentable | Ambedded

Por qué y cómo utilizar el dispositivo de almacenamiento Ceph como repositorio de respaldo de Veeam Backup & Replication| Mars 400 - Almacenamiento Ceph de alta densidad

Por qué y cómo utilizar el dispositivo de almacenamiento Ceph como repositorio de respaldo de Veeam Backup & Replication

Veeam backup y archivo para trabajar con Ceph

Este estudio de caso explica cómo utilizar el dispositivo de almacenamiento Ceph Mars 400 como repositorio de respaldo de Veeam backup and replication.
Ceph admite almacenamiento de objetos, almacenamiento en bloques y el sistema de archivos POSIX, todo en un solo clúster. Según los requisitos de respaldo, los clientes pueden seleccionar diferentes protocolos de almacenamiento para satisfacer las necesidades de diversas estrategias de respaldo de almacenamiento.
 
En este artículo, utilizamos el almacenamiento en bloques de Ceph (Ceph RBD) y el sistema de archivos de Ceph (Cephfs) como repositorios de respaldo y comparamos las duraciones de los trabajos de respaldo al respaldar máquinas virtuales de Hyper-V y VMWare.


Arquitectura de solución de respaldo utilizando Veeam y Ceph

La arquitectura de respaldo de máquinas virtuales en VMWare y Hyper-V es similar. Veeam utiliza transferidores de datos para transferir datos desde los hosts de origen a los repositorios de respaldo. Los transferidores de datos se ejecutan en el servidor proxy y en el servidor de repositorio. Para utilizar Ceph como almacenamiento de respaldo de un repositorio, puede montar RBD o CephFS en un servidor físico o máquina virtual Linux como servidor de repositorio.

Si los servidores proxy y de repositorio son máquinas virtuales dentro del clúster del hipervisor, puedes obtener el beneficio de un transporte de datos de alta velocidad sin necesidad de red entre el disco de la máquina virtual, el servidor proxy y el servidor de repositorio. La mejor configuración de un gran clúster de hipervisores es desplegar una máquina virtual de servidor proxy y una máquina virtual de servidor de repositorio en cada host de VMWare. De lo contrario, puedes implementar una máquina virtual de respaldo en cada host de VMWare y un host de repositorio externo para eliminar la carga de trabajo de tus máquinas virtuales de producción en VMWare.

Hay tres formas de utilizar el appliance Ceph Ambedded como repositorios para Veeam Backup and Replication.CephFS y dispositivos de bloques RBD se pueden utilizar como repositorio de copias de seguridad en las instalaciones.The almacenamiento de objetos S3 se puede utilizar como la capa de capacidad para una ubicación remota.

Para obtener información sobre cómo configurar el dispositivo de bloque Ceph RBD y el sistema de archivos CephFS como el repositorio de respaldo de Veeam para la copia de seguridad de máquinas virtuales y archivos, puede encontrar los detalles en el documento blanco al final de esta página.


Los servidores proxy y de repositorio de Veeam son máquinas virtuales dentro del clúster del hipervisor, con almacenamiento Mars 400 ceph para proporcionar RBD y cephfs
Un clúster de hipervisores grande consiste en implementar una máquina virtual de servidor proxy y una máquina virtual de servidor de repositorio en cada host de VMWare, para tener datos de respaldo guardados en ceph RBD o cephfs

Ambiente de Prueba

clúster ceph

  • Tres Mars 400 con 3x monitores, 20 OSDs, y 1x MDS (servidor de metadatos)
  • Cada demonio de Ceph se ejecuta en un microservidor Arm A72 de doble núcleo
  • Sistema Operativo: CentOS 7
  • Software Ceph: Nautilus 14.2.9 Arm64
  • Red: 4x 10Gb de red por Mars 400 

Veeam Backup & Replicación 10, Versión: 10.0.1.4854

Servidor de Respaldo Veeam

  • CPU: Intel Xeon E5-2630 2.3GHz DUAL
  • DRAM: 64GB
  • Red: 2x 10Gb sfp+ enlace
  • Disco: 1TB para el sistema, 256GB SATA3 SSD para el volumen
  • Servidor Windows 2019

 Servidor Proxy Veeam

  • colocar junto al Servidor de Respaldo Veeam

 Servidor de Repositorio

  • Máquina Virtual

◇  CPU: 4 núcleos a 2.3GHz

◇  DRAM: 8GB

◇  Red: puente

◇  Disco: disco virtual de 50GB

◇  Sistema Operativo: CentOS 7.8.2003

  • Servidor Baremetal

◇  CPU: Intel Xeon X5650 2.67GHz DUAL

◇  DRAM: 48GB

◇  Red: vinculación de 2 puertos 10Gb sfp+

◇  Disco: 1TB para el sistema

◇  Sistema Operativo: CentOS 7.6.1810

Anfitrión de Hyper-V

◇  CPU: Intel Xeon E5-2630 2.3GHz DUAL

◇  DRAM: 64GB

◇  Red: enlace de 2 puertos 10Gb sfp+ enlace

◇  Disk: 1TB para el sistema

◇  Servidor Windows 2019

Anfitrión de VMWare

◇  CPU: Intel Xeon E5-2630 2.3GHz DUAL

◇  DRAM: 64GB

◇  Red: enlace de 2 puertos 10Gb sfp+ enlace

◇  Disk: 1TB para el sistema

◇  ESXi 6.5

Red: switch de 10GbE

Prueba de rendimiento en diferentes configuraciones

Para evaluar el rendimiento de respaldo de varios repositorios de respaldo, configuramos pruebas con diferentes repositorios de respaldo y tres fuentes de respaldo.

Las fuentes de respaldo que utilizamos para las pruebas son un volumen basado en SSD SATA en un servidor, una máquina virtual de Windows de Hyper-V y una máquina virtual de CentOS 7 y una máquina virtual de Windows de VMWare.

(1) Respaldar un volumen en una unidad SSD

Tabla 1. Respaldar un volumen desde un servidor con un SSD SATA.

Tamaño del disco (datos procesados)237.9GB
Datos leídos desde la fuente200.1GB
Datos transferidos a Ceph después de la deduplicación y compresión69.7GB
Deduplicación1.3X
Compresión2.7X


Tabla 2.

Respaldo
Repositorio
Duración
(seg)
Origen
(%)
Intermediario
(%)
Red
(%)
Destino
(%)
Procesamiento
Tasa (MB/s)
Promedio
Escritura de Datos
Tasa (MB/s)
Máquina virtual de Linux
Réplica RBD 3
64683338421554110
Máquina virtual de Linux
Réplica CephFS 3
5219725315564137
Máquina virtual de Linux
RBD, EC
64582348324554111
Máquina virtual de Linux
CephFS, EC
5369726274564133
Servidor Linux,
RBD, EC
5269721163561136

Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.

(2) Hacer una copia de seguridad de una máquina virtual de Windows 10 en Hyper-V en HDD

En esta prueba de referencia, hacemos una copia de seguridad de una instancia de Hyper-V que está almacenada en un disco duro SATA. Las tasas de procesamiento de estos trabajos alcanzan el límite superior del ancho de banda del HDD. También podemos encontrar que el cuello de botella está en la fuente porque sus cargas están ocupadas durante el 99% de la duración del trabajo. El clúster de Ceph, el objetivo, la carga de trabajo de los trabajos de respaldo de Veeam es ligera. El clúster de Ceph solo está ocupado entre el 6% y el 1% del tiempo de trabajo.

En comparación con el benchmark anterior, la velocidad de procesamiento de la copia de seguridad de la máquina virtual es mucho más baja que la copia de seguridad en SSD.Esto se debe principalmente a que los datos de la máquina virtual se almacenan en un disco duro.

Tabla 3.

Tamaño del disco (HDD)127GB
Datos leídos desde la fuente37.9GB
Datos transferidos a Ceph después de
Deduplicación y Compresión
21.4GB
Deduplicación3.3X
Compresión1.8X


Tabla 4. Hacer una copia de seguridad de una imagen de máquina virtual en un disco duro SATA3

Respaldo
Repositorio
Duración
(seg)
Origen
(%)
Intermediario
(%)
Red
(%)
Destino
(%)
Procesamiento
Tasa (MB/s)
Promedio
Escritura de Datos
Tasa (MB/s)
Máquina virtual de Linux
Volumen RBD, EC
3639973614560
Máquina virtual de Linux
Volumen de CephFS,
EC
3779972114258.1
Servidor Linux,
Volumen RBD, EC
3759962214058.4

Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.

(3)Hacer copias de seguridad de máquinas virtuales en ESXi en HDD

Esta prueba realiza una copia de seguridad de máquinas virtuales CentOS 7 y Windows 10 que se ejecutan en un host VMWare ESXi 6.5 con un disco duro a un repositorio respaldado por un Ceph RBD con protección de código de borrado 4+2.

Tabla 5.

OrigenCentOS VMWindows 10 VM
Tamaño del disco (HDD)40GB32GB
Datos leídos desde la fuente1.8GB12.9GB
Datos transferidos a Ceph después de
Deduplicación y Compresión
966MB7.7GB
Deduplicación22.1X2.5X
Compresión1.9X1.7X


Tabla 6.

Respaldo
Origen
Duración
(seg)
Origen
(%)
Intermediario
(%)
Red
(%)
Destino
(%)
Procesamiento
Tasa (MB/s)
Promedio
Escritura de Datos
Tasa (MB/s)
CentOS 7122991050888
Windows 102449911519332

Nota: Las tasas de escritura de datos promedio se calculan dividiendo los datos transferidos por la duración. Estas tasas representan las cargas de trabajo del clúster Ceph en estos trabajos de respaldo.

Conclusiones

Según los resultados de la prueba, Ceph RBD y CephFS tienen un rendimiento similar. Esto cumple con nuestra experiencia en cuanto al rendimiento de referencia de RBD y CephFS. Comparando las características de CephFS y RBD, tienen sus ventajas y desventajas. Si necesitas implementar varios servidores de repositorio, debes crear una imagen RBD para cada servidor de repositorio de respaldo, ya que solo puedes montar Ceph RBD en un host. Comparado con CephFS, usar RBD es más simple ya que no necesita servidores de metadatos. Tenemos que asignar el tamaño de capacidad de RBD al crearlo, por lo que debes redimensionar su capacidad cuando necesites más espacio.

Si utiliza CephFS como repositorio, debe implementar al menos un servidor de metadatos (MDS) en el clúster de Ceph. También necesitamos un servidor de metadatos de reserva para alta disponibilidad. En comparación con Ceph RBD, no es necesario asignar un cuota al sistema de archivos. Por lo tanto, puede considerar CephFS como un grupo de almacenamiento ilimitado.

En esta demostración de caso de uso, nuestras pruebas respaldan solo una VM en cada trabajo de respaldo. Según los informes de prueba anteriores, sabemos que la velocidad promedio de escritura de datos está relacionada con la velocidad de procesamiento y la eficiencia de deduplicación y compresión de datos. Un disco fuente más rápido reduce la duración del trabajo de respaldo y resulta en una velocidad de procesamiento más rápida. Dependiendo de la infraestructura de los usuarios, pueden implementarse varios trabajos simultáneos para respaldar objetos diferentes al mismo tiempo. El almacenamiento de Ceph funciona muy bien al admitir múltiples trabajos simultáneos.

Un clúster Ceph OSD de HDD 20x alimentado por 3x Ambedded Mars 400 puede ofrecer hasta 700MB/s de rendimiento de escritura agregado al grupo de código de borrado 4+2. Desplegar múltiples trabajos de respaldo actuales obtiene el beneficio de reducir la duración total del respaldo. El rendimiento máximo de un clúster Ceph es casi proporcionalmente lineal al número total de unidades de disco en el clúster.

En este caso de uso, no probamos el uso de almacenamiento de objetos S3 como repositorio de respaldo. El almacenamiento de objetos S3 se puede utilizar como nivel de capacidad en el repositorio de respaldo escalable de Veeam y como repositorio de archivo objetivo para el respaldo de NAS. Puede configurar fácilmente una puerta de enlace RADOS y crear usuarios de almacenamiento de objetos fácilmente utilizando el gestor UVS Ambedded, la interfaz web de gestión de Ceph.

Descargar
Usar Ceph como repositorio para el documento técnico de Veeam Backup & Replication
Usar Ceph como repositorio para el documento técnico de Veeam Backup & Replication

Cómo configurar el dispositivo de bloques Ceph RBD y el sistema de archivos CephFS como repositorio de respaldo de Veeam para respaldar máquinas virtuales...

Descargar
Productos Relacionados
Dispositivo de almacenamiento Mars 400PRO Ceph - Aparato de almacenamiento Ceph Mars 400 frontal.
Dispositivo de almacenamiento Mars 400PRO Ceph
Mars 400PRO

El dispositivo Mars 400 Ceph Appliance está diseñado para satisfacer las necesidades de almacenamiento de datos nativos en la nube de alta capacidad....

Detalles

Veeam backup y archivo para trabajar con Ceph| Soluciones de almacenamiento Ceph para microservidores ARM | Ambedded

Ubicada en Taiwán desde 2013, Ambedded Technology Co., LTD. ha sido proveedor de soluciones de almacenamiento de bloques y objetos. Sus principales servicios de gestión de almacenamiento de datos incluyen tecnología de almacenamiento Ceph, integración de servidores ARM, almacenamiento definido por software, optimización de almacenamiento empresarial, ahorro de costos en dispositivos Ceph, software de gestión de almacenamiento y soluciones de almacenamiento de bloques y objetos. Ofrecen soporte profesional de Ceph, sistemas de almacenamiento escalables con alta eficiencia de almacenamiento en el centro de datos.

Ambedded ofrece soluciones de almacenamiento Ceph de vanguardia en microservidores ARM, diseñadas para compradores B2B que buscan optimizar sus sistemas de almacenamiento empresarial. Nuestros dispositivos Ceph llave en mano reducen el costo total de propiedad (TCO) y simplifican la gestión del almacenamiento, admitiendo almacenamiento de bloques, sistemas de archivos y objetos en una plataforma unificada. Con un compromiso con la innovación y el soporte al cliente, Ambedded es su socio de confianza para soluciones escalables y eficientes de SUSE Enterprise Storage Appliance. Experimenta una integración perfecta y un soporte profesional para aprovechar todo el potencial de la tecnología Ceph en tu negocio.

Ambedded ha estado proporcionando a los clientes sistemas de almacenamiento escalables y una gestión de almacenamiento Ceph rentable desde 2013, y con tecnología avanzada y 20 años de experiencia, Ambedded garantiza que se satisfagan las necesidades de cada cliente.