
Logrando una Recuperación Rápida de OSD en Ceph Usando Tecnología SBB
En los centros de datos modernos, la disponibilidad ininterrumpida de datos es crítica. Mientras que el algoritmo CRUSH de Ceph maneja eficazmente las fallas y protege la integridad de los datos, la redundancia de hardware sigue siendo crucial para garantizar una alta disponibilidad. La introducción de servidores Storage Bridge Bay (SBB) en la infraestructura de Ceph mejora significativamente la resiliencia al minimizar las interrupciones del servicio durante las fallas de hardware.
Desafíos de las implementaciones tradicionales de Ceph
En una implementación convencional de Ceph, cada servidor de almacenamiento típicamente alberga múltiples Demonios de Almacenamiento de Objetos (OSDs). Si un solo servidor experimenta fallos de hardware, como un mal funcionamiento de la placa base o un fallo en la tarjeta de red, todos los OSDs en ese host se desconectan simultáneamente. Esta situación desencadena un proceso de recuperación, causando que los Grupos de Colocación (PGs) se degraden y potencialmente comprometan la redundancia de datos.
Recuperarse de un evento así puede llevar una cantidad significativa de tiempo, dependiendo del volumen de datos y los recursos disponibles, lo que puede llevar a un rendimiento degradado prolongado y un mayor riesgo de pérdida de datos o interrupción del servicio.
Presentando los Servidores Storage Bridge Bay (SBB)
Storage Bridge Bay (SBB) es una arquitectura estandarizada de servidor de doble nodo diseñada para alta disponibilidad. Un servidor SBB alberga dos nodos informáticos independientes conectados al almacenamiento compartido en una configuración JBOD (solo un montón de discos). Por lo general, estos servidores admiten unidades NVME o SAS de doble puerto, proporcionando una redundancia de hardware robusta.
Cómo SBB Mejora la Alta Disponibilidad de Ceph
En un despliegue de Ceph basado en SBB, cada nodo opera en modo activo-activo, lo que significa que ambos nodos ejecutan simultáneamente los servicios Ceph OSD. Por ejemplo, un servidor SBB típico equipado con 24 unidades de estado sólido NVMe distribuye estas de manera equitativa entre los dos nodos, con cada nodo gestionando inicialmente 12 OSDs.
Este diseño asegura que si un nodo falla, solo la mitad de los OSD se vuelven temporalmente no disponibles, en lugar de todos a la vez, reduciendo significativamente la gravedad y el impacto de la falla.
Escenario de Failover Rápido de OSD
Cuando ocurre una falla en un nodo dentro de un servidor SBB, la mitad de los OSD se vuelven inaccesibles. Ambedded Technology ha desarrollado un script robusto diseñado para migrar y reactivar rápidamente los OSD afectados en el nodo sobreviviente.
Así es como ocurre el proceso de migración rápida:
1.Obtener la imagen del contenedor Ceph:Recupera rápidamente la referencia de la imagen del contenedor necesaria para las operaciones de Ceph.
2.Eliminar la ubicación CRUSH específica de OSD: Actualizar la configuración de OSD eliminando los detalles de ubicación CRUSH específicos del nodo.
3.Activar OSD con ceph-volume: Reactivar los servicios OSD utilizando la utilidad ceph-volume.
4.Adoptar OSD usando cephadm: Integrar los OSDs activados de nuevo en el clúster Ceph, restaurando el servicio rápidamente.
Beneficios de Usar SBB para Ceph
1.Tiempo de inactividad minimizado: La reactivación rápida de OSD reduce significativamente el tiempo pasado en estados degradados, restaurando rápidamente los PGs a un estado activo y limpio.
2.Continuidad de Servicio Mejorada: Previene interrupciones prolongadas, manteniendo una entrega de servicio consistente.
3.Mantenimiento Simplificado: Las reparaciones de hardware inmediatas se vuelven menos urgentes, ya que los servicios permanecen operativos en el nodo sobreviviente.
4.Reducción del Riesgo de Pérdida de Datos y Degradación del Rendimiento: Los procesos de recuperación acelerados y la redundancia de hardware minimizan los riesgos potenciales asociados con fallos de hardware.
Resumen y Conclusión
La integración de servidores Storage Bridge Bay (SBB) con implementaciones de Ceph mejora drásticamente la resiliencia y la eficiencia operativa de las infraestructuras de almacenamiento. Al aprovechar una configuración activa-activa y capacidades rápidas de reactivación de OSD, las organizaciones pueden reducir significativamente el tiempo de inactividad y simplificar la gestión.
El dispositivo Ceph de Ambedded Technology, Mars 624, ejemplifica esta integración al ofrecer una solución llave en mano que aprovecha los beneficios de la arquitectura SBB.Las organizaciones que buscan mejorar la disponibilidad de Ceph y optimizar el mantenimiento deberían considerar actualizar a Mars 624 para lograr una fiabilidad y eficiencia de almacenamiento inigualables.
Además, el software Ceph de pila completa UniVirStor de Ambedded admite completamente cualquier servidor de almacenamiento construido sobre la tecnología SBB, como el SSG-640SP-DE2CR60 de Supermicro, asegurando flexibilidad y compatibilidad para diversos entornos de infraestructura.
- Productos relacionados
Mars 624 SBB 24x NVMe Dos nodos de intercambio en caliente Appliance de almacenamiento Ceph
Mars 624 SBB
El servidor Mars624 SBB acomoda dos nodos de servidor Intel Xeon intercambiables en caliente en un chasis de 2U. Dos nodos de servidor pueden conectarse...
Detalles