Replicación de datos, codificación de borrado y verificación | Soluciones de almacenamiento Ceph para microservidores ARM | Ambedded

Ceph ofrece replicación, código EC, CRUSH, verificación para la protección de datos y alta disponibilidad. | Dispositivos Ceph de alto rendimiento

Ceph ofrece replicación, código EC, CRUSH, verificación para la protección de datos y alta disponibilidad.

Alta disponibilidad y durabilidad de datos

El almacenamiento de objetos Ceph logra la disponibilidad de datos a través de la replicación y la codificación avanzada de borrado, donde los datos se combinan con información de paridad, se fragmentan y se distribuyen en el grupo de almacenamiento.
Cuando un dispositivo de almacenamiento falla, solo se necesitan un subconjunto de fragmentos para reparar los datos, no hay tiempo de reconstrucción ni rendimiento degradado, y los dispositivos de almacenamiento fallidos se pueden reemplazar cuando sea conveniente.
Ceph combina datos ampliamente distribuidos y tecnología de verificación continua de datos que valida los datos escritos en el medio, lo que le permite lograr una durabilidad de datos de 15 nueves.


Replicación de datos, codificación de borrado y verificación

Replicación de objetos

Cuando un cliente va a escribir datos, utiliza el ID del objeto y el nombre del grupo para calcular a qué OSD debe escribir. Después de que el cliente escribe datos en el OSD, el OSD copia los datos en uno o más OSD. Puede configurar tantas réplicas como desee para que los datos puedan sobrevivir en caso de que varios OSD fallen simultáneamente. La replicación es similar al RAID-1 de una matriz de discos pero permite más copias de datos. Porque a gran escala, una simple replicación RAID-1 puede que ya no cubra suficientemente el riesgo de fallos de hardware. El único inconveniente de almacenar más réplicas es el costo de almacenamiento.

Los clientes de Ceph escriben datos aleatoriamente en los OSDs en función del algoritmo CRUSH.Si el disco OSD o el nodo fallan, Ceph puede volver a sanar los datos a partir de otras réplicas almacenadas en OSDs sanos.

Puede definir el dominio de fallo para hacer que Ceph almacene datos replicados en diferentes servidores, bastidores, salas o centros de datos para evitar la pérdida de datos debido a uno o más fallos de todo el dominio de fallo.Por ejemplo, si tienes 15 servidores de almacenamiento instalados en 5 racks (3 servidores en cada rack), puedes utilizar la réplica tres y el rack como dominio de fallos.La escritura de datos en el clúster ceph siempre tendrá tres copias almacenadas en tres de los cinco racks.Los datos pueden sobrevivir si fallan hasta 2 de los racks sin degradar el servicio al cliente.La regla CRUSH es la clave para que el almacenamiento Ceph tenga ningún punto único de fallo.

Las reglas CRUSH garantizan que los datos replicados se distribuyan en diferentes nodos del servidor siguiendo el dominio de falla.

Codificación de borrado

La replicación ofrece el mejor rendimiento general, pero no es muy eficiente en el uso del espacio de almacenamiento.Especialmente si necesitas un mayor grado de redundancia.
Tener una alta disponibilidad de datos es la razón por la que en el pasado usamos RAID-5 o RAID-6 como alternativa a RAID-1.El RAID de paridad garantiza redundancia con mucho menos sobrecarga de almacenamiento a costa del rendimiento de almacenamiento (principalmente el rendimiento de escritura).Ceph utiliza codificación de borrado para lograr un resultado similar.Cuando la escala de su sistema de almacenamiento se vuelve grande, es posible que se sienta inseguro al permitir que solo uno o dos discos o dominios de falla fallen al mismo tiempo.El algoritmo de código de borrado le permite configurar un mayor nivel de redundancia pero con menos espacio de sobrecarga.
El codificado de borrado divide los datos originales en K fragmentos de datos y calcula los fragmentos de codificación M adicionales.Ceph puede recuperar los datos de un máximo de M dominios de falla que fallen en el ínterin.El total de K+M de fragmentos se almacena en los OSD, que se encuentran en diferentes dominios de fallos.

Se utiliza la codificación por borrado K+M=4+2 para la protección de datos.

Limpieza

Como parte de mantener la consistencia y limpieza de los datos, los demonios OSD de Ceph pueden escanear objetos dentro de los grupos de colocación. Es decir, los demonios OSD de Ceph pueden comparar los metadatos del objeto en un grupo de colocación con sus réplicas en grupos de colocación almacenados en otros OSD. El proceso de limpieza (generalmente realizado a diario) detecta errores de programación o errores en el sistema de archivos. Los demonios OSD de Ceph también realizan un escaneo más profundo comparando los datos en los objetos bit a bit. La limpieza profunda (generalmente realizada semanalmente) encuentra sectores defectuosos en una unidad que no eran aparentes en una limpieza ligera.

Curación de datos

Debido al diseño de ubicación de datos de Ceph, los datos son reparados por todos los OSDs saludables. No se requiere un disco de repuesto para la re-sanación de datos. Esto puede hacer que el tiempo de re-sanación sea mucho más corto en comparación con el arreglo de discos, que tiene que reconstruir los datos perdidos en el disco de repuesto.

Si un nodo del servidor falla, el clúster se auto-reparará aplicando el mismo método de protección de datos.

Configurar mapa CRUSH y reglas

Utilice el administrador UVS para definir la distribución de datos y el dominio de falla.




Alta disponibilidad y durabilidad de datos | Soluciones de Almacenamiento Ceph; Dispositivos y Software Ceph|Ambedded

Fundada en Taiwán en 2013, Ambedded Technology Co., LTD. es un proveedor líder de soluciones de almacenamiento en bloque, archivo y objeto basadas en almacenamiento definido por software Ceph. Nos especializamos en ofrecer sistemas de almacenamiento escalables y de alta eficiencia para centros de datos, empresas e instituciones de investigación. Nuestras ofertas incluyen dispositivos de almacenamiento basados en Ceph, integración de servidores, optimización de almacenamiento y despliegue de Ceph rentable con gestión simplificada.

Ambedded proporciona dispositivos de almacenamiento Ceph llave en mano y soluciones de software Ceph de pila completa adaptadas para organizaciones B2B. Nuestra plataforma de almacenamiento Ceph admite almacenamiento unificado de bloques, archivos (NFS, SMB, CephFS) y almacenamiento de objetos compatible con S3, reduciendo el costo total de propiedad (TCO) mientras mejora la confiabilidad y escalabilidad. Con la afinación de Ceph integrada, una interfaz web intuitiva y herramientas de automatización, ayudamos a los clientes a lograr un almacenamiento de alto rendimiento para cargas de trabajo de IA, HPC y en la nube.

Con más de 20 años de experiencia en TI empresarial y más de una década en la implementación de almacenamiento Ceph, Ambedded ha entregado más de 200 proyectos exitosos a nivel mundial. Ofrecemos consultoría experta, diseño de clústeres, soporte en la implementación y mantenimiento continuo. Nuestro compromiso con el soporte profesional de Ceph y la integración sin problemas asegura que los clientes obtengan el máximo de su infraestructura de almacenamiento basada en Ceph, a gran escala, con rapidez y dentro del presupuesto.