Almacenamiento Distribuido

Ceph Storage es un almacenamiento definido por software distribuido

Ceph Storage es un almacenamiento definido por software distribuido

Almacenamiento Distribuido

Puede usar Ceph para crear un clúster de servidores para almacenar datos en alta disponibilidad. Las replicaciones de datos o los fragmentos de código de borrado se almacenan distributivamente en dispositivos que pertenecen a diferentes dominios de falla predefinidos. Ceph puede mantener su servicio de datos sin pérdida de datos cuando varios dispositivos, nodos de servidor, bastidores o sitios fallan a la vez.


Almacenamiento definido por software de Ceph

Los clientes interactúan directamente con todos los dispositivos de almacenamiento para leer y escribir utilizando el algoritmo CRUSH de almacenamiento distribuido de Ceph. Debido a esto, elimina el cuello de botella en el adaptador de bus de host tradicional (HBA), que limita la escalabilidad del sistema de almacenamiento. Ceph puede escalar su capacidad linealmente con un rendimiento a escala de exabytes

Ceph está diseñado para ser escalable y no tener un único punto de falla. El monitor (MON), el demonio de almacenamiento de objetos (OSD) y los servidores de metadatos (MDS) son tres demonios clave (proceso de Linux) en el clúster de Ceph. Por lo general, un clúster de Ceph tendrá tres o más nodos de monitoreo para redundancia. Los monitores mantienen una copia maestra de los mapas de clúster, lo que permite a los clientes de Ceph comunicarse directamente con OSD y MDS. Estos mapas son un estado de clúster crítico requerido para que los demonios de Ceph se coordinen entre sí. Los monitores también son responsables de administrar la autenticación entre demonios y clientes. Números impares de monitores mantienen el mapa de clúster usando un quórum. Este algoritmo evita el punto único de falla en el monitor y garantiza que su consenso sea válido. OSD es el demonio de almacenamiento de objetos para Ceph. Almacena datos, maneja la replicación de datos, la recuperación, reequilibrio y proporciona cierta información de supervisión a los monitores de Ceph mediante la comprobación de otros demonios OSD en busca de hart beat. Cada servidor de almacenamiento ejecuta uno o varios demonios OSD, uno por dispositivo de almacenamiento. Por lo general, se requieren al menos 3 OSD para lograr redundancia y alta disponibilidad. El demonio MDS administra los metadatos relacionados con los archivos almacenados en el sistema de archivos de Ceph y también coordina el acceso al clúster de almacenamiento de Ceph compartido. Puede tener varios MDS activos para redundancia y equilibrar la carga de cada MDS. Necesitará uno o más servidores de metadatos (MDS) solo cuando desee utilizar el sistema de archivos compartidos. Por lo general, se requieren al menos 3 OSD para lograr redundancia y alta disponibilidad. El demonio MDS administra los metadatos relacionados con los archivos almacenados en el sistema de archivos de Ceph y también coordina el acceso al clúster de almacenamiento de Ceph compartido. Puede tener varios MDS activos para redundancia y equilibrar la carga de cada MDS. Necesitará uno o más servidores de metadatos (MDS) solo cuando desee utilizar el sistema de archivos compartidos. Por lo general, se requieren al menos 3 OSD para lograr redundancia y alta disponibilidad. El demonio MDS administra los metadatos relacionados con los archivos almacenados en el sistema de archivos de Ceph y también coordina el acceso al clúster de almacenamiento de Ceph compartido. Puede tener varios MDS activos para redundancia y equilibrar la carga de cada MDS. Necesitará uno o más servidores de metadatos (MDS) solo cuando desee utilizar el sistema de archivos compartidos.

Ceph es almacenamiento escalable

En un sistema de almacenamiento tradicional, los clientes se comunican con un componente centralizado (por ejemplo, un adaptador de bus de host o una puerta de enlace), que es un único punto de entrada a un subsistema complejo. El controlador centralizado impone un límite tanto al rendimiento como a la escalabilidad, además de introducir un único punto de falla. Si el componente centralizado falla, todo el sistema también falla. Los clientes de Ceph obtienen el mapa de clúster más reciente de los monitores y usan el algoritmo CRUSH para calcular qué OSD en el clúster. Este algoritmo permite a los clientes interactuar con Ceph OSD directamente sin pasar por un controlador centralizado. El algoritmo CRUSH elimina la ruta única, lo que provoca la limitación de la escalabilidad. El clúster Ceph OSD proporciona a los clientes un grupo de almacenamiento compartido. Cuando necesite más capacidad o rendimiento, puede agregar un nuevo OSD para escalar el grupo. El rendimiento de un clúster de Ceph es linealmente proporcional al número de OSD. La siguiente imagen muestra los aumentos de IOPS de lectura/escritura si aumentamos el número de OSD.

La matriz de discos tradicional utiliza el controlador RAID para proteger los datos de fallas en el disco. La capacidad de una unidad de disco duro era de unos 20 MB cuando se inventó la tecnología RAID. Hoy en día, la capacidad del disco es tan grande como 16 TB. El tiempo para reconstruir un disco fallido en el grupo RAID puede demorar una semana. Mientras el controlador RAID está reconstruyendo la unidad fallida, existe la posibilidad de que un segundo disco falle al mismo tiempo. Si la reconstrucción lleva más tiempo, la probabilidad de perder datos es mayor.

Ceph recupera los datos perdidos en el disco fallido por todas las demás unidades en buen estado del clúster. Ceph reconstruirá solo reparará los datos almacenados en la unidad fallida. Si hay más discos en buen estado, el tiempo de recuperación será más corto.

Configuración Ceph CRUSH Mapa y regla

Utilice el administrador de UVS para definir el mapa CRUSH de Ceph y las reglas CRUSH.




Ambedded: una solución de almacenamiento Ceph profesional para el mercado.

Ubicado en Taiwán desde 2013,Ambedded Technology Co., LTD.es un proveedor de soluciones de almacenamiento de Ceph que ofrece dispositivos de almacenamiento definidos por software basados ​​en ARM con un 60 % de ahorro de CapEX, un 70 % menos de consumo de energía y un 100 % de ventajas de escalabilidad horizontal.

Para el diseño y la fabricación de almacenamiento definido por software, el equipo de Ambedded tiene una amplia experiencia para ayudar a los clientes a adoptar la solución ceph en industrias versátiles, como telecomunicaciones, médica, militar, centro de datos perimetral y almacenamiento empresarial que requiere alta disponibilidad.

Ambedded ha estado ofreciendo a los clientes soluciones de almacenamiento Ceph desde 2013, tecnología avanzada y 20 años de experiencia, Ambedded garantiza que se cumplan las demandas de cada cliente.