Stockage distribué

Le stockage Ceph est un stockage défini par logiciel distribué

Le stockage Ceph est un stockage défini par logiciel distribué

Stockage distribué

Vous pouvez utiliser Ceph pour créer un cluster de serveurs pour stocker des données en haute disponibilité. Les réplications de données ou les blocs de code d'effacement sont stockés de manière distributive dans des dispositifs appartenant à différents domaines de défaillance prédéfinis. Ceph peut maintenir son service de données sans perte de données lorsque plusieurs périphériques, nœuds de serveur, racks ou sites tombent en panne à la fois.


Stockage défini par logiciel Ceph

Les clients interagissent directement avec tous les périphériques de stockage pour lire et écrire à l'aide de l'algorithme de stockage distribué CRUSH de Ceph. De ce fait, il élimine le goulot d'étranglement sur l'adaptateur de bus hôte (HBA) traditionnel, ce qui limite l'évolutivité du système de stockage. Ceph peut augmenter sa capacité de manière linéaire avec des performances à l'échelle de l'exaoctet

Ceph est conçu pour être évolutif et ne pas avoir de point de défaillance unique. Monitor (MON), Object Storage Daemon (OSD) et Metadata Servers (MDS) sont trois démons clés (processus Linux) du cluster Ceph. Habituellement, un cluster Ceph aura trois nœuds de surveillance ou plus pour la redondance. Les moniteurs conservent une copie principale des cartes de cluster, ce qui permet aux clients Ceph de communiquer directement avec OSD et MDS. Ces cartes sont des états de cluster critiques requis pour que les démons Ceph se coordonnent les uns avec les autres. Les moniteurs sont également responsables de la gestion de l'authentification entre les démons et les clients. Des nombres impairs de moniteurs maintiennent la carte de cluster à l'aide d'un quorum. Cet algorithme évite le point de défaillance unique sur le moniteur et garantit que leur consensus est valide. OSD est le démon de stockage d'objets pour Ceph. Il stocke les données, gère la réplication des données, la récupération, rééquilibrage et fournit des informations de surveillance aux moniteurs Ceph en vérifiant les autres démons OSD pour le rythme cardiaque. Chaque serveur de stockage exécute un ou plusieurs démons OSD, un par périphérique de stockage. Au moins 3 OSD sont généralement nécessaires pour la redondance et la haute disponibilité. Le démon MDS gère les métadonnées liées aux fichiers stockés sur le système de fichiers Ceph et coordonne également l'accès au cluster de stockage Ceph partagé. Vous pouvez avoir plusieurs MDS actifs pour la redondance et équilibrer la charge de chaque MDS. Vous aurez besoin d'un ou plusieurs serveurs de métadonnées (MDS) uniquement lorsque vous souhaitez utiliser le système de fichiers partagé. Au moins 3 OSD sont généralement nécessaires pour la redondance et la haute disponibilité. Le démon MDS gère les métadonnées liées aux fichiers stockés sur le système de fichiers Ceph et coordonne également l'accès au cluster de stockage Ceph partagé. Vous pouvez avoir plusieurs MDS actifs pour la redondance et équilibrer la charge de chaque MDS. Vous aurez besoin d'un ou plusieurs serveurs de métadonnées (MDS) uniquement lorsque vous souhaitez utiliser le système de fichiers partagé. Au moins 3 OSD sont généralement nécessaires pour la redondance et la haute disponibilité. Le démon MDS gère les métadonnées liées aux fichiers stockés sur le système de fichiers Ceph et coordonne également l'accès au cluster de stockage Ceph partagé. Vous pouvez avoir plusieurs MDS actifs pour la redondance et équilibrer la charge de chaque MDS. Vous aurez besoin d'un ou plusieurs serveurs de métadonnées (MDS) uniquement lorsque vous souhaitez utiliser le système de fichiers partagé.

Ceph est un stockage évolutif

Dans un système de stockage traditionnel, les clients communiquent avec un composant centralisé (par exemple, un adaptateur de bus hôte ou une passerelle), qui est un point d'entrée unique vers un sous-système complexe. Le contrôleur centralisé impose une limite à la fois aux performances et à l'évolutivité, ainsi qu'à l'introduction d'un point de défaillance unique. Si le composant centralisé tombe en panne, tout le système tombe également en panne. Les clients Ceph obtiennent la dernière carte de cluster des moniteurs et utilisent l'algorithme CRUSH pour calculer quel OSD dans le cluster. Cet algorithme permet aux clients d'interagir directement avec Ceph OSD sans passer par un contrôleur centralisé. L'algorithme CRUSH élimine le chemin unique, ce qui limite l'évolutivité. Le cluster Ceph OSD fournit aux clients un pool de stockage partagé. Lorsque vous avez besoin de plus de capacité ou de performances, vous pouvez ajouter un nouvel OSD pour faire évoluer le pool. Les performances d'un cluster Ceph sont linéairement proportionnelles au nombre d'OSD. L'image suivante montre que les IOPS en lecture/écriture augmentent si nous augmentons le nombre d'OSD.

La baie de disques traditionnelle utilise le contrôleur RAID pour protéger les données contre les pannes de disque. La capacité d'un disque dur était d'environ 20 Mo lorsque la technologie RAID a été inventée. Aujourd'hui, la capacité du disque atteint 16 To. Le temps de reconstruction d'un disque défaillant dans le groupe RAID peut prendre une semaine. Pendant que le contrôleur RAID reconstruit le disque défaillant, il est possible qu'un deuxième disque tombe en panne simultanément. Si la reconstruction prend plus de temps, la probabilité de perdre des données est plus élevée.

Ceph récupère les données perdues sur le disque défaillant par tous les autres disques sains du cluster. Ceph reconstruira uniquement les données stockées dans le lecteur défaillant. S'il y a plus de disques sains, le temps de récupération sera plus court.

Configurer la carte et la règle Ceph CRUSH

Utilisez le gestionnaire UVS pour définir la carte Ceph CRUSH et les règles CRUSH.




Ambedded - Une solution de stockage Ceph professionnelle sur le marché.

Situé à Taïwan depuis 2013,Ambedded Technology Co., LTD.est un fournisseur de solutions de stockage Ceph qui propose des appliances de stockage définies par logiciel basées sur ARM avec 60 % d'économies de CapEX, 70 % de consommation d'énergie en moins et 100 % d'avantages évolutifs.

Pour la conception et la fabrication de stockage défini par logiciel, l'équipe d'Ambedded possède une vaste expérience pour aider les clients à adopter la solution ceph dans des secteurs polyvalents, tels que les télécommunications, le médical, l'armée, les centres de données en périphérie et le stockage d'entreprise requis par HA.

Ambedded propose à ses clients des solutions de stockage Ceph depuis 2013, à la fois une technologie de pointe et 20 ans d'expérience, Ambedded s'assure que les demandes de chaque client sont satisfaites.