Dans le domaine informatique, les besoins de stockage sont toujours plus importants, côté grand public et professionnel. Deux points sont à prendre en compte : une tolérance plus ou moins importante aux pannes et les niveaux de performances. Le RAID peut apporter des solutions sur les deux points.
Si les SSD ont le vent en poupe pour leurs débits (théoriques) et faible latence, les disques durs restent largement plus intéressants sur le rapport capacité/coût. On trouve en effet des HDD de 4 To aux alentours de 80 euros, et même des versions de 14 To à moins de 250 euros. Avec des SSD, les chiffres s’envolent, surtout si l’on prend du PCIe/NVMe.
Problème : avec une telle capacité, à la moindre défaillance du disque dur, ce sont autant de données qui s’envolent. Pour éviter de dépendre de la panne d'un ou plusieurs périphériques de stockage, une technologie de redondance née dans les années 90 est le plus souvent utilisée : le fameux RAID. Si son évolution est plutôt limitée, il en existe différents types, qui peuvent évoluer selon le nombre d'éléments et les constructeurs.
Avant de continuer, un point important à bien prendre en considération : le RAID n'est pas une solution de sauvegarde en tant que telle, c'est plutôt une protection contre la défaillance d'une (ou plusieurs) unité de stockage. Cette technologie peut néanmoins s’inscrire dans le cadre d’une stratégie globale de sauvegarde.
Le RAID en quelques mots
De manière simple, le RAID est une solution technique permettant de décorréler l'espace de stockage, tel qu'il est perçu par le système d'exploitation, des éléments physiques qui le composent (HDD, SSD, etc.). On peut ainsi comparer cela à de la virtualisation du stockage.
Avant de plonger dans les détails techniques, un peu de vocabulaire qui sera utile pour la suite. RAID signifie aujourd’hui Redundant Array of Independent Disks, soit un regroupement redondant de disques indépendants dans la langue de Molière.
Mais à ses débuts en 1987, RAID était l’acronyme de Redundant Arrays of Inexpensive Disks, soit regroupement redondant de disques peu onéreux. Comme nous l’avons expliqué dans notre Magazine #1, le coût du stockage ayant fondu comme neige au Soleil depuis, la notion de « peu onéreux » n’a plus grand intérêt.
- Composition, technologies et fonctionnalités : on vous dit tout du disque dur moderne
- L’extraordinaire évolution du stockage
C’est quoi une grappe ?
Lorsque l’on parle d’une grappe RAID, cela comprend l’ensemble des périphériques de stockage utilisés en RAID, et donc vue comme étant une seule entité de stockage par le système. La gestion du RAID peut être matérielle (avec une carte ou une puce dédiée par exemple) ou logicielle. Dans le grand public (carte mère, NAS, etc.) c’est souvent la seconde version qui est utilisée.
Une grappe RAID peut avoir plusieurs objectifs : améliorer les performances, augmenter la sécurité des données, ou bien les deux à la fois. Le choix des disques durs, du processeur, de la carte mère/contrôleur dédié et du type de RAID auront de forts impacts sur le résultat final.
Vocabulaire : avez-vous les bases ?
On parle aussi parfois de RAID semi-logiciel, semi-matériel ou pseudo-logiciel. Il s’agit en fait de ce que l’on trouve généralement sur les cartes mères et les NAS grand public. Le contrôleur intégré propose du RAID, mais il est géré de manière logicielle, et donc par le processeur de la machine. L’avantage du semi-matériel/logiciel géré par l’UEFI/BIOS de la machine est de pouvoir booter son système d’exploitation dessus.
Il est souvent question de tolérance de panne, une notion très importante. Il s’agit du nombre de périphériques de stockage que peut perdre une grappe sans compromettre l’intégrité des données. Par exemple, un RAID 5 a une tolérance d’un disque. Pour résumer, si vous avez quatre disques durs et que l’un rend l’âme, vous ne perdez aucune donnée.
C’est l’occasion de revenir sur un autre terme : le mode dégradé. Cela arrive en cas de panne, dans la limite de la tolérance permise par la grappe. Un disque dur est hors service, mais vous pouvez toujours accéder à vos données, avec des performances généralement en (fortes) baisses.
Lorsque vous changez le périphérique défectueux, vous pouvez alors lancer la reconstruction ; c’est-à-dire remettre en place la grappe RAID dans un mode sain. Cette étape peut être très (très) longue en fonction du type de RAID, du nombre de disques durs, de la quantité de données, etc.
RAID 0 = 0 sécurité, mais de bonnes performances
Pour commencer à illustrer le fonctionnement du RAID, prenons les deux modes de fonctionnement les plus simples : le stripping ou RAID 0, et le mirroring ou RAID 1. Dans les deux cas, il faut au minimum deux périphériques. Rappelez-vous dès maintenant d’une maxime à connaitre par cœur : RAID 0 = 0 sécurité !
Le RAID 0 consiste en effet à découper la lecture/écriture des données pour l'effectuer sur les différents périphériques en même temps, et ainsi accélérer le processus. Plus il y a d'éléments, meilleures seront les performances. Par exemple, pour lire ou écrire 100 Go de données avec deux disques durs en RAID 0, il faut lire ou écrire 50 Go sur chaque disque. Avec cinq disques en RAID 0, on passe à seulement 20 Go par disque.
La capacité de stockage est également très bonne puisqu'elle est égale à la somme des éléments. Mais cette solution a un inconvénient de taille : si une panne intervient sur l'un des périphériques, toutes les données sont perdues sans possibilité de les récupérer. Avec un RAID 0 de cinq disques de 4 To, la défaillance d’un seul disque entraine donc la perte des 20 To d’espace de stockage.

En RAID 1, chaque donnée est stockée sur les deux disques.
Crédits : Cburnett, CC BY-SA 3.0, via Wikimedia Commons
RAID 1 : à vous de décider du niveau de tolérance de panne
Le RAID 1 consiste de son côté à écrire/lire les mêmes données en simultané sur deux (ou plus) éléments. Ainsi, en cas de panne sur l'un, un autre peut être utilisé.
Les performances en écriture ne sont pas améliorées puisqu’il faut écrire la totalité des données sur l’ensemble des périphériques de la grappe, mais celles en lecture peuvent l’être. En effet, si l’on doit lire 100 Go de données sur cinq disques durs en RAID 1, on peut très bien lire 20 Go sur chacun.
Notez enfin qu’on parle parfois de duplexing en mode RAID 1, cela signifie que chaque périphérique a son propre contrôleur, ce qui ajoute un niveau de sécurité si un des contrôleurs venait à tomber en panne.
Quoi qu’il en soit, en RAID 1 la capacité totale de la grappe sera égale à celle du plus petit périphérique de stockage. Avec 2, 3, 4, 5 ou même dix disques durs de 4 To, la capacité totale sera de… 4 To. La sécurité procurée par le RAID 1 a donc un coût qui est loin d’être négligeable.
RAID 5 : un compromis, avec trois disques minimum
C'est là qu'intervient une solution intermédiaire : le RAID 5. Elle nécessite au moins trois périphériques, et consiste à accéder à tous ceux de la grappe en simultané. Durant la phase d'écriture, des bits de parité sont également stockés sur chaque élément. Ils permettront de reconstituer les données perdues en cas de problème sur un des périphériques de stockage.
Crédits : Cburnett, CC BY-SA 3.0, via Wikimedia Commons
Ainsi, on dispose de performances accrues, surtout en lecture, d'une protection en cas de panne, mais aussi d'une capacité de stockage qui n'est pas amputée de manière trop importante, puisque les bits de parités occupent toujours l'équivalent de la taille d'un élément de la grappe.
Avec des unités de même capacité, on perd donc l’équivalent d’un disque. Pour résumer, si on a « n » disques durs de « y » To, la capacité de la grappe en RAID 5 est de « (n-1) * y To ». Ainsi, avec trois disques durs de 4 To, la capacité accessible sera de 8 To, avec quatre HDD on passe à 12 To, etc.
Il existe néanmoins des inconvénients. Déjà, les performances en écriture ne sont pas exceptionnelles puisqu'il faut écrire les bits de parité en même temps que les données. Il faut également les calculer, ce qui peut avoir un impact dans le cas d’une solution logicielle avec un processeur un peu faiblard. En cas de panne d’un des périphériques, une fois l’unité remplacée, la reconstruction de la grappe peut prendre (beaucoup) de temps.
Ensuite, ce dispositif ne supporte que la perte d'un élément de la grappe. Si deux tombent en panne en même temps, la reconstitution des données ne sera pas possible. Mais il existe d’autres niveaux de RAID pour cela, notamment les RAID 6, 10, 50, 60… que nous verrons dans un prochain article.
Synology propose un « comparateur de RAID » permettant d’ajouter jusqu’à 12 unités de stockage et de choisir son niveau de RAID. Le simulateur donne alors l’espace disponible (en vert), l'espace utilisé pour la protection des données (en bleu) et enfin l’éventuel espace perdu (en gris).
