RAID (informatique) |
Le RAID est un ensemble de techniques de
L'
En
La technologie RAID a été élaborée par un groupe de chercheurs de l'
En
Depuis sa création, la particularité principale de l'architecture RAID est sa capacité à combiner de nombreux périphériques de
En effet, dans une architecture de type SLED, la bonne conservation des données est dépendante de la moindre défaillance du disque dur. Lorsqu'une panne survient, non seulement le système est inexploitable le temps du remplacement du matériel défectueux, mais la seule manière de récupérer les données est de procéder à une
Si un tel temps d'inactivité est acceptable pour l'ordinateur d'un particulier, il est en revanche rédhibitoire pour le
Le RAID, suivant ses niveaux fonctionnels, s'il donne des temps de réponse identiques à ceux des disques s'ils étaient utilisés individuellement, offre des
La mise en miroir s'avère être une solution onéreuse, puisqu'il est nécessaire d'acquérir les périphériques de stockage en plusieurs exemplaires. Aussi, partant du principe que plusieurs unités de stockage ont une faible
Le système de redondance le plus simple et le plus largement utilisé est le calcul de
Il existe des systèmes de redondance plus complexes et capables de générer plusieurs éléments de redondance afin de supporter l'absence de plusieurs éléments. Le RAID 6 utilise par exemple une technique de calcul de parité fondée sur des
Le système RAID est :
Le système RAID est donc capable de gérer d'une manière ou d'une autre la répartition et la cohérence de ces données. Ce système de contrôle peut être purement logiciel ou utiliser un matériel dédié.
En RAID logiciel, le contrôle du RAID est intégralement assuré par une couche logicielle du système d'exploitation. Cette couche s'intercale entre la couche d'abstraction matérielle (pilote) et la couche du système de fichiers.
La plupart des
Les RAID logiciels de
L'extrême majorité des contrôleurs RAID bon marché intégrés à de nombreuses
D'un point de vue strictement matériel, cette solution hybride n'est pas différente d'un RAID logiciel.Elle diffère cependant sur l'emplacement des routines logicielles de gestion du RAID.
Avec les matériels plus récents, la différence entre RAID pseudo-matériel et RAID matériel est purement ésotérique. La seule différence réelle est que dans le RAID pseudo-matériel processeur et mémoire ne sont pas dédiés. Cependant, la puissance des
En dehors de cet avantage important, ce type de RAID cumule les défauts des deux autres approches :
Dans le cas du RAID matériel, une carte ou un composant est affecté à la gestion des opérations. Le contrôleur RAID peut être interne à l'unité centrale (carte d'extension) ou déporté dans une
Un contrôleur raid est en général doté d'un processeur spécifique, de mémoire, éventuellement d'une batterie de secours, et est capable de gérer tous les aspects du système de stockage RAID grâce au
Du point de vue du
Les différents types d'architecture RAID sont numérotés à partir de 0 et peuvent se combiner entre eux (on parlera alors de RAID 0+1, 1+0, etc.).
Le RAID 0, également connu sous le nom d'« entrelacement de disques » ou de « volume agrégé par bandes » (striping en anglais), est une configuration RAID permettant d'augmenter significativement les performances de la grappe en faisant travailler disques durs en parallèle (avec ).
Dans cette configuration, les données sont réparties par bandes (stripes en anglais) d'une taille fixe. Cette taille est appelée granularité (voir plus loin la section granularité).
Ainsi, sur un RAID 0 de disques (avec ), chaque disque ne doit lire et écrire que des données, ce qui a pour effet de diminuer les temps d'accès (lecture et écriture) aux données. Les disques se partageant le travail, les traitements se trouvent accélérés.
Ce type de RAID était parfait pour des applications requérant un traitement rapide d'une grande quantité de données avec des disques durs. Mais cette architecture n'assure en rien la sécurité des données. En effet, si l'un des disques tombe en panne, la totalité des données du RAID est perdue.
Le RAID 0 était utilisé dans les ordinateurs, plutôt que dans des NAS, mais les SSD l'ont rendu obsolète.
Nota[7]: en RAID matériel, la migration d'un RAID0 avec plusieurs disques vers un RAID1 est rarement possible alors que l'inverse l'est. Il est donc plus souple de démarrer en RAID1.
Le RAID 1 consiste en l'utilisation de disques redondants (avec ), chaque disque de la grappe contenant à tout moment exactement les mêmes données, d'où l'utilisation du mot « miroir » (mirroring en anglais).
Les accès en lecture du système d'exploitation se font sur le disque le plus facilement accessible à ce moment-là.
Lors de la défaillance de l'un des disques, le contrôleur RAID désactive (de manière transparente pour l'accès aux données) le disque incriminé. Une fois le disque défectueux remplacé, le contrôleur RAID reconstitue, soit automatiquement, soit sur intervention manuelle, le miroir. Une fois la synchronisation effectuée, le RAID retrouve son niveau initial de redondance.
Nota[7] : la migration du RAID1 vers RAID0, RAID5, RAID6 est presque toujours envisageable, ce qui fait du RAID1 une bonne solution de départ si on n'a pas un besoin de performance important.
Le RAID 5 combine la méthode du volume agrégé par bandes (striping) à une parité répartie. Il s'agit là d'un ensemble à redondance . La parité, qui est incluse avec chaque écriture se retrouve répartie circulairement sur les différents disques. Chaque bande est donc constituée de blocs de données et d'un bloc de parité. Ainsi, en cas de défaillance de l'un des disques de la grappe, pour chaque bande il manquera soit un bloc de données soit le bloc de parité. Si c'est le bloc de parité, ce n'est pas grave, car aucune donnée ne manque. Si c'est un bloc de données, on peut calculer son contenu à partir des autres blocs de données et du bloc de parité. L'intégrité des données de chaque bande est préservée. Donc non seulement la grappe est toujours en état de fonctionner, mais il est de plus possible de reconstruire le disque une fois échangé à partir des données et des informations de parité contenues sur les autres disques.
On voit donc que le RAID 5 ne supporte la perte que d'un seul disque à la fois, ce qui devient un problème depuis que les disques qui composent une grappe sont de plus en plus gros (1 To et plus). Le temps de reconstruction de la parité en cas de disque défaillant est allongé. Il est généralement de 2 h pour des disques de 300 Go contre une dizaine d'heures pour 1 To. Pour limiter le risque il est courant de dédier un disque dit de spare. En régime normal il est inutilisé. En cas de panne d'un disque, il prendra automatiquement la place du disque défaillant. Cela nécessite une phase communément appelée "recalcul de parité". Elle consiste pour chaque bande à recréer sur le nouveau disque le bloc manquant (données ou parité).
Bien sûr, pendant tout le temps du recalcul de la parité, le disque est disponible normalement, l'ordinateur se trouve juste un peu ralenti.
Ce système nécessite impérativement un minimum de trois disques durs. Ceux-ci doivent généralement être de même taille, mais un grand nombre de cartes RAID modernes autorisent des disques de tailles différentes.
La capacité de stockage utile réelle, pour un système de disques de capacité identiques est de . En cas d'utilisation de disques de capacités différentes, le système utilisera dans la formule précédente la capacité minimale.
Ainsi par exemple, trois disques de 100 Go en RAID 5 offrent 200 Go utiles ; dix disques, 900 Go utiles.
Ce système allie sécurité (grâce à la parité) et bonne disponibilité (grâce à la répartition de la parité), même en cas de défaillance d'un des périphériques de stockage.
Il existe une variante : le « RAID 5 varientable » où chaque disque a son propre contrôle. Toutes les autres fonctionnalités sont identiques.
On a souvent tendance à croire qu'un système RAID 5 est totalement fiable. Il est en effet généralement admis que la probabilité de défaillance simultanée de plusieurs disques est extrêmement faible — on parle évidemment d'une défaillance entraînant la perte de données définitive sur plusieurs disques et non d'une simple indisponibilité de plusieurs disques. Cela est vrai pour une défaillance générale d'une unité de disque. Cependant, cela est faux si l'on considère comme "défaillance" un seul secteur devenu illisible.
En effet, dans la pratique, il est très rare que toutes les données d'un volume soient lues régulièrement. Et quand bien même ce serait le cas, la cohérence de la parité n'est que très rarement vérifiée pour des raisons de performances. Il est donc probable que des défauts tels que des secteurs de parité illisibles ne soient pas détectés pendant une très longue période. Lorsque l'un des disques devient réellement défectueux, la reconstruction nécessite de parcourir l'intégralité des disques restants. On peut alors découvrir des défauts qui étaient restés invisibles jusque-là.
Tout ceci pourrait ne pas être bien grave et occasionner la perte d'une quantité de données minime (un secteur de disque), cependant, l'extrême majorité des contrôleurs RAID est incapable de gérer les défaillances partielles : ils considèrent généralement qu'un disque contenant un secteur illisible est totalement défaillant. À ce moment-là, 2 disques sont considérés défaillants simultanément et le volume RAID 5 devient inutilisable. Il devient extrêmement difficile de récupérer les données, et extrêmement coûteux.
Un système RAID 5 doit donc être vérifié et sauvegardé périodiquement pour s'assurer que l'on ne risque pas de tomber sur ce genre de cas. D'autre part, en cas de défaillance, il est nécessaire de disposer de matériel très coûteux pour espérer récupérer les données, ce qui rend le RAID 5 très peu recommandable aux particuliers et aux petites entreprises.
NRAID : Near/Non Redundant Array of Inexpensive/Independent Disk
La concaténation de disques consiste à additionner les capacités de plusieurs disques durs en un volume logique d'une taille équivalente à la somme des tailles des disques durs. Cette méthode utilise une méthode d'écriture séquentielle : les données ne sont écrites sur le disque dur suivant que lorsqu'il ne reste plus de place sur le précédent.
Le NRAID n'est pas à proprement parler un RAID, et il ne permet d'ailleurs aucune redondance de données. La panne d'un disque peut avoir des conséquences désastreuses sur le reste des données si des métadonnées critiques sont impactées.
Il est parfois confondu à tort avec le
Le NRAID est aussi représenté comme "Volume Simple" sous Windows 2000, XP, 2003, Vista, 2008 et 7[8].
Le RAID 2 est aujourd'hui désuet. Il combine la méthode du RAID 0 (volume agrégé par bande, striping en anglais) à l'écriture d'un code de contrôle d'erreur par
Le RAID3 et le RAID4 sont sensiblement semblables sauf que le premier travaille par octets et le second par blocs. Le RAID4 ne nécessite pas autant de synchronisme entre les disques. Le RAID3 tend donc à disparaître au profit du RAID4 qui offre des performances nettement supérieures.
Ces niveaux de RAID nécessitent une matrice de disques (avec ). Les premiers disques contiennent les données tandis que le dernier disque stocke la parité (Voir section parité).
Il est important que le disque de parité soit de bonne qualité, car il est à tout instant sollicité à l'écriture. Ce dernier point est une des limitations du RAID 3.
De même, si plus d'un disque vient à défaillir, il est impossible de remédier à la perte de données.
Le RAID 6 est une évolution du RAID 5 qui accroît la sécurité en utilisant informations redondantes au lieu d'une. Il peut donc résister à la défaillance de disques. Les fondements mathématiques utilisés pour les informations de redondance du RAID 6 sont beaucoup plus complexes que pour le RAID 5 ; les implémentations de l'algorithme se limitent souvent à (soit la perte de 2 disques) de ce fait.
Des explications intéressantes, mais un peu ardues sont disponibles dans la version anglaise de cet article[9] ainsi que dans Les mathématiques du RAID 6[10].
Si la sécurité est plus grande, le coût en matériel est plus élevé et la vitesse est moindre. La puissance CPU nécessaire pour calculer les redondances et surtout pour reconstruire un volume défectueux est également nettement plus importante.
Les défauts majeurs sont :
Le RAID 6 était peu utilisé du fait de son surcoût. La récente envolée des capacités des disques ainsi que la vulgarisation de solution professionnelle à base de disque SATA a montré un intérêt nouveau dans l'utilisation du RAID 6, que ce soit par le biais de contrôleur RAID hardware ou via du raid logiciel (le noyau Linux-2.6 intègre le RAID 6).
La capacité utile totale (), pour un système avec disques dont réservés pour la redondance est de . ( = capacité du plus petit des disques dur)
Un système de stockage grevé de brevets appelé RAIDn[11] prétend permettre de dépasser largement les capacités du RAID 6.
RAID DP (Dual Parity) ressemble au RAID6 à ceci près qu'en RAID DP les disques de parité sont fixes.Ce type de RAID est adopté en général sur les serveurs de stockage
Fondamentalement, un niveau de RAID combiné est l'utilisation d'un concept de RAID classique sur des éléments constitutifs qui sont eux-mêmes le résultat d'un concept RAID classique. Le concept utilisé peut être le même ou différent.
La syntaxe est encore un peu floue, mais on peut généralement considérer que le premier chiffre indique le niveau de raid des "grappes" et que le second indique le niveau de raid global. Dans l'absolu, rien n'empêche d'imaginer des RAID combinés à 3 étages ou plus, mais cela reste pour l'instant plus du domaine de la théorie et de l'expérimentation.
Le nombre important (et croissant) de permutations possibles fait qu'il existe une multitude de raid combinés et nous n'en ferons pas l'inventaire.Nous pouvons cependant présenter les avantages et les faiblesses des plus courants.
Pour les calculs suivants, on utilise les variables suivantes :
Les seuils de mise en défaut indiqués ci-dessous indiquent le nombre minimal de disques en panne pouvant entraîner une mise en défaut de l'ensemble du RAID (ie. en dessous de ce nombre de disques en panne le RAID ne peut pas être en défaut). En pratique il est possible qu'un RAID ayant plus que ce nombre de disques en panne fonctionne toujours, mais il est recommandé de changer les disques défectueux le plus rapidement possible.
Il permet d'obtenir du mirroring rapide puisqu'il est basé sur des grappes en striping.Chaque grappe contenant au minimum 2 éléments, et un minimum de 2 grappes étant nécessaire, il faut au minimum 4 unités de stockage pour créer un volume RAID0+1.
La fiabilité est moyenne, car un disque défectueux entraîne le défaut de toute la grappe qui le contient.Par ailleurs, cela allonge beaucoup le temps de reconstruction et dégrade les performances pendant la reconstruction.L'intérêt principal est que dans le cas d'un miroir à 3 grappes ou plus, le retrait volontaire d'une grappe entière permet d'avoir une sauvegarde "instantanée" sans perdre la redondance.
Il permet d'obtenir un volume agrégé par bande fiable (puisqu'il est basé sur des grappes répliquées). Chaque grappe contenant au minimum 2 éléments et un minimum de 2 grappes étant nécessaire, il faut au minimum 4 unités de stockage pour créer un volume RAID10.
Sa fiabilité est assez grande puisqu'il faut que tous les éléments d'une grappe soient défectueux pour entraîner un défaut global. La reconstruction est assez performante puisqu'elle ne mobilise que les disques d'une seule grappe et non la totalité.
Pour les serveurs domestiques qui sont souvent limités à 4 disques, le choix entre RAID 6 et RAID 10 (ou 1+0) semble problématique : on a en effet dans les deux cas la moitié de l'espace disque total consacrée à la redondance. Le RAID 6 reprend un avantage au-delà, car il n'utilise plus la moitié de l'espace (et peut même être utilisé dans un système à 4 disques !). Le 6 est de plus tolérant à deux pannes dans le même laps de temps (défaillance d'un disque pendant la reconstruction d'un autre, par exemple). Si le 10 reste cependant souvent favori, c'est qu'il est plus réactif (beaucoup moins de calculs au vol sont nécessaires) et permet des reconstructions bien plus rapides.
Même principe que pour le raid 0+1 mais en employant du RAID5 pour la partie globale. Chaque grappe contenant au minimum 2 disques, et un minimum de 3 grappes étant nécessaire, il faut au minimum 6 unités de stockage pour créer un volume RAID05. Ce mode ne présente pas d'intérêt majeur par rapport à un RAID5 classique à disques. Il est donc très peu utilisé.
Il permet d'obtenir un volume agrégé par bandes avec redondance répartie très fiable (puisqu'il est basé sur des grappes répliquées en miroir).Chaque grappe contenant au minimum 2 disques, et un minimum de 3 grappes étant nécessaire, il faut au minimum 6 unités de stockage pour créer un volume RAID15.Ce mode est très fiable puisqu'il faut que tous les disques de 2 grappes différentes cessent de fonctionner pour le mettre en défaut.Ce mode est cependant coûteux par rapport à la capacité obtenue.
Il permet d'obtenir un volume agrégé par bandes basé sur du RAID 5 + 0. Chaque grappe contenant au minimum 3 disques, et un minimum de 2 grappes étant nécessaire, il faut au minimum 6 unités de stockage pour créer un volume RAID 50. Un des meilleurs compromis lorsque l'on cherche la rapidité sans pour autant vouloir trop dégrader la fiabilité. En effet, l'agrégat par bande (fragile) repose sur des grappes redondantes. Il suffit cependant que 2 disques d'une même grappe tombent en panne pour le mettre en défaut.
Il permet d'obtenir un volume répliqué basé sur des grappes en RAID5.Chaque grappe contenant au minimum 3 disques, et un minimum de 2 grappes étant nécessaire, il faut au minimum 6 unités de stockage pour créer un volume RAID51.C'est un mode coûteux (faible capacité au regard du nombre de disques).
Le RAID 5E (E pour Enhanced, "amélioré") est une variante du RAID 5 dans laquelle des bandes de rechange sont réservées. Ces bandes sont réparties sur les disques de manière circulaire, comme pour la parité.
Le RAID 5EE (E pour Enhanced, "amélioré") est une variante du RAID 5E qui offre de meilleurs temps de reconstruction. Contrairement au RAID 5E, l'espace de rechange réservé au sein de la grappe est distribué à travers tous les disques physiques.
RAID 5DP (Dual Parity) ressemble au RAID 6 à ceci près qu'en RAID DP les 2 disques de parité sont fixes . Ce type de RAID est adopté en général sur les serveurs de stockage NAS.
Le RAID TP pour Triple Parity RAID technology a la même organisation que le RAID 6 mais utilise 3 codes de redondance. Ceci permet de continuer de fonctionner après la panne simultanée de 3 disques.
Le RAID double parité vise à améliorer la protection des données stockées sur un groupe de disques contre la défaillance simultanée de deux volumes, là où les niveaux RAID 3, 4, et 5 ne protègent que contre la perte d'un volume. Pour ceux-ci, la donnée à stocker est fragmentée en blocs qui sont écrits sur plusieurs disques tandis qu'une parité de ces blocs est calculée. En cas de perte de l'un des disques, cette parité est le résultat d'une opération mathématique telle que les blocs stockés sur les autres disques et la parité permettent de reconstituer les données. Cette parité est soit inscrite sur un disque à part (RAID 3 et 4), soit distribuée sur les disques du groupe (RAID 5). Mais, si deux disques tombent, l'ensemble des données stockées est perdu. Pour se prémunir contre cette éventualité, sont apparus plusieurs modèles de RAID double parité : RAID 6, RAID-DP, RAID-ADG, RAIDn... Ils reposent tous sur le même principe : deux parités sont calculées et stockées, soit sur deux disques dédiés, soit de façon distribuée sur les disques de la grappe. De cette façon, la grappe est protégée contre la perte simultanée de deux disques.
Le RAID 1.5 est une évolution du RAID 1. Les accès en lecture ne se font non plus depuis un seul disque, mais en parallèle depuis tous les disques à la manière d'un RAID 0 ce qui apporte un gain sensible en performances, sans rien changer à la fiabilité.
L'évolution du RAID 3 permettant de faire fonctionner le tout de manière asynchrone. Il a été annoncé comme plus performant de 1,5x à 6x que n'importe quel autre RAID. Tout comme le RAID 3, un seul disque contient les parités de tous. Chaque disque a un contrôleur
Cette version, développée par Storage Computer Corporation, est
Le Raid 1E est un système de mirroring par bandes permettant d'utiliser un nombre de disques supérieur à 2 pair ou impair. Les données sont découpées par bandes qui sont mirrorrées (dupliquées) sur un des autres disques de la grappe. La capacité totale du volume logique est égale à la moitié de celle du volume physique.
L'Intel Matrix Storage Technology est disponible depuis les chipsets ICH6R et ICH6RW. Il s'agit d'une solution RAID basée sur 4 ports Serial-ATA qui va permettre de mettre des disques durs en RAID de façon moins contraignante que les solutions actuelles. En effet, les contrôleurs RAID actuels ne permettent avec deux disques identiques que de faire soit du RAID 0, soit du RAID 1. Bref, c'est l'un ou l'autre. Avec le Matrix RAID, Intel permet de combiner sur deux disques à la fois du RAID 0 et du RAID 1. L’intérêt n'est pas immédiatement évident mais par exemple, avec deux disques durs 250 Go, il est possible de créer un RAID 0 (striping) de 100 Go (les 50 premiers Go de chaque disque) d'accès "rapide" et un RAID1 (mirroring) de 200 Go de données "sécurisé" avec les 400 Go restant. Avec les RAID traditionnels, un RAID 0 et un RAID 1 dans une même configuration nécessite l'usage de quatre disques. Même si c'est évident, ajoutons que l'ICH6R (année 2005) ne permet pas de faire du RAID 01 ou 10 avec seulement deux disques durs.
Aujourd'hui jusqu'à l'ICH8R/DO il est possible de faire un RAID-5 maximum avec 4 disques, depuis l'ICH9R/DO il est possible de faire un RAID-5 de 6 disques pour un maximum de capacité. En plus avec l'ICH 9/10 DO il est possible de rajouter un disque à une grappe existante.
Le RAID S est un RAID 5 estampillé EMC² employé dans la gamme
Le système
Il résout également les problèmes de corruption silencieuse du RAID 5 grâce aux opérations de scrub qui analysent toutes les données de l'array afin de détecter des incohérences.
Le système RAID-Z est moins performant que le RAID 5, chaque accès en lecture ou en écriture accédant à tous les disques, il ne permet pas de profiter de la multiplication des têtes de lectures. Il permet en revanche l'utilisation de la mémoire RAM comme cache (ARC). Il est aussi possible de dédier des disques SSD à des caches en lecture (L2ARC) ou écriture (ZIL) pour améliorer les performances d'un array[12],[13].
Technologie propriétaire de
Le système X-RAID est une technique développée par
De nombreuses cartes mères proposent un contrôleur RAID intégré. Il est toujours préférable de choisir un contrôleur affecté à cette tâche. En plus de l'interface retenue, la mémoire cache du contrôleur dédié est un facteur important dans les performances du système RAID.
Un paramètre à ne pas oublier dans la conception d'un RAID est le nombre d'interfaces contrôlant les disques (cartes
Si ce point est jugé crucial, il est possible de remédier à ce problème, en utilisant plus d'un contrôleur. Par exemple, dans le cas d'un RAID 1 logiciel simple reposant sur l'utilisation de disques
On parle abusivement de disques pouvant être enfichés à chaud (hotplug/hotswap en anglais), alors qu'en réalité, c'est la baie de disques du système ainsi que le contrôleur qui doivent être conçus de manière à permettre le retrait ou l'insertion de disques durs alors que le système est sous tension.
Cette fonctionnalité n'est pas disponible avec toutes les technologies :
Cela permet :
L'utilisation de systèmes de connexion à chaud permet donc d'éviter l'indisponibilité durant une opération de maintenance.
Les disques de rechange (spare/hotspare en anglais) permettent de limiter la vulnérabilité d'une solution.
Un disque complémentaire est affecté à une unité RAID mais n'est pas utilisé au quotidien. Il est appelé disque de rechange. Lorsqu'un disque de la grappe vient à défaillir, le disque de rechange prend immédiatement et automatiquement son relais. Ce disque est alors reconstruit à partir des données présentes sur les autres disques, ce qui peut durer plusieurs heures en fonction de la quantité de données. Une fois le disque reconstruit, le système revient à un niveau optimal de sécurité et de performances.
Une fois le disque de rechange mis en service, il faut procéder à l'échange physique du disque en panne par un nouveau disque qui pourra jouer le rôle de nouveau disque de rechange.
Le
Le cache de lecture ou « antémémoire de lecture » est une mémoire où sont pré-chargées les données dont le système va avoir besoin. Son fonctionnement est complexe dans la mesure où le contrôleur n'a aucune certitude sur les lectures qui vont lui être demandées, il n'apporte un gain de performance que dans le cas où la prédiction se révèle exacte. Les lectures de données entrent le plus souvent dans deux catégories : des lectures séquentielles de données et des accès répétés à de mêmes données. La majorité des caches de lecture reposent donc d'une part sur la conservation en mémoire RAM des données récemment écrites ou lues et d'autre part sur une lecture des données suivantes dans le cas où l'on vient d'effectuer une lecture séquentielle importante. La taille du cache de lecture et la pertinence du système de prédicat a un très grand impact sur les performances en lecture.
Le cache d'écriture est un tampon dans lequel sont placées les données à écrire sur les disques avant d'être transférées sur ceux-ci. Lorsqu'il n'est pas saturé, c’est-à-dire lorsque la quantité de données à écrire ne dépasse pas la taille du cache, le système peut envoyer les données à écrire très rapidement et effectuer d'autres tâches pendant que le contrôleur se charge d'écrire physiquement sur les disques. Le cache d'écriture accroît donc les performances en écriture du système. Cependant, dans le cas d'écritures dont le volume dépasse largement la capacité du cache, le système devra bien attendre que le cache d'écriture se vide avant de pouvoir envoyer davantage de données. L'effet accélérateur du cache devient alors presque nul, voire négatif, sur certains contrôleurs.
Le cache d'écriture pose un problème de sécurité important. En effet, la mémoire cache étant volatile, les données écrites par le système dans cette mémoire, mais pas encore transférées sur les disques sont perdues en cas de rupture d'alimentation ou de défaillance. Il peut s'ensuivre de très lourdes pertes ou corruptions de données. Dans certains cas graves, l'intégrité du système de fichier peut être affectée et tout le volume peut alors devenir illisible. Pour pallier ce problème, on recommande de n'activer le cache d'écriture que si la machine est alimentée par l'intermédiaire d'un onduleur et que si le contrôleur RAID possède une
Remarque : Seuls les véritables contrôleurs « RAID matériel » sont munis d'une mémoire cache. Pour les autres, des équivalents logiciels peuvent tenir lieu de cache.
La
Il s'agit en fait de la taille des bandes de données. Cette taille configurable est généralement un multiple de 512 octets (taille d'un secteur).En pratique, elle varie le plus souvent de 16 Kio à 1 Mio. Sur la majorité des contrôleurs RAID, la valeur
Remarque : juger de la pertinence de ces modifications et de l'impact sur les performances nécessite une connaissance approfondie du fonctionnement interne des disques, du contrôleur RAID et du système de fichiers. Dans la mesure du possible, il est conseillé d'utiliser la valeur par défaut du contrôleur RAID.
Le RAID ne dispense pas d'effectuer des sauvegardes régulières. En effet, des défaillances à plusieurs disques sont plus fréquentes que l'on ne le croit (voir article RAID5 plus haut). De plus, des erreurs humaines (effacement/corruption de fichiers) finissent toujours par se produire.Un exemple classique de défaillance simultanée de plusieurs disques est le suivant : un premier disque est victime d'un atterrissage de tête provoquant la dislocation d'une partie de la surface des plateaux. Mais le disque continuant de tourner commence à chauffer et atteint une température gênante pour ses voisins… On comprendra que l'un des disques se trouvant à côté peut à son tour connaître une défaillance du fait de la température locale excessive.
De plus, la taille des disques ne cessant de croître, un RAID dépassant les 12 To utiles (raid 5 à 4 disques de 4 To par exemple) sera probablement impossible à reconstruire, car atteignant la limite de fiabilité des contrôleurs SATA : il sera presque sûr qu'une erreur de lecture se produira pendant la reconstruction[15]. Cela serait aussi valable pour les RAID-Z[16].
Le RAID a tendance à rendre les utilisateurs trop confiants. Cet excès de confiance en une technologie, bien que très robuste et très fiable, peut entraîner des désastres. Multiplier le nombre de disques multiplie les risques de panne. De plus, les disques utilisés par une grappe RAID sont souvent de même type et de même âge. Ils auront donc une durée de vie similaire, c'est pourquoi il faut faire attention à utiliser des disques qui soient du même modèle, mais pas de la même série. La complexité du système RAID ajoute des risques technologiques, de rares, mais possibles dysfonctionnements du contrôleur RAID ou du logiciel, sont à craindre. Un disque défectueux peut aussi perturber le fonctionnement du contrôleur, logiquement ou électriquement ; ce qui peut causer la perte de plusieurs unités ; dans le cas d'un dysfonctionnement répété, la perte totale d'une grappe voire de toute l'unité de stockage est possible.
Il faut aussi garder à l'esprit que l'utilisation d'une unité de stockage RAID n'apporte aucune protection contre :
Il n'est donc pas raisonnable de faire totalement confiance à un système de stockage de données, quel qu'il soit. Il convient alors d'effectuer des sauvegardes régulières ; une façon "sûre" de préserver une banque de données du vol ou de l'incendie étant d'en stocker une sauvegarde sur un support inerte dans un endroit sécurisé distant, et d'en vérifier régulièrement la validité et l'exploitabilité.
L'augmentation progressive des supports de stockage est un facteur qui augmente exponentiellement la fragilité des systèmes RAID, comme l'a montré cette étude sur les RAID-5 et 6 [17].
Une nouveauté dans la façon d'aborder la redondance des blocs disques est apparue au