[RÉSOLU] NAS : RAID1 dégradé , disque en "erreur", mais SMART OK ?
#27
Je rebondis encore pour préciser plusieurs autres éléments. Jon l'a précisé, son RAID est "software" mais en fait, c'est le cas de tous les RAIDS dont on parle ici.

Un vrai RAID "HW" présuppose qu'on ait une carte dédiée qui est elle-même équipée d'un OS / Firmware. Sur une telle machine, on commence par booter le contrôleur via par exemple une clé USB ou un DVD et on fait le set-up du RAID. Cela ressemble très fort à une partition des disques qu'on ferait sous DOS avec les outils de l'époque. Ensuite, seulement, l'OS s'installe (par exemple sur deux disques configurés en RAID 1).

Sur les NAS, et tu as pu le constater en te rappelant la procédure d'installation, l'OS est lui même installé sur une partition présente sur les disques du NAS. Il y a donc bien deux partitions sur chacun de tes disques, une cachée avec l'OS et l'autre qui est une partition clonée par RAID SW. C'est aussi le cas pour les Syno qui crée une partition de (mémoire) de 380 MB (source ici : https://community.synology.com/enu/forum/17/post/30865 ), partition qui est répliquée en RAID 1 (SW) sur tous les disques attribués au Syno.

Sur le NAS "pro" dont je parlais, c'était différent car l'OS est plutôt à voir comme un firmware et il y avait seulement une partition "particulière" (vol0) qui contenait les fichiers de configs du NAS : noms des ressources, maillage d'accès, etc. Mais là aussi, cette partition vol0 était répliquée sur l'ensemble des disques du NAS.

Deuxième élément clé dans un RAID et dont j'ai plusieurs fois parlé, c'est le "spare". De quoi s'agit-il ?

Il faut bien comprendre qu'un RAID (avec une particularité pour le RAID 1), c'est d'office plus d'écritures et de lectures sur les disques qu'une solution sans RAID. Même avec le RAID 1 où "a priori" on se pense épargné, les subtilités que j'ai évoquées à propos du partitionnement montrent que les choses sont plus fragiles. Il y a la partition système, l'OS qui écrit dessus et toute la mécanique du RAID en plus.

Aussi, la probabilité d'un incident est augmentée même si évidemment les conséquences d'un incident sont réduites (data availability >< data integrity). Les OS de NAS sont conçus (c'est une nouveauté avec le dernier OS en date de Syno, le DSM 7) afin de détecter précocement les problèmes sur les disques. En cas de doutes, le NAS prend la décision de promouvoir l'un des éventuels disques spares et de reconstruire sur lui le disque marqué comme douteux. La reconstruction a lieu d'initiative. J'ai eu à faire face à cela deux fois sur le fameux NAS à 48 disques, sur lequel il y avait quelques spares. C'est juste fabuleux : incident la nuit, reconstruction d'initiative, avec les alarmes automatique. Et ... à 8h30 le lendemain un technicien est là avec un nouveau disque spare. Il suffit d'enlever le disque douteux et de le remplacer et that's all. Le nouveau spare remplace immédiatement l'ancien disque dans la liste.

Alors évidemment, ce système de spare peut être vu comme superflu sauf que "oui mais non". Lorsqu'un disque d'un RAID est à problème, tout le RAID fonctionne en mode "degradé". Suivant, évidemment, le type de RAID les conséquences sont différentes. Sur un RAID 1, on a juste la fragilité en plus et la robustesse en moins. Mais sur un RAID 5 (4, 6 et même le SHR), c'est une autre affaire puisque le contrôleur doit en permanence pallier l'absence du disque manquant.

Et là, c'est une autre affaire, surtout si on a pas de stratégie. Sur mon 2ème NAS, j'avais certes un RAID 5 à 4 disques sans spares ... mais j'avais 2 ou 3 disques de 3 TB de réserve, prêt à être immédiatement inséré. J'ai d'ailleurs du faire la manip pour remplacer une disque dont le nombre de load_cycle_count commençait à sérieusement m'inquiéter !



Messages dans ce sujet
RE: NAS : RAID1 dégradé , disque en "erreur", mais SMART OK ? - par Sethenès - 18-01-2022 19:33:29



Utilisateur(s) parcourant ce sujet : 1 visiteur(s)