SDC
Введение
Скрытое повреждение данных (англ. Silent Data Corruption, SDC) - повреждение данных на дисках, которое невозможно обнаружить без контроля целостности данных. Такое повреждение и последующие ошибки чтения/записи возникают, когда компонент системы хранения, получения или передачи данных перестаёт работать ожидаемо, но изменения в работе компонента остаются незамеченными.
Для защиты данных от SDC в ERA используется функция контроля целостности данных – SDC DnC (SDC Detection and Correction). RAID с контрольными суммами использует избыточные данные для проверки целостности, что позволяет обнаруживать и исправлять SDC на дисках этого RAID.
Ограничения и особенности SDC DnC
Общие:
-
Для запуска SDC DnC:
- Инициализация RAID должна быть завершена.
- RAID не должен находиться в состоянии рестрайпинга.
- RAID не должен находиться в состоянии реконструкции.
- Доступно только ручное управление функцией SDC DnC.
- Во время работы SDC DnC возможно уменьшение производительности до 50% на RAID, используемом в NAS.
Обнаружение:
- Возможные уровни RAID: 5, 6, 7, 50, 60, 70.
-
Допустимое количество отсутствующих дисков в RAID:
- RAID 5, 6, 50, 60: 0
- RAID 7, 70: 0 или 1 в RAID-группе
Исправление:
- Возможные уровни RAID: 6, 7, 60, 70.
-
Допустимое количество отсутствующих дисков в RAID:
- RAID 5, 6, 50, 60: 0
- RAID 7, 70: 0 или 1 в RAID-группе
- Не более 1 стрипа с SDC в страйпе.
Управление функцией SDC DnC
Вы можете управлять SDC DnC следующими командами:
-
Запуск SDC DnC:
# eracli raid sdc start
Опция подкоманды
sdc start
:Табл. 1. Опция подкоманды sdc start
Обязательная опция
-n
--name
Имя RAID.
-
Приостановка SDC DnC:
# eracli raid sdc pause
Опция подкоманды
sdc pause
:Табл. 2. Опция подкоманды sdc pause
Обязательная опция
-n
--name
Имя RAID.
-
Остановка SDC DnC:
# eracli raid sdc stop
Опция подкоманды
sdc stop
:Табл. 3. Опция подкоманды sdc stop
Обязательная опция
-n
--name
Имя RAID.
Просмотр результатов
Результат работы SDC DnC фиксируется в
- информации о RAID (в выводе команды
# eracli raid show
); - почтовых уведомлениях (подробнее о настройке уведомлений см. главу Настройка почтовых уведомлений).
Чтобы увидеть результат работы SDC DnC в информации о RAID, выполние
# eracli raid show -n <имя_RAID>
В поле info
отображается следующая информация о SDC DnC:
- sdc_progress - прогресс выполнения SDC DnC в процентах;
- recovered_sdc - количество исправленных SDC;
- unrecoverable_sdc - количество неисправимых SDC.
sdc_progress
и recovered_sdc
отображаются только при запущенной функции SDC DnC и не сохраняются после выключения функции.Почтовые уведомления отправляются следующим образом:
- После нахождения первой SDC и попытки её исправления отправляется информация о результате исправления этой SDC.
- Если сначала были найдены исправимые SDC, а потом первая неисправимая SDC, то отправляется информация о найденной неисправимой SDC.
Принудительное возвращение RAID в онлайн
Вы можете использовать опцию force_online_sdc
в команде raid modify
, которая запустит SDC DnC на RAID перед возвращением его в онлайн.
Подробное описание опции см. в главе Изменение параметров RAID.
Пример:
# eracli raid modify -n <имя_RAID> --force_online_sdc --force