SDC

Введение

Скрытое повреждение данных (англ. Silent Data Corruption, SDC) - повреждение данных на дисках, которое невозможно обнаружить без контроля целостности данных. Такое повреждение и последующие ошибки чтения/записи возникают, когда компонент системы хранения, получения или передачи данных перестаёт работать ожидаемо, но изменения в работе компонента остаются незамеченными.

Для защиты данных от SDC в ERA используется функция контроля целостности данных – SDC DnC (SDC Detection and Correction). RAID с контрольными суммами использует избыточные данные для проверки целостности, что позволяет обнаруживать и исправлять SDC на дисках этого RAID.

Ограничения и особенности SDC DnC

Общие:

  • Для запуска SDC DnC:

    • Инициализация RAID должна быть завершена.
    • RAID не должен находиться в состоянии рестрайпинга.
    • RAID не должен находиться в состоянии реконструкции.
  • Доступно только ручное управление функцией SDC DnC.
  • Во время работы SDC DnC возможно уменьшение производительности до 50% на RAID, используемом в NAS.

Обнаружение:

  • Возможные уровни RAID: 5, 6, 7, 50, 60, 70.
  • Допустимое количество отсутствующих дисков в RAID:

    • RAID 5, 6, 50, 60: 0
    • RAID 7, 70: 0 или 1 в RAID-группе

Исправление:

  • Возможные уровни RAID: 6, 7, 60, 70.
  • Допустимое количество отсутствующих дисков в RAID:

    • RAID 5, 6, 50, 60: 0
    • RAID 7, 70: 0 или 1 в RAID-группе
  • Не более 1 стрипа с SDC в страйпе.

Управление функцией SDC DnC

Вы можете управлять SDC DnC следующими командами:

  • Запуск SDC DnC:

    # eracli raid sdc start

    Опция подкоманды sdc start:

    Табл. 1. Опция подкоманды sdc start

    Обязательная опция

    -n

    --name

    Имя RAID.

  • Приостановка SDC DnC:

    # eracli raid sdc pause

    Опция подкоманды sdc pause:

    Табл. 2. Опция подкоманды sdc pause

    Обязательная опция

    -n

    --name

    Имя RAID.

  • Остановка SDC DnC:

    # eracli raid sdc stop

    Опция подкоманды sdc stop:

    Табл. 3. Опция подкоманды sdc stop

    Обязательная опция

    -n

    --name

    Имя RAID.

Просмотр результатов

Результат работы SDC DnC фиксируется в

Чтобы увидеть результат работы SDC DnC в информации о RAID, выполние

# eracli raid show -n <имя_RAID>

В поле info отображается следующая информация о SDC DnC:

  • sdc_progress - прогресс выполнения SDC DnC в процентах;
  • recovered_sdc - количество исправленных SDC;
  • unrecoverable_sdc - количество неисправимых SDC.
: Значения sdc_progress и recovered_sdc отображаются только при запущенной функции SDC DnC и не сохраняются после выключения функции.

Почтовые уведомления отправляются следующим образом:

  • После нахождения первой SDC и попытки её исправления отправляется информация о результате исправления этой SDC.
  • Если сначала были найдены исправимые SDC, а потом первая неисправимая SDC, то отправляется информация о найденной неисправимой SDC.

Принудительное возвращение RAID в онлайн

Вы можете использовать опцию force_online_sdc в команде raid modify, которая запустит SDC DnC на RAID перед возвращением его в онлайн. Подробное описание опции см. в главе Изменение параметров RAID.

Пример:

# eracli raid modify -n <имя_RAID> --force_online_sdc --force