Обновление DC-системы

: Перед обновлением системы выполните требования и ознакомьтесь с ограничениями, указанными в главе Требования и ограничения.
  1. Общая подготовка узлов к обновлению.

    1. Сохраните файлы конфигурации raidixcfg.json, выполнив на каждом узле:

      $ scp /var/lib/raidix/raidixcfg.json [<user>@]<host>[:<path>]
    2. Если вы используете SAN, проверьте на инициаторах видимость LUN и состояние multipath-путей.
    3. Убедитесь, что текущие дата и время на каждом узле актуальны:

      $ rdcli param time show
    4. Убедитесь, что сеть heartbeat настроена:

      $ rdcli dc show

      Значение «heartbeat» должно быть 1.

    5. Если синхронизация кэшей RAID настроена по InfiniBand, включите поддержку iSCSI:

      $ rdcli iscsi modify -e 1
      : В RAIDIX 5.2.5 для работы синхронизации по IB требуется включенная функция поддержки iSCSI.
    6. Для больших (более 24 дисков, более 150 ТБ) высоконагруженных систем установите таймаут восстановления объектов, равным 1800 + [количество активных RAID на узле] * 1080, выполнив на каждом узле команду

      $ rdcli system settings modify --restore_timeout <time>
    7. Если вы используете SSD-кэш, отключите его на время обновления на каждом узле:

      : После обновления SSD-кэш необходимо настроить заново. Перед отключением убедитесь, что у вас есть информация о конфигурации SSD-кэша.
      • Если SSD-кэш используется для чтения и записи:

        $ rdcli ssdcache delete --name <ssd_cache_name> --force_wait
        : Если перед отключением в SSD-кэше находились данные, которые не были сброшены на основной RAID, то отключение SSD-кэша может занять продолжительное время из-за сброса кэшированных данных.
      • Если SSD-кэш используется в режиме Только для чтения:

        $ rdcli ssdcache delete --name <ssd_cache_name>
  2. Обновление первого узла системы.

    1. Обновите узел:

      : В зависимости от объёма хранилища и количества LUN обновление может занять продолжительное время: до 4 часов при 40-80 LUN.
      $ scp [<user>@]host:[<path>]rdx-patch-default-5.2.4-5.2.5-*.rpk ~/
      $ rdupdate ~/rdx-patch-default-5.2.4-5.2.5-*.rpk
      : Не отключайте питание и не перезагружайте систему во время обновления.

      Во время обновления узел будет автоматически перезагружен 1–2 раза.

      После перезагрузки, для отслеживания прогресса обновления используйте команду

      $ tail -f /var/log/raidix/update.log

      По завершении обновления узла в update.log появится строка «Update completed successfully» с меткой времени.

    2. Убедитесь в наличии сети heartbeat:

      $ rdcli dc show

      Значение «heartbeat» должно быть 1.

    3. Если вы используете SAN, проверьте на инициаторах видимость LUN и состояние multipath-путей.

    4. При необходимости, выполните повторное сканирование дисков:

      • для Windows-систем: Управление дисками > Действие > Повторить проверку дисков (Disk Management > Action > Rescan Disks);
      • для Linux-систем выполните повторное сканирование SCSI-шины:

        # echo '- - -' > /sys/class/scsi_host/host<num>/scan

        <num> можно определить через вывод команды # lsscsi -H;

      • для ESXi: Storage > Adapters > Rescan.

  3. Обновление второго узла системы.

    Выполните шаг 2 на втором (необновлённом) узле.

  4. Завершение обновления.

    1. Если у вас была настроена синхронизация кэшей RAID, проверьте синхронизацию и, при необходимости, восстановите её.

      Чтобы проверить синхронизацию, на каждом узле:

      1. выполните

        $ rdcli dc show
      2. убедитесь, что параметр targets отображается вместе с корректным значением.

      При необходимости, вы можете восстановить синхронизацию следующим образом:

      1. Откройте bash на узле, который был обновлён первым. Выполните на этом узле следующие скрипты:
      2. Чтобы восстановить настройки синхронизации текущего узла, выполните

        /tmp/raid-sync-on-after-update-local

        Чтобы восстановить настройки синхронизации удалённого узла, выполните

        /tmp/raid-sync-on-after-update-remote
    2. При необходимости, выполните обратное переключение узлов (failback) на нужном узле:

      $ rdcli dc failback
    3. Если вы меняли таймаут восстановления объектов на шаге 1.f, верните предыдущее значение или установите значение по умолчанию (2400).
    4. Если вы отключали SSD-кэш на шаге 1.g, настройте его заново (подробнее в документах «Руководство администратора RAIDIX 5.2.5» и «Справочник CLI RAIDIX 5.2.5».