NAS для офисных бэкапов: рекомендации по архитектуре и настройке

Цель

Организовать дополнительный слой резервного копирования в офисе:

production находится в облаке
офисный NAS хранит копии бэкапов, доставляемые через IPsec
в облаке уже есть snapshot’ы VM (второй слой)
в будущем возможна установка второго NAS

NAS используется только для бэкапов. Высокая производительность не требуется.

RAID / ZFS: выбор конфигурации

Рекомендация: RAIDZ2 (эквивалент RAID6)

Если используется ZFS (TrueNAS или другой ZFS-стек), для массива из 4 дисков рекомендуется:

RAIDZ2 (двойная четность)
выдерживает отказ 2 дисков

Причины выбора:

NAS хранит критичный слой резервных копий
в реальности диск может отказать во время ресильвера
для бэкапного сценария важнее устойчивость, чем максимальная ёмкость

RAIDZ1 допускается, но не рекомендуется

RAIDZ1 (аналог RAID5) возможен, если:

NAS — не единственный слой бэкапов
приоритет — полезная ёмкость

Недостаток:

выдерживает только 1 отказ диска
выше риск потери массива при деградации и ресильвере

RAID10 не требуется

RAID10 ориентирован на IOPS и предсказуемую производительность, что не является целью для бэкапного NAS.

Диски

Требования

использовать CMR-диски (не SMR)
желательно NAS/Enterprise линейки
одинаковый объём и по возможности одинаковые модели

Сеть

Подключение

NAS гигабитный, 2 порта, поддерживает LACP

Что даёт LACP

не увеличивает скорость одного потока (одной копии)
увеличивает суммарную пропускную способность при нескольких параллельных клиентах

Для ежедневных бэкапов 1 GbE обычно достаточно.

Протоколы доступа (NAS как storage)

Что не рекомендуется

iSCSI LUN как хранилище для VM-дисков (если нет явной причины)
для бэкапов проще и безопаснее использовать файловую шару

Доставка бэкапов из облака в офис

Так как production в облаке, а NAS в офисе, доставка идёт через IPsec.

Рекомендуемый способ: dump локально → rsync в NAS

Алгоритм:

на production (в облаке) создаётся дамп в локальную директорию (на диск VM)
после успешного завершения дампа выполняется доставка в NAS:
- rsync over SSH (предпочтительно)
- либо копирование в NFS/SMB share
после успешной доставки локальный дамп удаляется

Причины:

запись дампа напрямую в сетевую шару через туннель менее надёжна
при обрыве туннеля можно получить неполный или повреждённый файл
rsync обеспечивает корректное возобновление передачи и проверку

Альтернатива: dump в S3 → офис делает pull

Если есть объектное хранилище:

production пишет дампы в S3
офисный сервер/PBS/NAS забирает данные по расписанию (pull)

Преимущество:

офис не зависит от стабильности туннеля в момент дампа
проще масштабировать и хранить промежуточные копии

Retention policy (рекомендуемая)

Цель: хранить достаточно точек восстановления без чрезмерного расхода диска.

Базовая политика

daily: 7 дней (каждый день за текущую неделю)
weekly: 8 недель (примерно 2 месяца)

Итого ~15 точек восстановления.

Мониторинг

Используется существующий стек:

Prometheus + Grafana
Vector (или эквивалент)

Что обязательно мониторить

SMART:
- reallocated sectors
- pending sectors
- UDMA CRC errors
- температура дисков
состояние массива/пула
заполнение пула/тома
ошибки чтения/записи

ZFS maintenance (если используется ZFS)

Scrub

запуск scrub: 1 раз в месяц (или раз в 2–4 недели)

Свободное место

держать свободными минимум 20% пула
рекомендуется 25–30%

NAS для офисных бэкапов: рекомендации по архитектуре и настройке

Цель

Рекомендуемая схема

Компоненты

Почему PBS отдельно

RAID / ZFS: выбор конфигурации

Рекомендация: RAIDZ2 (эквивалент RAID6)

RAIDZ1 допускается, но не рекомендуется

RAID10 не требуется

Диски

Требования

Рекомендация по запасу

Сеть

Подключение

Что даёт LACP

Протоколы доступа (NAS как storage)

Рекомендуемый вариант

Что не рекомендуется

Доставка бэкапов из облака в офис

Рекомендуемый способ: dump локально → rsync в NAS

Альтернатива: dump в S3 → офис делает pull

Retention policy (рекомендуемая)

Базовая политика

Рекомендация (опционально)

Мониторинг

Что обязательно мониторить

ZFS maintenance (если используется ZFS)

Scrub

Свободное место

Рекомендованная итоговая конфигурация

Цель​

Рекомендуемая схема​

Компоненты​

Почему PBS отдельно​

RAID / ZFS: выбор конфигурации​

Рекомендация: RAIDZ2 (эквивалент RAID6)​

RAIDZ1 допускается, но не рекомендуется​

RAID10 не требуется​

Диски​

Требования​

Рекомендация по запасу​

Сеть​

Подключение​

Что даёт LACP​

Протоколы доступа (NAS как storage)​

Рекомендуемый вариант​

Что не рекомендуется​

Доставка бэкапов из облака в офис​

Рекомендуемый способ: dump локально → rsync в NAS​

Альтернатива: dump в S3 → офис делает pull​

Retention policy (рекомендуемая)​

Базовая политика​

Рекомендация (опционально)​

Мониторинг​

Что обязательно мониторить​

ZFS maintenance (если используется ZFS)​

Scrub​

Свободное место​

Рекомендованная итоговая конфигурация​

Цель

Рекомендуемая схема

Компоненты

Почему PBS отдельно

RAID / ZFS: выбор конфигурации

Рекомендация: RAIDZ2 (эквивалент RAID6)

RAIDZ1 допускается, но не рекомендуется

RAID10 не требуется

Диски

Требования

Рекомендация по запасу

Сеть

Подключение

Что даёт LACP

Протоколы доступа (NAS как storage)

Рекомендуемый вариант

Что не рекомендуется

Доставка бэкапов из облака в офис

Рекомендуемый способ: dump локально → rsync в NAS

Альтернатива: dump в S3 → офис делает pull

Retention policy (рекомендуемая)

Базовая политика

Рекомендация (опционально)

Мониторинг

Что обязательно мониторить

ZFS maintenance (если используется ZFS)

Scrub

Свободное место

Рекомендованная итоговая конфигурация