Рекомендации по дедупликации

Дедупликация — это сложный процесс, зависящий от многих факторов.

Наиболее важные факторы, влияющие на скорость дедупликации:

Для увеличения производительности дедупликации следуйте рекомендациям ниже.

Размещайте базу данных дедупликации и дедуплицирующее хранилище на отдельных физических устройствах.

Для повышения скорости доступа к базе данных дедупликации база данных и хранилище должны быть расположены на отдельных физических устройствах.

Рекомендуется выделить специальные устройства для хранилища и базы данных. Если это невозможно, по крайней мере не размещайте хранилище или базу данных на диске с операционной системой. При работе операционной системы выполняется большое количество операций чтения/записи на жесткий диск, что существенно замедляет процесс дедупликации.

Выбор диска для базы данных дедупликации

S = (U / 2184) * 2

В этой формуле

S — размер диска в ГБ;

U — планируемый объем уникальных данных в хранилище дедуплицированных данных (ГБ).

Коэффициент 2 означает, что объем свободного пространства на диске должен в два раза превышать размер, занимаемый базой данных.

Например, если планируемый объем уникальных данных в хранилище дедуплицированных данных U = 5 ТБ, для базы данных дедупликации потребуется объем свободного пространства не менее

S = (5*1024 / 2184) * 2 = 4,7 ГБ

Выбор диска для дедуплицирующего хранилища

Для предотвращения потери данных рекомендуется использовать RAID 10, 5 или 6. RAID 0 не рекомендуется, поскольку не является отказоустойчивым. RAID 1 не рекомендуется из-за относительно низкой скорости. Можно использовать как локальные диски, так и SAN.

128 МБ ОЗУ на 1 ТБ уникальных данных

Если проблем с производительностью дедупликации нет, следовать ей необязательно. Однако если дедупликация выполняется слишком медленно, то путем добавления ОЗУ для узла хранения можно значительно повысить ее скорость.

Одно дедуплицирующее хранилище на каждый узел хранения

Настоятельно рекомендуется создавать только одно дедуплицирующее хранилище на узле хранения. В противном случае весь доступный объем ОЗУ будет распределен пропорционально количеству хранилищ.

64-разрядная операционная система

Узел хранения должен быть установлен в 64-разрядной операционной системе. На машине с узлом хранения не должны быть запущены приложения, требующие большого количества системных ресурсов, например, системы управления базами данных (СУБД) или системы планирования ресурсов предприятия (ERP).

Многоядерный процессор с тактовой частотой не менее 2,5 ГГц

Рекомендуется использовать процессор с количеством ядер не менее 4 и тактовой частотой не менее 2,5 ГГц.

Достаточное свободное пространство в хранилище

Для индексирования резервной копии требуется столько же свободного пространства, сколько занимают данные резервной копии сразу после сохранения в хранилище. Без выполнения сжатия или дедупликации в источнике это значение равно размеру исходных данных, резервная копия которых создана во время данной операции резервного копирования.

Высокоскоростная локальная сеть

Рекомендуется скорость локальной сети 1 Гбит. Это позволит программе выполнить 5–6 операций резервного копирования параллельно с дедупликацией без заметного снижения скорости.

Выполните резервное копирование типичной машины перед резервным копированием нескольких машин со сходным содержимым.

При резервном копировании нескольких машин со сходным содержимым рекомендуется сначала выполнить резервное копирование одной машины и подождать завершения индексирования данных резервной копии. После этого резервное копирование остальных машин будет выполняться быстрее за счет эффективной дедупликации. Поскольку резервная копия первой машины была проиндексирована, большая часть данных уже находится в хранилище дедуплицированных данных.

Выполняйте резервное копирование разных машин в разное время.

При резервном копировании большого количества машин распределите операции резервного копирования по времени. Для этого необходимо создать несколько планов резервного копирования с различными расписаниями.

Использование быстрой каталогизации

Индексирование резервной копии начинается после завершения ее каталогизации. Для уменьшения общего времени обработки резервной копии переведите автоматическую каталогизацию в режим быстрой каталогизации. Вы можете запустить полную каталогизацию вручную вне окна резервного копирования.

Настройте уведомления об оповещениях

Рекомендуется настроить уведомление об оповещениях «Хранилища» в параметрах сервера управления. Это позволит вам оперативно реагировать в нестандартных ситуациях. К примеру, своевременная реакция на оповещение «Обнаружено хранилище с недостаточным объемом свободного пространства» может предотвратить ошибку при следующем резервном копировании в это хранилище.