Обзор

Дедупликация — уменьшение объема, занимаемого хранимыми данными, путем выявления повторяющихся идентичных данных и сохранения их только один раз.

Благодаря дедупликации также можно снизить загруженность сети: если во время резервного копирования обнаружится, что блок данных является дубликатом уже сохраненных, его содержимое не передается по сети.

Acronis Backup выполняет дедупликацию резервных копий, сохраненных в управляемом хранилище, если дедупликация была включена при создании хранилища. Хранилище с включенной дедупликацией называется дедуплицирующим хранилищем.

Дедупликация выполняется над блоками данных. Размер блока составляет 4 КБ для резервных копий на уровне диска и от 1 Б до 256 КБ для резервных копий на уровне файлов. Файл размером менее 256 КБ считается блоком данных. Файлы размером более 256 КБ делятся на блоки по 256 КБ.

Acronis Backup выполняет дедупликацию в два этапа.

Дедупликация в источнике

Выполняется на управляемой машине во время резервного копирования. Агент использует узел хранения для определения данных, которые можно дедуплицировать, и не переносит блоки данных, копии которых уже есть в хранилище.

Дедупликация в месте назначения

Выполняется в хранилище после завершения резервного копирования. Узел хранения анализирует содержимое хранилища и дедуплицирует данные в хранилище.

При создании плана резервного копирования можно отключить для этого плана дедупликацию в источнике. Таким образом сокращается время резервного копирования, но увеличивается нагрузка на сеть и узел хранения.

База данных дедупликации

Узел хранения Acronis Backup, который управляет дедуплицирующим хранилищем, содержит базу данных дедупликации, включающую хэш-значения всех блоков данных в хранилище, кроме тех, которые не могут быть дедуплицированы, например зашифрованных файлов.

База данных дедупликации хранится в локальной папке на узле хранения. При создании хранилища можно указать путь к базе данных.

Размер базы данных дедупликации составляет около 1,5 % от общего объема уникальных данных в хранилище. Другими словами, каждый терабайт новых данных (не дубликатов) добавляет около 15 ГБ к базе данных.

Если в случае повреждения базы данных или потери узла хранения, но при сохранении содержимого хранилища, новый узел хранения повторно сканирует хранилище и воссоздает базу данных хранилища, а затем базу данных дедупликации.