重複資料刪除最佳作法

重複資料刪除是一項取決於許多因素的複雜程序。

以下為影響重複資料刪除速度的最重要因素:

  • 存取重複資料刪除資料庫的速度
  • 儲存節點的 RAM 容量
  • 在儲存節點上建立的重複資料刪除位置數量。

若要提高重複資料刪除效能,請參考以下建議。

將重複資料刪除資料庫和重複資料刪除位置放在不同的實體裝置上

重複資料刪除資料庫會儲存儲藏庫中所儲存全部項目的雜湊值,但無法進行重複資料刪除的項目除外,例如加密的檔案。

若要提高重複資料刪除資料庫的存取速度,資料庫和位置必須位於不同的實體裝置上。

最佳作法是分別為位置和資料庫配置專用的裝置。如果無法這麼做,至少避免將位置或資料庫放在與作業系統相同的磁碟上。原因在於,作業系統會執行大量硬碟讀寫作業,這會大幅減慢重複資料刪除速度。

選擇重複資料刪除資料庫的磁碟

  • 資料庫必須位於固定式磁碟機上。請勿嘗試將重複資料刪除資料庫置於外部可卸離式磁碟機上。
  • 若要將資料庫的存取時間減至最少,請將其儲存在直接連接的磁碟機上,而非儲存在掛載的網路磁碟區上。網路延遲可能會大幅降低重複資料刪除效能。
  • 您可以透過以下公式估算重複資料刪除資料庫所需的磁碟空間:

S = U * 90 / 65536 + 10

其中,

S 是磁碟大小 (GB)

U 是重複資料刪除資料存放區中預計會存放的唯一資料量 (GB)

例如,如果重複資料刪除資料存放區中預計會存放 U=5 TB 的唯一資料量,則重複資料刪除資料庫需要的可用空間至少為:

S = 5000 * 90 / 65536 +10 = 17 GB

選擇重複資料刪除位置的磁碟

為避免資料遺失,建議使用 RAID 10、5 或 6。不建議使用 RAID 0,因為該設定不容錯。不建議使用 RAID 1,因其速度較慢。本機磁碟或 SAN,兩者均可使用。

每 1 TB 的唯一資料,40 至 160 MB 的 RAM

當達到此限制值時,重複資料刪除將會停止,但備份和復原將會繼續工作。若要向儲存節點新增更多 RAM,在下一次備份之後,重複資料刪除將會回復。一般而言,擁有的 RAM 越多,您可以儲存的唯一資料量就越多。

每個儲存節點上只有一個重複資料刪除位置

強烈建議您在一個儲存節點上僅建立一個重複資料刪除位置。否則,所有可用的 RAM 磁碟區可能會按照位置的數量等比例分配。

缺乏競爭資源的應用程式

具有儲存節點的電腦不應執行需要很多系統資源的應用程式,例如資料庫管理系統 (DBMS) 或企業資源規劃 (ERP) 系統。

多核心處理器,具備至少 2.5 GHz 的時脈

建議您使用至少 4 核心、時脈至少 2.5 GHz 的處理器。

位置中有足夠的可用空間

儲存至位置後,在目標端進行重複資料刪除作業所需的可用空間,和備份資料佔用的空間一樣大。若不在來源端進行壓縮或重複資料刪除,這個數值會等於在備份作業期間備份的原始資料大小。

高速 LAN

建議使用 1-Gbit 的 LAN。這可讓軟體同時執行 5-6 個含重複資料刪除的備份作業,且速度不會大幅減慢。

備份多部內容相似的電腦之前,先備份一部具有代表性的電腦

備份內容相似的多台電腦之前,建議您先備份一台電腦,並等候備份資料編列索引完畢。之後,由於重複資料刪除的效率提高,因此其他電腦的備份速度便可加快。由於第一部電腦的備份已編列索引,因此大多數資料已進入重複資料刪除資料儲存區。

在不同時間備份不同的電腦

如果您備份大量電腦,請將備份作業分散到不同的時間執行。方法是,建立多個不同排程的保護計劃。