Jakie wyróżniamy typy deduplikacji?
10 Oct 2016
Przeczytaj w 4 minuty
Poprzedni wpis zakończyliśmy obietnicą szerszej opowieści na temat deduplikacji i jej rodzajów. Nie przedłużając zmierzamy do meritum i na początek opowiemy czym jest deduplikacja w miejscu docelowym.
W trakcie deduplikacji w miejscu docelowym, kopiujesz swoje dane do określonego miejsca na serwerze. Procesor przechowywania identyfikuje duplikaty danych oraz zachowuje tylko jedną kopię, kasując wszystkie pozostałe kopie. Jeśli potrzebujesz konkretnych danych znajdziesz je tylko jednym miejscu i w jednej kopii.
Deduplikacja w miejscu docelowym może być wykonywana zarówno w trybie online jak również w trybie offline. W przypadku deduplikacji nowe dane są odbierane przez procesor podczas przechowywania, a "odcisk" danych jest w porównywany z istniejącymi danymi w czasie rzeczywistym. Jeśli te same dane są już skopiowane to są pomijane. W trybie offline, dane są najpierw kopiowane do miejsca docelowego, skanowane w trybie offline, a następnie usuwa się zduplikowane dane i zachowuje tylko jedną kopię.
Wyobraźcie sobie, że trzymacie w szafie trzy identyczne koszule, a…nosicie tylko jedną z nich. Przecież zaoszczędzone miejsce można wykorzystać w o wiele bardziej racjonalny sposób!Rozważmy jednak sytuację, w której na urządzeniach pracujących w waszej organizacji znajduje się wiele kopii pliku, a każdy nieco różni się od pozostałych (na przykład pliki, na których prowadzone są w tej chwili prace ). Używając deduplikacji w miejscu docelowym, każde urządzenie skopiuje swoją wersję pliku na warstwie sieciowej do pamięci zapasowej. Niezależnie od tego czy deduplikacja odbywa się w trybie online czy offline, procesor składowania w magazynie kopii zapasowych będzie skanować te pliki, by znaleźć unikalne treści i usunąć wszystkie duplikaty zachowując jedną kopię danych. Jednak może to stworzyć poważne trudności w związku z faktem, że każda wersja pliku musi być przesłana i rozpoznana przez sieć. To proces wysoce nieefektywny pod względem przepustowości, ale efekt końcowy gwarantuje, że pliki będą prawidłowo posortowane i zabezpieczone. A co jeśli moglibyśmy ustalić czy dane zostały już zapisane przed kopiowaniem, a nie wysyłać ich w ciemno? Taka metoda nazywa się metodą deduplikacji u źródła.