De-duplikointi

De-duplikointitekniikalla pyritään säästämään varmistetun data kokonaismäärää poistamalla varmistusdatasta yhteneväiset datablokit, jotka löytyvät jo tallennetuista varmistuksista.

Yhtä oikeaa de-duplikointiratkaisua kaikille ei ole, mutta kaikille löytyy varmasti oikea, jossa MultiComin ja sen kumppaneiden kokemus ja asiantuntemus ovat aina käytettävissä.

Useimmat de-duplikointiin pystyvät varmistusjärjestelmät löytävät duplikaatit jo

varmistettavalta koneelta, eikä niitä siis tarvitse siirtää varmistuspalvelimelle. Samalla myös suurin prosessorikuorma hajautuu varmistettaville palvelimille. Yhteneväisten blokkien etsintä ei rajoitu enää samaan tiedostoon, vaan mikäli sama blokki (esim. firman logo) löytyy sekä Word-dokumentista että PowerPoint-esityksestä, se talletetaan vain kertaalleen varmistuspalvelimen levylle.

Jotta de-duplikointia voi käyttää, on varmistusjärjestelmästä löydyttävä riittävästi prosessointivoimaa. Palauttamisvaiheessa jopa yksittäinen tiedosto on voinut pirstaloitua useaan osaan varmistuspalvelimen levylle tai joissain ratkaisuissa jopa useamman varmistuspalvelimen levyille, mikä luonnollisesti hidastaa palauttamista, etenkin jos palautetaan kokonaisia järjestelmiä.

Erilaisia de-duplikointitekniikoita on lähes mahdotonta asettaa paremmuusjärjestykseen ilman, että vertailussa käytettäisiin samaa data-aineistoa ja samanlaista tiedon tallennusaikakiertoa. De-duplikoinnin tehokkuus eli kapasiteetin säästösuhde voidaan määritellä suhdeluvulla, joka saadaan, kun jaetaan alkuperäinen tietomäärä

todistetusti tallennetulla tietomäärällä sen jälkeen, kun deduplikointi on suoritettu. Usein toimittajat lupaavat suuria, jopa satakertaisia tehokkuuslukuja.

Nyrkkisääntönä voidaan sanoa, että mitä useampia versioita tiedosta on, ja mitä pitempi on niiden sälytysaika, sen parempi on de-duplikoinnin teho.

> Case Kansallisarkisto