Deduplicação

Apesar de não existir em Português, a palavra deduplicação (tradução aportuguesada da palavra inglesa deduplication) é utilizada para descrever o processo de eliminação de dados duplicados. Esta tecnologia está a ser adoptada com grande sucesso por diversas soluções de storage e de backups (entre outras), tendo como objectivo a redução do espaço físico ocupado pelos dados.

A deduplicação pode ser utilizada a nível de ficheiros, blocos ou bytes e uma explicação pouco técnica poderá ser descrita como: para eliminar dados redundantes, essa técnica guarda uma única cópia de dados idênticos e substitui todas as outras por indicadores que apontam para essa cópia.

Para efectuar esta tarefa toda a informação tem uma assinatura (checksum) e através da comparação dessa identificação o “software” verifica a existência de informação duplicada e substitui-a por um apontador.

Não se tratando de uma tecnologia nova, existindo pelo menos desde 2003, só agora é que os fornecedores de storage, sistemas operativos, soluções de backup e outros softwares começam a elevar esta tecnologia para o nível enterprise ready. Poderíamos pensar que esta tecnologia não seria bem recebida pelos fornecedores de storage, porque afinal de contas podemos estar a falar em reduções da informação física que podem chegar a 1/10 do tamanho ocupado “tradicionalmente” (valor muito variável dependendo do nível da deduplicação e do tipo de informação que estejamos a falar), mas a maioria dos players tem visto nesta tecnologia uma forma de vender mais, publicitando o  “guarde mais com o mesmo espaço físico” e “reduza a duplicação de dados”, “reduza o tempo o tempo de backup”, etc.

Claro que nem tudo são vantagens, e esta tecnologia tem os seus problemas, podendo até dizer-se que a deduplicação reduz a redundância!

Prevejo no entanto que esta tecnologia tenha um crescimento considerável e será abraçada por cada vez mais fornecedores de hardware, software e SOs, que desenvolverão muitas mais soluções utilizando esta tecnologia.

Deduplicação: Sem dúvida uma nova palavra a ter em atenção.

Deduplication