Deduplicação

Written by Hugo Nunes on Fevereiro 3rd, 2010

Apesar de não existir em Português, a palavra deduplicação (tradução aportuguesada da palavra inglesa deduplication) é utilizada para descrever o processo de eliminação de dados duplicados. Esta tecnologia está a ser adoptada com grande sucesso por diversas soluções de storage e de backups (entre outras), tendo como objectivo a redução do espaço físico ocupado pelos dados.

A deduplicação pode ser utilizada a nível de ficheiros, blocos ou bytes e uma explicação pouco técnica poderá ser descrita como: para eliminar dados redundantes, essa técnica guarda uma única cópia de dados idênticos e substitui todas as outras por indicadores que apontam para essa cópia.

Para efectuar esta tarefa toda a informação tem uma assinatura (checksum) e através da comparação dessa identificação o “software” verifica a existência de informação duplicada e substitui-a por um apontador.

Não se tratando de uma tecnologia nova, existindo pelo menos desde 2003, só agora é que os fornecedores de storage, sistemas operativos, soluções de backup e outros softwares começam a elevar esta tecnologia para o nível enterprise ready. Poderíamos pensar que esta tecnologia não seria bem recebida pelos fornecedores de storage, porque afinal de contas podemos estar a falar em reduções da informação física que podem chegar a 1/10 do tamanho ocupado “tradicionalmente” (valor muito variável dependendo do nível da deduplicação e do tipo de informação que estejamos a falar), mas a maioria dos players tem visto nesta tecnologia uma forma de vender mais, publicitando o  “guarde mais com o mesmo espaço físico” e “reduza a duplicação de dados”, “reduza o tempo o tempo de backup”, etc.

Claro que nem tudo são vantagens, e esta tecnologia tem os seus problemas, podendo até dizer-se que a deduplicação reduz a redundância!

Prevejo no entanto que esta tecnologia tenha um crescimento considerável e será abraçada por cada vez mais fornecedores de hardware, software e SOs, que desenvolverão muitas mais soluções utilizando esta tecnologia.

Deduplicação: Sem dúvida uma nova palavra a ter em atenção.

Deduplication

7 Comments so far ↓


  1. 4
    4:21
    PM
    André Restivo

    Não quererás dizer “desduplicação”, palavra que existe em Português.


  2. 4
    5:08
    PM
    Hugo Nunes

    Desconheço a existência em PT-pt da palavra desduplicação, e o termo que os fornecedores têm usado é a deduplicação… que vem do inglês “dedupe” ou “deduplication”.


  3. 5
    11:21
    AM

  4. 5
    2:22
    PM
    Hugo Nunes

    O autor do Blog TI + I é brasileiro, logo podes estar a lêr uma tradução “abrasileirada”.
    Até na página da NetApp (http://www.netapp.com/br/products/platform-os/dedupe-pt.html) fala em deduplicação, mas como a palavra não existe o correcto será para já falar mesmo só em ‘data deduplication’ ou ‘dedupe’.


  5. 7
    1:09
    AM
    BUGabundo

    Nunes tens q perguntar às moças q tao por trás de ti.
    elas devem saber :D


  6. 9
    1:56
    AM
    Ricardo Costa

    Sempre que aparece uma nova tecnologia, há o problema da tradução do termo. Deduplication é um termo composto de “DE” (negação) e “DUPLICATION” (duplicação). Em Português (pelo menos o BR), o termo “DES” é o mais próximo do termo “DE” do Inglês. Por exemplo: DETOX = DESINTOXICAR. Portanto DEDUPLICATE = DESDUPLICAR. Por se tratar de uma aproximação a um neologismo, existe o termo na linguagem peculiar à área técnica (apesar de poder não existir na língua oficial). Temos vários exemplos disso em TI. Por outro lado, traduzir como DEDUPLICAR não é muito correto primeiro por causa do prefixo “DE” (que não tem significado prático na nossa língua) e também pelo fato de DEDUPLICAR ser semelhante a DECUPLICAR (que é multiplicar por 10). Dessa forma, o termo DESDUPLICAR é o mais perto do correto em Português e DEDUPLICAR é o “aportuguesamento” de um neologismo em Inglês. Espero ter ajudado! Abraços e obrigado pela referência ao meu site!


  7. 9
    2:00
    AM
    Ricardo Costa

    Aproveitando, é verdade que muitos fabricantes (como a NetApp) fazem apenas o aportuguesamento do termo DEDUPLICATE para DEDUPLICAR.

Spruce up your comments with
<a href="" title=""><abbr title=""><acronym title=""><b><blockquote cite=""><cite><code><del datetime=""><em><i><q cite=""><strike><strong>
New comments are moderated before being shown * = required field

Leave a Comment




*