HASLab/INESC TEC explora técnica de deduplicação para solucionar problemas na ‘cloud’
O artigo “A survey and classification of storage deduplication systems”, dos investigadores do Laboratório de Software Confiável (HASLab) do INESC TEC João Paulo e José Pereira, apresenta uma abordagem inovadora ao conceito de deduplicação e à sua utilização em serviços na cloud. O trabalho foi publicado recentemente na revista internacional com o maior fator de impacto na área de ciências da computação, a ACM Computing Surveys.
A quantidade de informação digital produzida em todo o mundo está a crescer de forma exponencial, atingindo valores superiores aos previstos. Paralelamente, com o aparecimento dos serviços de computação em nuvem, a informação de diferentes utilizadores deixou de ser guardada apenas nos seus computadores pessoais e passou a ser armazenada remotamente por empresas. É, por isso, fundamental para estas empresas encontrar formas eficientes e de custo reduzido, que possibilitem acomodar esta explosão de informação digital.
A deduplicação surge como uma das respostas a este desafio, permitindo eliminar informação duplicada (vídeos, músicas, entre outros) pertencente a diferentes utilizadores. Estudos recentes mostram que, usando deduplicação, é possível reduzir até 80% a quantidade de informação armazenada em infraestruturas de computação em nuvem. A informação repetida é eliminada de forma automática e transparente para quem usa o serviço, ou seja, cada pessoa continua a aceder aos seus documentos sem notar que existe apenas uma única cópia partilhada.
O artigo apresentado pelos investigadores do HASLab/INESC TEC descreve em detalhe o conceito, revê os sistemas e algoritmos de deduplicação existentes apresentando uma nova classificação. São ainda discutidos novos cenários de aplicação desta técnica e os desafios para a melhorar.
Os investigadores com ligação ao INESC TEC referidos nesta notícia têm vínculo à seguinte entidade parceira: U.Minho.