Resumos Aceitos

XXXVI Encontro de Iniciação Científica

TÉCNICAS DE PRESERVAÇÃO DE PRIVACIDADE PARA GRANDES VOLUMES DE DADOS

Resumo:
Codificação:	5107
Área:	Ciência da Computação
Orientador:	Javam de Castro Machado
Autor Principal:	ISRAEL DE CASTRO VIDAL
Co-Autores:	Javam de Castro Machado
	Francisco Daniel Bezerra de Souza Praciano



Apresentação:	Oral Dia: 09 Hora: 14h Sala: 56 Local: Unid.de Apoio a Pesq.- Bloco: 953, Térreo
Identificação:
O conceito de privacidade está relacionado ao interesse em que as pessoas têm em manter um espaço pessoal, sem interferências de outras pessoas ou organizações. Pessoas e organizações publicam dados na Web que podem levar à violação de privacidade delas mesmas ou de terceiros, sem mesmo ser esse o interesse daquele que publica. Técnicas modernas de mineração de dados podem associar dados de diversas fontes ou mesmo encontrar informações relevantes em um grande volume de dados publicados e assim violar a privacidade. Algoritmos de anonimização de dados, organizados em modelos de privacidade que incluem igualmente as estratégias de ataque aos dados, podem ser usados para evitar esta violação. Este projeto investiga estes algoritmos e propõe novos algoritmos ou melhorias nos algoritmos existentes, particularmente com estratégias de processamento distribuído, para possibilitar a privacidade de dados publicados pela anonimização de grandes volumes de dados. Foram conduzidos estudos sobre diferentes técnicas de garantia de privacidade, particularmente observando suas propriedades na solução da privacidade de dados gerados dinamicamente. Escolhida uma das técnicas, investigamos a possibilidade de ganhar desempenho e escalabilidade por meio de uma nova estratégia de implementação distribuída. Foram realizados alguns experimentos, mas os resultados não foram promissores como supúnhamos, uma vez que o algoritmo original de implementação da técnica não tinha fases que pudessem se beneficiar significativamente da distribuição. Novas investigações são necessárias.