Resumos Aceitos pela PRPPG

XXIX Encontro de Iniciação Científica

Um Estudo Comparativo das Medidas de Similaridade e Métodos de Agrupamentos mais Utilizados na Análise de Clusters

Área: Engenharias III
Orientador: Silvia Maria de Freitas
Autor Principal: Bruno Monte de Castro
Co-Autores: Prof Bruno de Athayde Prata/Ifce/Quixadá/Ce
George Leitão Evangelista/Geslog/Ufc
Apresentação: Oral   Dia: 21  Hora: 08:40  Sala: 08  Local: Didático do CC - Bloco:951, 1º andar
Identificação: 2.1.16.004
Resumo:
O grande sábio grego Aristósteles disse: %u201CO homem vive classificando tudo o que vê%u201D. Classificar significa agrupar, tendo por base aspectos de semelhança entre os elementos classificados. Ao classificar moedas, por exemplo, levam-se em conta critérios de semelhança como o país de origem, o ano em que a moeda foi criada, etc. Um dos maiores problemas encontrados em várias áreas de pesquisa é a definição de uma forma de agrupar as informações para um melhor entendimento dos dados e assim obter resultados significativos. O agrupamento é realizado de forma a minimizar as diferenças entre os objetos em estudo dentro do grupo (cluster) e maximizar as diferenças entre os elementos de grupos distintos. A análise de Cluster constitui-se um métodos Multivariado que tem por objetivo apresentar uma estrutura de classificação dos elementos em grupos, com base nas semelhanças de características em estudo. As semelhanças são definidas em função de uma medida chamada "similaridade", uma medida utilizada para quantificar o grau de semelhança entre indivíduos - geralmente expressas em forma de distância. Dentre as mais conhecidas podem ser citadas: distância Euclidiana e a distância de Mahalanobis. Os agrrupamentoa são feitos com base nessas medidas e nos métodos. O objetivo desse trabalho é comparar e relatar as vantagens e desvantagens das técnicas conhecidas como: Hierárquicas, não-Hierárquicas e um método Híbrido, proposto por Freitas & Prata (2007), conhecido como "Raio de Influência". Com base em um conjunto de dados da literatura, os métodos acima foram estudados e as respectivas vantagens e desvantagens foram avaliadas comparativamente, com base nas medidas seguintes medidas de similaridade: ligação simples, ligação completa, média das distâncias e Ward.