• Sonuç bulunamadı

Yabancılaşma ve Hukukun Yabancılaştırıcı Etkinliği

Yabancılaşma ve Hukuk

ALIENATION AND LAW

1. Yabancılaşma ve Hukukun Yabancılaştırıcı Etkinliği

4.2.1 Considerações Iniciais

Como a solução proposta nesse trabalho envolve ontologias e mineração de dados, qualquer ferramenta desenvolvida deve ter a capacidade de trabalhar com esses dois tipos de tecnologias. A idéia principal para ligação entre os dois conceitos é centrada no mapeamento entre os atributos obtidos na base de dados e as classes existentes na ontologia. Incluindo uma inferência básica na taxonomia da ontologia é possível a visualização de uma hierarquia de classes convencional acrescida de algumas mudanças proporcionadas por relacionamentos entre as classes. Tendo essa visão de atributos e classes, o especialista pode fazer o mapeamento de forma manual ou com o auxílio de um módulo de distância de edição (Edit

Distance) entre os termos. Quando o mapeamento é concluído, além de possibilitar seleção de

atributos categorizados, ainda permite visualizar redundâncias e efetuar alguns cortes em determinados níveis hierárquicos (redução de dimensionalidade).

A figura 15 ilustra a interação do especialista com a interface gráfica da ferramenta proposta:

Figura 17 - Diagrama de Caso de Uso do SAAO

De uma forma genérica, para desenvolver a ferramenta foi usada a linguagem Java e as ontologias foram construídas com a ferramenta Protégé.

4.2.2 Arquitetura

Com o objetivo de permitir uma análise semântica entre a ontologia e os atributos candidatos à seleção, foi desenvolvida uma ferramenta protótipo que auxilia o especialista em KDD na fase de seleção de atributos com auxilio de ontologias. Foi utilizada a linguagem Java, a IDE Netbeans e o banco de dados PostgreSQL. Com a linguagem Java foi criado todo o protótipo, usando o ambiente de desenvolvimento Netbeans e os dados para avaliação foram armazenados no banco de dados PostgreSQL. O sistema foi dividido em cinco camadas funcionais que são diretamente ligadas e utilizam os resultados obtidos na camada anterior.

Mapeamento BD

Ontologia API Jena + Reasoner

Atributos Gerados Início Etapas de KDD Categorização Tratamento Semântico Tratamento Redundância 1 2 3 4 5

Figura 18 - Arquitetura Básica do Sistema.

A Figura 16 pode ser explicada da seguinte forma:

 Camada 1: Será responsável por capturar os atributos existentes no banco de dados e as classes da ontologia. O banco de dados deve fornecer todas as colunas em uma estrutura dimensional única. Provavelmente o especialista precisa agrupar o esquema do banco de dados em uma única tabela de avaliação. As ferramentas de mineração de dados como o Weka, na maior parte das vezes trabalham com um arquivo de extensão própria e organizado também em única estrutura. Então, para a finalidade de mineração de dados, a tabela única pode trazer algumas facilidades de transição para essas ferramentas. Para consultar as informações contidas na ontologia foi utilizada a API Jena em conjunto com o motor de inferências Pellet (referencia, ano).  Camada 2: Essa etapa deve ser feita preferencialmente por um especialista

no domínio que estiver sendo estudando. O usuário deverá ligar ou mapear os atributos às classes que melhor os represente semanticamente. Como mostrado no capítulo anterior, a ontologia foi construída de uma forma genérica e com capacidade para permitir uma organização categórica dos dados. O protótipo SAAO ainda conta com um sistema para calcular a similaridade entre a escrita do atributo e as várias classes da ontologia, possibilitando um suporte ao analista no momento do mapeamento de cada atributo.

 Camada 3: Essa é a camada de principal ação semântica do sistema, pois com as informações armazenadas após o mapeamento é possível visualizar de forma categorizada os atributos mapeados. Existe um módulo para o especialista fazer análises para cada atributo (redimensionar os dados, identificar e explorar atributos relacionados semanticamente, etc) e ainda possibilita uma melhor visão de atributos possivelmente redundantes no contexto estudado.

 Camada 4: Finalmente após todas as análises o usuário pode obter os atributos que servirão de entrada para outros processos de pré-processamento ou mesmo a mineração de dados. No protótipo é possível obter uma saída

com a consulta que será inserida no Weka para captura dos atributos selecionados no banco de dados.

 Camada 5: Apenas representa os atributos selecionados e prontos para serem usados na mineração de dados.

Com métodos específicos é possível manipular as ontologias e detalhar certos aspectos que podem contribuir na seleção de atributos. O funcionamento e detalhamento da ferramenta poderão ser mais bem entendidos nos próximos tópicos.

4.3 Protótipo para Seleção de Atributos com Auxílio de Ontologias (SAAO)

4.3.1 Contextualização do Problema

As metodologias convencionais para seleção de atributos, inclusive as aplicadas em ferramentas de mineração como o Weka, utilizam medidas matemáticas que buscam o grau de relacionamento entre os atributos avaliados. Como já discutido em vários tópicos anteriores, esses métodos não levam em consideração o domínio tratado e, principalmente, não possuem a capacidade de fazer análises levando em consideração conhecimentos prévios acerca do desse domínio. Outro fato é que a supressão de colunas (atributos) é muito mais delicada que a supressão de uma linha; então cada atributo deve ser bem avaliado antes de ser retirado do espaço de análise, dificultando mais ainda a tarefa que busca reduzir o espaço vertical dos atributos. Se esses atributos forem irrelevantes e permanecerem durante a análise dos algoritmos de mineração, independente da tarefa executada pode implicar na descoberta de padrões de baixa qualidade.

C4.5 ReliefF CFS FCBF CBF SAAO Avaliação Individual X X X Avaliação de Subconjuntos X X X Medida de Informação X X X Medida de Distância X X Medida de Dependência Medida de Consistência X Avaliação de Redundância X