6698 sayılı Kişisel Verilerin Korunması Kanunu Kapsamında İşçinin Elektronik
B. Kişisel Veri Kavramı
Para Studer (1998), uma ontologia é um entendimento comum de um domínio que pode ser compartilhado entre pessoas e computadores. Neste sentido, uma ontologia pode ser utilizada no contexto do MKTV para estruturar e organizar o conhecimento manipulado nas diversas fases da Mineração de Dados.
Alguns estudos (GOTTGTROY et al.,2004), (NIGRO; CÍSARO; XODO, 2008) (DIAMANTINI ET ALL., 2009A) (DIAMANTINI ET ALL., 2009B) estão sendo realizados unindo as áreas da Mineração de Dados e de ontologia. Eles estão organizados em dois frameworks, da seguinte forma:
Das ontologias para a Mineração de Dados – As ontologias irão inserir conhecimento ao processo de Mineração de Dados.
Da Mineração de Dados para as ontologias – O conhecimento minerado é representado em ontologias.
Neste projeto utilizaremos a abordagem da Mineração de Dados para as ontologias, onde o conhecimento proveniente do processo de Mineração de Dados será representado por meio de uma ontologia, chamada OntoMKTV (onto – ontologia e MKTV – projeto em questão), tornando assim o conhecimento descoberto inter operável através de um modelo consolidado - OWL, extensível, podendo agregar novas informações as já descobertas.
A ontologia esta focada na representação do resultado da Mineração de Dados realizada pelos algoritmos da tarefa de regras de associação, feita nos dados do Data Warehouse provenientes do ambiente de convergência construído na KTV( TV Digital Interativa e WEB).
As principais vantagens da utilização de uma ontologia para o resultado da Mineração de Dados dizem respeito a:
Análise das informações mineradas, identificando similaridades e conceitos comuns;
Reusabilidade do conhecimento encontrado através da mineração de dados aplicável em outros domínios, como o de consultas semânticas, personalização de conteúdo;
Possibilidade de extensão do conhecimento descoberto através da Mineração de Dados, agregando novas informações;
Realizar inferências e suposições acerca das informações mineradas;
Acrescentar um valor semântico ao conhecimento descoberto através da Mineração de Dados, fazendo com que o mesmo deixe de representar um dado de valor unicamente sintático;
Compartilhar informações acerca da estrutura de informação utilizada para descrição do conhecimento descoberto através das técnicas de Mineração de Dados.
A OntoMKTV encapsula o conhecimento gerado pela tarefa de Mineração de Dados de regras de associação, isto é, para os algoritmos de regras de associação, podendo em um novo trabalho ser estendida para outras tarefas como de clusterização e de classificação.
Seguindo a arquitetura do projeto KTV, a ontologia é especificada no componente de modelagem semântica e mantida (instâncias das regras mineradas) no módulo base de conhecimento, auxiliando em diversos serviços desenvolvidos no projeto.
Para realizar a criação de uma ontologia se faz necessário uma metodologia que guie o seu desenvolvimento (GRUNINGER e FOX, 1995), (USCHOLD e KING, 1995), (FERNANDEZ et al., 1997), (NOY e McGUINNESS, 2001). Neste caso, optou-se pela Metodologia 101 criada por Noy e McGuiness (2001) da Universidade de Stanford por ser uma metodologia já estabelecida e ter sua implementação e documentação baseada na ferramenta Protegé (PROTEGÉ,2012).
A Metodologia 101 prega a construção de ontologias num processo iterativo de sete passos, são ele: determinar o escopo da ontologia, considerar o reuso, listar termos, definir classes, definir propriedades, definir restrições e criar instâncias.
Inicialmente foi definido o escopo da ontologia, que neste caso se trata de representar o conhecimento minerado através das regras de associação. Em seguida foram pesquisadas ontologias sobre o domínio de Mineração de Dados, para não recriar algo que já exista e que possa ser reaproveitado. Desta forma foram encontradas as ontologias: DMOP – Data Mining
(DIAMANTINI et. Al., 2009) que contêm diversos conceitos sobre o domínio de Mineração de Dados, mas não apresentam conceitos específicos acerca de regras de associação.
Nesse sentido o levantamento dos termos mais relevantes ao seu domínio. Neste caso o OntoMKTV tem como principais conceitos:
Algoritmo de mineração (Predictive Apriori, Tertius); Tarefa de mineração (Regras de associação);
Regra; Termo antecedente; Termo consequente; Conceito; Instância; Suporte; Confiança.
Esses termos são o princípio para modelagem de classes, propriedades e instâncias da OntoMKTV, pois ela busca modelar o contexto de pós-processamento do processo de KDD no que diz respeito às regras geradas. Essas são o resultado da aplicação dos algoritmos de mineração através da tarefa de regras de associação nos dados advindos, no âmbito do projeto KTV, da TV Digital Interativa.
Desta forma as principais classes e grupo de classes modeladas, são (Figura 15 e 16): TaskDataMining: Classe que especifica a categoria de padrões que deverão ser
encontrados.
Algorithm: Um algoritmo em geral, é uma sequência bem definida de passos que especifica a forma de resolver um problema ou executar uma tarefa. Normalmente um algoritmo aceita uma entrada e produz uma saída. Um algoritmo de DM é um algoritmo que foi projetado para executar uma das primitivas de DM, como a seleção de recurso, imputação valor em falta, ou modelagem (ou indução).
Rule: Diz respeito a uma regra de associação criada após a aplicação do algoritmo de mineração de dados. Uma regra é gerada por um algoritmo e é composta por termos antecedente e consequente. Cada regra possui suporte e confiança, que são medidas de corretude da regra.
Antecedent: Descreve o termo antecedente de uma regra no formato X→Y, em que X e Y são formados por um ou mais itens compostos por conceito = instância.
Consequent: Descreve o termo consequente de uma regra no formato X→Y, em que X e Y são formados por um ou mais itens compostos por conceito = instância.
Concept: Representa um atributo minerado através da ferramenta de mineração. Este atributo é genérico o suficiente para ser uma classe ou conceito de outra ontologia. Instance: Classe que se refere ao valor de um atributo ou a instância de um conceito,
pode se remeter também a uma tupla em um banco de dados.
Figura 15 - Visão das classes da ontoMKTV
Fonte: Próprio Autor (2012)
Figura 16 - Hierarquia de classes OntoMKTV
Fonte: Próprio Autor (2012)
Para realizar a conexão entre os conceitos da OntoMKTV foram criadas propriedades, retratando assim as ligações entre as entidades do mundo real, são elas:
hasTaskDataMining: possui a classe Algorithm como domínio e TaskDM como contradomínio.
hasAlgorithm: possui a classe TaskDM como domínio e Algorithm como contradomínio.
hasTimeExecution: possui a classe Algorithm como domínio e TaskDM como contradomínio.
hasRule: possui a classe Algorithm como domínio e Rule como contradomínio. isProvidedBy: possui a classe Rule como domínio e Algorithm como
contradomínio.
hasAntecedent: possui as classes Rule e Consequent como domínio e Antecedent como contradomínio.
hasConsequent: possui a classe Rule e Antecedent como domínio e Consequent como contradomínio.
hasConceptAntecedent: possui as classes Antecedent e InstanceAntecedent, como domínio e ConceptAntecedent como contradomínio.
hasConceptConsequent: possui as classes Consequent e InstanceConsequent como domínio e ConceptConsequent como contradomínio.
hasInstanceAntecedent: possui as classes Antecedent e ConceptAntecedent como domínio e InstanceAntecedent como contradomínio.
hasInstanceConsequent: possui as classes Consequent e ConceptConsequent como domínio e InstanceConsequent como contradomínio.
hasUser: possui a classe Rule como domínio e Algorithm como contradomínio. hasConfiance: possui a classe Rule como domínio e Algorithm como
contradomínio.
hasSuport: possui a classe Rule como domínio e Algorithm como contradomínio.
Um exemplo de instância que poderá ser representada pela OntoMKTV é a seguinte (Figura 17):
Tarefa de Mineração de Dados - Regras de associação Algoritmo de Mineração – Predictive Apriori
Encontra como regra numero 1
Se (conceitoAntecedente) gênero = (instânciaAntecedente) infantil e (conceitoAntecedente) canal = (instânciaAntecedente) SBT
→
(conceitoAntecedente) programa = (instânciaAntecedente) Icarli Usuário número 1001Figura 17 - Representação do exemplo em forma de ontologia
Fonte: Próprio Autor (2012)