• Sonuç bulunamadı

1 1 SADREDDİN KONEVÎ’DE BİLGİ

1.1.2 Nazari İlimler

Atualmente existe uma grande variedade de produtos comerciais para mineração de dados. Tem-se nesse item o objetivo de apresentar algumas das principais ferramentas utilizadas para auxiliar na execução do processo de Mineração. Entre algumas das principais dificuldades para criação de uma ferramenta de mineração pode-se citar a necessidade de manipulação de grandes e heterogêneos volumes de dados, o tratamento de resultados representados em diferentes formatos e a dificuldade de interação de diversos algoritmos específicos.

A – Weka

O Weka é uma ferramenta de código aberto, aplicável em mineração de dados, flexível, desenvolvida na linguagem Java pelo curso de ciência da computação da Universidade de

Waikato na Nova Zelândia. A utilização da ferramenta pode ser realizada de diversas

maneiras. Possui quatro diferentes implementações de interface, que permitem que todos os seus algoritmos sejam chamados diretamente via código Java. As interfaces são:

Simple Client – Nessa interface, a interação do usuário com o Weka ocorre por meio de

linhas de comando. Requer um profundo conhecimento do programa, porém é extremamente flexível e ágil para usuários avançados;

Explorer – Trata-se da interface de utilização mais comum, e enquadra separadamente

as etapas de pré-processamento, mineração de dados e pós-processamento;

Experimenter – Constitui um ambiente de experimentação, em que testes estatísticos

podem ser conduzidos a fim de avaliar o desempenho de diferentes algoritmos de aprendizado;

Knowledgeflow – É uma ferramenta gráfica, ainda em desenvolvimento, que permite o

O Weka possui implementados diversos métodos de associação, classificação e clustering. A inclusão ou remoção de novos métodos pode ser realizada de forma simples e

rápida, o que torna a ferramenta versátil e expansível. O Weka suporta a abertura direta de arquivos ARFF, CSV, C45. Porém apenas consegue manipular os ARFF. Esse é um arquivo ASCII usado para definir atributos e seus valores. O Weka também permite a visualização gráfica dos dados em forma de histograma, e a apresentação de resultados em arvores de decisão, diagrama de dispersão, além de prover modelos gráficos para montagem de redes neurais.

B – Darwin

Desenvolvido pela Thinking Machines Corp, o Darwin é uma ferramenta disponível para operação nas plataformas Windows, Sun Solares e HP-UX. Fornece interfaces simples, baseada no modelo Windows, e oferece também uma programação de vários algoritmos de mineração, que podem ser executados paralelamente. Pode ser utilizado em conjunto com diversos bancos de dados, sendo capaz de implementar o modelo de mineração por completo.

C - Inteligent Miner

Ferramenta fabricada pela IBM que possui versões para operação nas plataformas

Windows, Solaris, AIX, OS/390 e OS/400. O Inteligente Miner não é dependente do sistema

IBM, podendo também ser utilizado junto a outros bancos de dados de outros fabricantes. A IBM também oferece o Inteligent Miner para texto, que realiza atividades de mineração em dados de texto, incluindo a filtragem de e-mail e paginas Web. Escalável e com suporte para várias plataformas, o pacote Inteligent Miner for Data oferece um conjunto de ferramentas apto a fornecer uma estrutura que suporta o processo iterativo de mineração.

O Inteligent Miner permite a utilização de algoritmo de mineração, de forma individual

ou combinada, para solucionar problemas de mineração também possui uma interface de programação de aplicativos que permite o desenvolvimento de aplicação personalizada.

D - Bramining

É uma ferramenta nacional de mineração produzida ao longo de três dissertações de mestrado realizadas pela PUC e no IME. Essa ferramenta disponibiliza um ambiente para a realização do processo e conceitualmente trabalha em três níveis denominados níveis funcionais: Nível dos Métodos, Nível das Operações e Nível das Etapas.

O nível dos métodos é o nível funcional mais baixo e contém os métodos que se encontram disponíveis no Bramining para utilização durante a realização de aplicações de mineração. Os métodos são classificados em operações. Uma operação de mineração é uma especificação lógica de um grupo de métodos que tem a mesma finalidade. As operações disponíveis no Bramining compõem o nível funcional intermediaria da ferramenta, denominado nível de operações. O nível das etapas é o nível funcional mais elevado. Nele as operações de descoberta e conhecimento de dados são agrupadas nas etapas do processo de descoberta e conhecimento: pré-processamento, mineração de dados, pós-processamento.

O processamento iterativo e interativo de uma aplicação de descoberta e conhecimento pelo Bramining requer, a cada ação, que seja definido o método que deverá implementar tal ação. A hierarquia mencionada anteriormente é utilizada para auxiliar usuários inexperientes a identificar, por meio de filtros, os métodos disponíveis que viabilizam a operação desejada. Uma vez selecionada o método desejado, a sua execução demanda a especificação de estrutura de entrada e dos parâmetros específicos do referido método. Cada método, após ser executado, apresenta uma interface especifica com os resultados produzidos. Esses resultados podem ser novos conjuntos de dados ou mesmo modelos de conhecimento descobertos.

E - Oracle Data Mining (ODATA MINING)

É um software de mineração em que todas as atividades de descobertas de conhecimento ocorrem no mesmo ambiente do gerenciador de banco de dados Oracle, provendo uma plataforma integrada simples, segura e escalável. Tal integração representa um diferencial importante em favor de sua utilização, pois ao contrário das demais ferramentas, não requerendo a extração prévia dos dados para que esses sejam processados pelos métodos de mineração.

O ODATA MINING permite a realização de tarefas de classificação, regressão,

associação, clustering, e mineração de texto. A infra-estrutura de análise de dados e desenvolvimento de aplicações integrada a mineração de dados é suportada por meio do

software Java API, graphical user interface.

F – SPSS

O software estatístico SPSS para Windows é um poderoso sistema de análise estatística e manuseamento de dados, em um ambiente gráfico, em que a utilização mais freqüente, para a maioria das análises a efetuar, se resume à seleção das respectivas opções em menus e caixas de diálogos [FERREIRA, (2005)]. Além disso, o sistema dispõe de um editor de comandos, a que o utilizador mais avançado poderá recorrer a fim de realizar determinados tipos de análises mais complexas e elaboradas.

O SPSS implementa a técnica de classificação baseada em associações, cujo objetivo é gerar subconjuntos de regras de associações, em que fica restrito ao lado direito das regras, o atributo alvo da classificação. Além de produzir regras de classificação, também pode ser aplicado para extrair regras normais de associação e categorização de textos, executa árvore de decisão para analisar e gerar modelos de predição, com diagramas de árvore de fácil entendimento, também tem produtos para rede neurais que provê modelagem e predição, séries temporais e clustering [GROTH, (1997)].

É um pacote dos programas para manipular, analisar, e apresentar dados; o pacote é usado extensamente nas ciências sociais e estatísticas. Há diversos formulários de SPSS. O programa do núcleo é chamado base de SPSS e há a número dos módulos add-on que estendem a escala da introdução de dados, estatística, ou relatando potencialidades. Em nossa experiência, o mais importantes desses para a análise estatística são os modelos avançados

SPSS e da regressão de SPSS os módulos do add-on dos modelos.

Benzer Belgeler