O projeto de um sistema de visualiza¸c˜ao ´e um processo complexo que requer alinhar recursos de caracter´ısticas variadas - incluindo t´ecnicas de intera¸c˜ao e capacidades com- putacionais - as exigˆencias das atividades a serem apoiadas [Casner, 1991; Ware, 2004]. Dessa maneira, um arcabou¸co ´e utilizado para modelar as atividades de alto n´ıvel da
1
Um estudo de caso explorat´orio investiga fenˆomenos que n˜ao possuem uma hip´otese formulada ou o ambiente que envolve a pesquisa limita a escolha do m´etodo [Yin, 2009].
avalia¸c˜ao dos defeitos e apoiar a condu¸c˜ao do estudo de caso. O arcabou¸co ´e baseado na estrutura dos defeitos nos dados - Se¸c˜ao 4 -, certas caracter´ısticas dos dados e na nota¸c˜ao derivada de [Andrienko e Andrienko, 2006; Schulz et al., 2013].
5.3.2.1 Defini¸c˜ao de Atividade
Uma atividade ´e uma abstra¸c˜ao cuja natureza direciona a utiliza¸c˜ao dos sistemas de visualiza¸c˜ao [Andrienko e Andrienko, 2006; Yi et al., 2008]. Neste trabalho, essa abstra¸c˜ao denota o esfor¸co consciente de reconhecer e relacionar significados para determinar o n´ıvel de qualidade dos dados.
Atividades apresentam diferentes n´ıveis de granularidade ou complexidade semˆantica. A hierarquia de atividades Anal´ıtica ⊇ Sub − anal´ıtica ⊇ Interativa ⊇ Operacional uti- lizada nesse arcabou¸co ´e baseada na teoria de atividades [Gotz e Zhou, 2009] e nos n´ıveis de intera¸c˜ao [Sedig et al., 2014]. Tais teorias definem as representa¸c˜oes visuais como me- diadoras da cogni¸c˜ao humana.
Uma atividade anal´ıtica representa os processos de an´alise de alto n´ıvel para um dom´ınio em particular. Por sua vez, a atividade sub-anal´ıtica representa objetivos de in- vestiga¸c˜ao mais concretos para alcan¸car o objetivo da atividade anal´ıtica correspondente. O terceiro n´ıvel - atividade interativa - envolve passos atˆomicos desempenhados sobre uma representa¸c˜ao visual, enquanto a atividade operacional denota a¸c˜oes de pouco valor semˆantico - sele¸c˜ao de um bot˜ao, por exemplo.
Isto posto, a avalia¸c˜ao de qualquer defeito nos dados ´e denotada pela atividade anal´ıtica TN ome do Def eito, composta por um fluxo dirigido de atividades sub-anal´ıticas, tal que
TN ome do Def eito = (T k1 ⇒ T k2 ⇒ ... ⇒ T kj), j > 1. Cada atividade sub-anal´ıtica T ke,
e = [1, j], possui um objetivo particular e seus resultados s˜ao insumos para a atividade sub-anal´ıtica subsequente, sendo expressa por T ke : Caracter´ıstica × Intera¸c˜ao × Espa-
¸co.Dados → Resultado. Os tipos de atividades sub-anal´ıticas e seus elementos s˜ao definidos a seguir.
– Atividades sub-anal´ıticas apresentam dois tipos que denotam seus prop´ositos: a busca e a correla¸c˜ao. A primeira denota a inten¸c˜ao de explorar o espa¸co dos da- dos, identificar e fixar caracter´ısticas pr´oximas a estrutura do defeito avaliado. J´a a correla¸c˜ao representa as t´ecnicas anal´ıticas aplicadas para comparar e estabele- cer relacionamentos entre as referidas caracter´ısticas para desenvolver novas ideias, quest˜oes ou hip´oteses. Ambos os tipos podem manipular os dados em sua totalidade ou em regi˜oes espec´ıficas.
– Caracter´ıstica especifica o conjunto de significados de interesse de uma atividade sub-anal´ıtica. Atividades do tipo busca observam padr˜oes de dados2 - Tabela 5.1 -
2
Padr˜ao de dados ´e algo resultante de uma an´alise que denota um retrato do comportamento dos dados. Por sua vez, o comportamento dos dados representa um fenˆomeno inerente aos dados que pode
em grandes resolu¸c˜oes de dados ou caracter´ısticas espec´ıficas de objetos presentes em regi˜oes reduzidas de dados. Em contraste, as atividades de correla¸c˜ao observam padr˜oes, regi˜oes de dados ou objetos espec´ıficos para derivar estruturas de rela- cionamento, tais como c´ıclico, discrepante, alterna diferen¸cas, magnitude oposta, randˆomico, similar, mudan¸ca suave, dentre outras.
Classe de Padr˜ao Caracter´ısticas da Classe de Padr˜ao Padr˜ao Arranjo Percep¸c˜ao de organiza¸c˜ao dos dados. Essa organiza¸c˜ao Aumento
denota a maneira na qual os atributos s˜ao posicionados Circularidade para expor a ordem arbitr´aria introduzida aos dados. Constˆancia
Pico Platˆo Vale
Associa¸c˜ao Percep¸c˜ao de estratos distintos de dados de acordo com Concentra¸c˜ao a similaridade dos valores dos atributos envolvidos. Isolamento Naturalmente, essa classe requer diferencia¸c˜ao Similaridade Classifica¸c˜ao Percep¸c˜ao de diferen¸cas entre dados com base At´ıpico
nos atributos representados visualmente. Desvio Essa classe de padr˜ao pode ser percebida sem Exce¸c˜ao caracter´ısticas de similaridade. Incoerˆencia
Parte-Todo Distribui¸c˜ao Percep¸c˜ao do modo geral na qual os valores do atributo At´ıpico
alvo da avalia¸c˜ao s˜ao distribu´ıdos sobre um ou mais Densidade atributos de referˆencia. Lacuna
Incoerˆencia Uniformidade
Tabela 5.1: Padr˜oes agrupados por Classe
(Fontes: Adaptado de [Andrienko e Andrienko, 2006; Few, 2009])
– Intera¸c˜ao representa os mecanismos que modificam dinamicamente uma representa¸c˜ao visual para propiciar a interpreta¸c˜ao de acordo com o objetivo uma atividade - Se¸c˜ao 2.3.4.1. Embora existam v´arias classes de intera¸c˜ao com diferentes nomen- claturas, este trabalho aborda aquelas ligadas a capacidade de especifica¸c˜ao dos dados de interesse - simplificar -, especifica¸c˜ao do arranjo espacial dos dados - arran- jar.espa¸co -, de abstra¸c˜ao ou realce dos dados - abstrair e destacar, respectivamente -, conforme observado na Tabela 2.3.
– Espa¸co.Dados denota os conjuntos de atributos g e b requeridos por uma atividade sub-anal´ıtica, representados por g ∼ b, g ∩ b = ⊘, g, b ⊆ Sn
i=1Ri e Ri ∈ BD.
O conjunto g representa os atributos alvo da atividade de avalia¸c˜ao da qualidade, enquanto o b denota os atributos de referˆencia. Reunidos em uma vis˜ao global dos dados, esses atributos podem revelar certos padr˜oes e outros significados necess´arios para detectar um defeito nos dados. Embora certos atributos de referˆencia possam apresentar baixa qualidade, ´e improv´avel que todos estejam defeituosos.
– Resultado representa as entidades informacionais criadas pela atividade. O resultado
vazio de uma atividade determina a ausˆencia ou a percep¸c˜ao visual inconclusiva de significados relativos a um defeito.
A Atividade 1 utiliza conceitos derivados de [Andrienko e Andrienko, 2006; Schulz et al. , 2013] e as defini¸c˜oes supracitadas para ilustrar a composi¸c˜ao de uma atividade anal´ıtica. Essa ilustra¸c˜ao apresenta o relacionamento entre os elementos Carater´ıstica, Intera¸c˜ao e Espa¸co de Dados, o duto da atividade anal´ıtica e introduz os s´ımbolos “|” e “*”. O primeiro s´ımbolo ´e um separador de m´ultiplos parˆametros para qualquer elemento da atividade, enquanto o segundo denota um atributo qualquer de referˆencia - inclusive ne- nhum.
TN ome do Def eito=
{ Atividade − Sub − anal´ıtica1(Caracteristica1, Intera¸c˜ao1|Intera¸c˜aon, atributo1|atributo2∼ ∗) ⇒
Atividade − Sub − anal´ıtica2(Caracteristica1, Intera¸c˜ao1, atributo1|atributo2∼ atributo4) ⇒
... ⇒ Atividade − Sub − anal´ıticai(Caracteristica1|Caracteristicaj, Intera¸c˜ao1, atributo1|atributo2∼ ∗) }
Atividade 1: Nota¸c˜ao das Atividades do Arcabou¸co
Baseado na nota¸c˜ao anterior, a Atividade 2 exemplifica a atividade anal´ıtica para avaliar o defeito Viola¸c˜ao de Dependˆencia de Inclus˜ao - Se¸c˜ao 4.4 - entre as rela¸c˜oes R1
e R2. Esse defeito causa tuplas de R1 n˜ao relacionadas a tuplas de R2, denotando um
padr˜ao de isolamento.
De acordo com esse padr˜ao, a atividade anal´ıtica ´e formada por quatro atividades sub-anal´ıticas: a primeira inicia a busca pelo padr˜ao (5.1) e prossegue no intuito de com- preender (5.2) os padr˜oes de defeitos na totalidade dos dados at´e concentrar a an´alise (5.3)em uma regi˜ao espec´ıfica dos dados com casos suspeitos e determinar a presen¸ca do defeito (5.4).
TV iola¸c˜ao Dependˆencia Inclus˜ao=
{ Buscar(isolamento, arranjar.espaco, R1.Key|R2.Key ∼ R1. ∗ |R2.∗) ⇒
(5.1)
Correlacionar(similaridade|isolamento, arranjar.espaco, R1.Key|R2.Key ∼ R1. ∗ |R2.∗) ⇒
(5.2)
Buscar(n˜ao − relacionados, simplif icar|selecionar|arranjar.espaco, R1.Key|R2.Key ∼ R1. ∗ |R2.∗) ⇒