Comodes ritoanteriormente,oobjetivodaavaliação onsistiaem:
É possívelqueespe ialistas onsigam riarabstrações( onsultas)úteisparaosusuários nais,
onde esses onsigam interagir omosistema de mineraçãode segundageraçãosemquesaibamos
on eitos té ni osenvolvidos?
Assim,oquesequeriaanalisaréapropostadasoluçãoenãooprotótipoemsi. Comodes rito,
ostestesrealizados ontaram omaparti ipaçãode4usuários,sendo2espe ialistase2leigos,um
de adaperl para adaumdos ontextos. Foram testespreliminares,nãosendopossívelarmar
queosresultadosobtidosnostestessão on lusivosouqueabrangeramtodososaspe tospossíveis.
Masapartirdeles,foramdete tadosdiversosindi adoresdequeasoluçãopropostaatendeaoque
sepropõe. Paraumaprimeiraavaliação omosusuários,osresultadosforambastantesatisfatórios.
O primeiroindi ador deque asoluçãoésatisfatória, foi que todos parti ipantes onseguiram
utilizarosistema,realizandoastarefaspropostaspara adaperl.
Osusuáriosespe ialistas onsiderarambaixo o usto de riação deuma onsulta. Armaram
queamodelagemprontafa ilita a riaçãodas onsultas,masnãovêemproblemaem riá-lassem
que elas sejam previamente modeladas. Eles onsideraram que o trabalho não aumentou muito
7
emrelaçãoaoque fazempara riardiretamente astarefasdemineração,sendoamaiordiferença
em relação ao forne imento das expli ações sobre as de isões durante o pro esso. Entretanto,
a reditamqueparaosusuáriosleigosasabstraçõeseexpli ações riadassãomuitointeressantes.
Paraosusuáriosleigos,apossibilidadedeinteragir omasabstrações riadasévista omouma
grandeoportunidadedeampliarousodesistemasdemineraçãodedados. Elesnãotiveramdi ul-
dadesemexe utaras onsultase omonãopossuíam onhe imentodiretoemrelaçãoaos on eitos
té ni osdemineraçãodedados,foipossívelper eberqueesse onhe imentonãoéne essáriopara
interagir omasabstrações riadas,que onsistenoqueépropostopelomodelo.
Ainda em relação ao modelo, alguns outros aspe tos apontaram omo fatores positivos do
mesmo:
•
Os usuários leigos sentiram ne essidade de mais informações sobre as onsultas, o que é previstopelomodelopelabasede onhe imentoedesta aaimportân iadamesma. Emboraos espe ialistas tenham ofere ido expli ações, osusuários leigos onsideraramque estavam
amplasepoderiamsermaisespe í as;
•
Emrelaçãoaostermosutilizados,osusuáriosleigostambém soli itarammaistraduções,o que onrmaautilidade dodi ionário propostonomodelo. Porexemplo,emborahouvesseore ursono protótipopara tradução dosnomes dosatributos, algumas nãoforam feitas,
omoDiaSem (DiadaSemana),oquegerouinsatisfaçãodosusuáriosleigos.
Apesardosindi adores positivosrela ionadosaomodelo,foramlevantadosdiversosproblemas
esugestões,tantoemrelaçãoàsmodelagensfeitasquantoaoprotótipo.Emrelaçãoàsmodelagens,
osusuáriosleigos levantaram pontos que poderiamser melhorados. Como itado, opro esso de
mineração onsiste um pro esso interativoe iterativo que demanda que adaptações sejam feitas
até que se onsiga uma boa modelagem na on epção dos leigos. No aso, osespe ialistasnão
interagiram om os leigos após a riação da onsulta, o que seria ideal em um ontexto real.
Alémdisso,osusuáriosespe ialistas,emboratrabalhemnaequipedoTamanduá,nãoestavamno
momentotrabalhando omosprojetosutilizadosnaavaliação. Issopodetê-loslevado asedarem
por satisfeitos om a modelagem assim que identi aram uma primeira geração de padrões de
interesse,sem investigara fundosevaleria apenarenarmelhora modelagem ounão. De todo
jeito, o fato dos usuários leigos terem sido apazes de sugerir melhoriaspara as onsultas é um
indi adordequeelesentenderamasde isõesdosusuáriosespe ialistas,semquetenhamtidoque
aprenderos on eitos té ni os. Desta forma, estetambém éum indi adorinteressante para esta
primeiraavaliaçãofeita omusuários.
Emrelaçãoaoprotótipo,algunsdosproblemaslevantadossãorela ionadosàqualidadedeusodo
sistema. Apesardenãoserofo odaavaliação,nestemomento,algunsproblemasforamper ebidos
durante ainteraçãodosusuários. De forma arealizaruma análise mais detalhada,dois tipos de
avaliaçõesdevemserrealizadas:ade omuni abilidadeedeusabilidade. Comuni abilidadevisando
analisar aqualidade da omuni ação, visto que o modelo é baseadoem Engenharia Semióti a e
usabilidadepor avaliareên iaee á iadosistema. Usabilidadeéumdosfatoresaseranalisado
e onsiste na apa idade que um sistema interativo ofere e a seu usuário, em um determinado
ontextodeoperação,paraarealizaçãodetarefasdemaneirae az,e ienteeagradável[ISO9241
(2008)℄. Entretanto, não foi feita uma análise de usabilidade detalhada, tanto que não foram
protótipo. No Apêndi e C.2, listamos algunstiposde problemas lassi adosde a ordo omas
diretrizesdeNilsen[Nielsen(1994)℄.
Aindaemrelaçãoaqualidadedeinteração, onformeapresentadono apítulo 3,aEngenharia
Semióti aentendeainteraçãohumano- omputador omouma omuni açãoentredesignereusuá-
rio. É fundamental então uma forma deavaliar o su essoou não dessa omuni ação. Para isso,
foi proposto o método de avaliação de omuni abilidade [Prateset al. (2000), deSouza (2005)℄.
A omuni abilidade édenida omo sendoa apa idadedainterfa ede transmitirao usuáriode
formae azee ienteasintençõeseprin ípiosdeinteraçãoqueguiaramoseuprojeto. Oobjetivo
do método é o de veri ar omo os usuários estão re ebendo as mensagens do designer através
dainterfa eeidenti arrupturasna omuni açãoquepodemo orrerduranteainteração. Entre-
tanto,essetipodeavaliaçãonãofoirealizadanessetrabalho,vistoque, omo itado,oobjetivoda
avaliaçãoeraanalisarasoluçãoenãooprotótipo. Nesteprimeiromomento,oobjetivofoianalisar
aexperiên iadousuário.
Emrelaçãoàs sugestões,os usuários,tanto leigosquantoespe ialistas,sugerirammudançase
novasfun ionalidadesparaoprotótipo. Osprin ipais omentáriosforamem relaçãoàsformasde
visualizaçãodosresultados. Foramsugeridasnovasformasdevisualização, omotabelasegrá os,
alémde melhoriasna formaatual. Algumasdas sugestõesjá estão do umentadas para asnovas
versõesdoprotótipo, omoapossibilidadede riaçãodenovostemplateseediçãodoapresentado
atualmente omodefault. Algumasdassugestõeslevantadasestãoapresentadasno apítuloaseguir
omotrabalhosfuturos.
Deformageral, omovimos,aavaliaçãofeita omosusuáriosfoi preliminar,masfoibastante
ri aerelevante. Tivemosvários fatorespositivos, omo apresentadosanteriormente. Além disso,
duranteas entrevistas,osusuáriosarmaramqueasoluçãoéútil einteressante. Osespe ialistas
armaramquearelação usto|benefí iopara riaçãodasabstraçõesébastantepositivaeosusuários
leigosdemonstrarambastanteinteresseemutilizarasoluçãoemseus ontextosdetrabalhos.
Assim,foipossívelobterindi adoresdequearespostaparaapergunta,objetivodaavaliação,foi
positiva,sendoentãopossívelqueespe ialistas riemabstrações( onsultas)úteisparaosusuários
nais, onde esses onsigam interagir om o sistema de mineração de segunda geração sem que
saibamos on eitosté ni osenvolvidos.Sendoassim,a redita-sequeasoluçãopropostaérelevante
eútil aosusuários.
O próximo apítulo apresenta as on lusões deste trabalho, além de listar algumas direções
Con lusões
Mineração de dadosé uma área que vem res endo muito nos últimos anos, issopela apa-
idade de lidar om grandes volumes de dados, um desao res ente na bus a por informações
[Golds hmidt (2005)℄. Oarmazenamentode dadosse tornou uma práti a onstante em diversas
árease aanálise desses dados éalgo inviável de serrealizada manualmente. A mineração em si
onsiste em uma fase do pro esso de des oberta de onhe imento (KDD), a de exploração dos
dados,masusualmente otermoéusadoparareferen iartodoopro esso.
Ossistemas de mineraçãode dadospodem serdivididosem quatro gerações,onde adauma
apresenta suas ara terísti asespe í as, des ritas no apítulo 1. Nosso fo o foi em relação aos
sistemasdesegundageração,queenglobaas hamadassuiteseabrangemmaisdeumaetapado
pro essodemineraçãodedados. Essaes olhafoi pela amplaapli açãoeutilização desse tipode
sistema,vistoquenãosãodire ionadosanenhumproblemaespe í o.
A mineraçãode dadosapresenta diversasté ni as, quepodem serapli adas aproblemasdis-
tintos. Dentre asdiversas té ni asexistentes, aes olhida para serexplorada foi amineração de
regrasdeasso iação,apresentadano apítulo3. Trata-sedeumadasté ni asmaispopulares,que
tem apli açõesnas mais diversas áreas omo marketing,e onomia e iên ias so iais [Hippet al.
(2000)℄. Ela tem omo ara terísti ageral en ontrar orrelaçõesinteressantes, quenão são fa il-
mentedes obertas,embasesdedados.
Entretanto,sistemasdemineraçãodedadosdesegundageraçãoderegrasdeasso iaçãoapresen-
tamdiversosdesaosdeinteração. No apítulo2,foramapresentadosessesdesaos, omoes olha
dosatributos,es olhaemanipulaçãodeparâmetros,análisedosresultadoseentendimentosdeme-
didasdeinteresse. Todasessasdi uldadesserviram omomotivaçãopara asoluçãoapresentada
nesse trabalho. Issoporque foi dete tadoque osusuários apazes deinteragir omessestiposde
sistemastinhamquepossuirumgrande onhe imento té ni oeespe í odemineraçãodedados.
A partirdessa motivação, foi propostoneste trabalhoummodelodeinterfa eextensível para
sistemasdemineraçãodedadosporregrasdeasso iação. Eletemporobjetivoampliaroa essoa
sistemasdemineraçãodedadosdesegundageraçãoe,logo,ao onhe imentoqueessesão apazes
degerar. Para isso,ele propõea riaçãode uma amadade abstraçãoondeformas deinteração
possamserexe utadasdiretamente,semquesejamne essáriosos onhe imentosté ni os itados.
Comisso,ogrupodeusuáriosdessetipodesistemapodeserdivididoemduas ategorias,leigos
eespe ialistas. Osespe ialistas riamasabstrações omqueosleigosirãointeragir. Jáosleigos,
podem obtero onhe imentoquene essitamsemterem os onhe imentosté ni os.
pítulo 3), que entendea interaçãohumano- omputador omo uma omuni açãoentre designer e
usuário. Assim,nossasoluçãopermitequeusuáriosda amadadeabstraçãosetornem o-autores
espe ialistasdosistema.
A estrutura do modelo é omposta por três omponentes: o Gerador, a LAIU (Linguagem
Abstrata de Interfa e om o Usuário) e a Base de Conhe imento. O Gerador é utilizado pelos
espe ialistaspara riaraLAIU.ALAIUéainterfa e omaqualosusuáriosleigosirãointeragir.
Elaéde ompostaemdoisníveis,umqueenglobaaspe tosléxi osesintáti os( ompõeainterfa e)
e outro que aborda aspe tossemânti os ( hamadoInterpretador). O Interpretador faza omu-
ni ação entre o Gerador, aapli ação de segunda geraçãoe a amada de abstração. A Base de
Conhe imento, dentrodo ontexto daEngenharia Semióti a que onsideraa interação omo um
atode omuni ação,éum omponente importanteparaqueosespe ialistas,no asoosprin ipais
autoresda amadadeabstração,possamdo umentarsuasde isões. Umsub omponente dabase
de onhe imentoéodi ionário,quebus arealizaratradução dostermosrela ionadosàminera-
çãona amadadeabstração. Aestruturaedemais ara terísti asdomodelosãoapresentadasde
formamaisdetalhadano apítulo 4.
Para analisar a utilidade e viabilidade de implementação do modelo, foram realizadas duas
grandes etapas de avaliações. A primeira parte bus ava veri ar a utilidade do modelo, já a
segunda foi rela ionada a viabilidade da implementação do mesmo, a oplado a um sistema de
segundageração.
Naprimeiraparte,foram riadasabstraçõesparaumdeterminado ontextoeutilizados enários
paraveri arseomodelopoderiaserrealmente utilizado. Essaetapa ontou omaparti ipação
deusuários,alunosdegraduação,quesimulavam onsultas,deformaaveri arsea riaçãodas
mesmasseriapossível.
A segunda parte da avaliação onsistiu em testar a viabilidade de implantação do modelo.
Paraisso,uma instân iadomodelofoiimplementadaa opladaaumsistema desegundageração
existentedenominadoTamanduá,des ritono apítulo5. Comissofoi riadaumaprimeiraversão
deumprotótipo,denominadaTamanduá2.0. Essaversão onseguiuviabilizaros on eitosdes ritos
nomodelo, permitindo a riaçãodoquehaviasidoproposto. A versãodoprotótipofoiavaliada,
in lusive omaparti ipaçãodeusuáriosreais, tantoespe ialistasquantoleigos.
Comoresultadodetodasasavaliações,foipossívelper eberqueomodeloéviáveleútilparaos
usuáriosdediversos ontextosdistintos. Dessaforma,épossívelqueespe ialistas riemabstrações
( onsultas)úteisparaosusuáriosnais,ondeesses onsigaminteragir omosistemademineração
desegundageraçãosemquesaibamos on eitosté ni osenvolvidos.
O trabalhodesenvolvidotrouxe ontribuiçõesem diferentes áreas. A seguirsão apresentadas
as ontribuiçõeslevantadaseaseguirsãoapresentadostrabalhosfuturos,mostrando quetrata-se
deumapesquisaqueaindapodeserampliadaemdiversosaspe tos.
6.1 Contribuições
Estetrabalhoapresenta ontribuiçõesemáreasdistintas. Aprin ipaldelasrela iona-sedireta-
mente omoobjetivodotrabalhoemproporomodelodeextensãoparasistemasdemineraçãoem
regrasdeasso iação. A riaçãoeavaliaçãodomodelolevantapossibilidadesdeseampliaraapli a-
çãodeté ni asdemineraçãoemdiversos ontextosdistintose,omaisimportante,paraosusuários
éapli ado a qualquerambiente de segundageração. Além disso, aversãoimplementada ini ial-
mentefoi pararegrasde asso iação,masteori amente elepodeserutilizado omoutrasté ni as.
Assim, omodelonão é restritonem pelo sistema nem pela té ni autilizada, oque éum grande
benefí ioparasuautilização.
A expansãodaapli açãoéumaimportante ontribuição,issoporque afa ilidadedeinteração
em sistemasé algorelevantee extremamente importanteem qualquer ontexto. Emsistemas de
mineraçãodedados,essaimportân iaéaindamaiordevidoa omplexidadedasté ni as. Pornão
seralgotrivialede fá ilentendimento, muitasvezesessessistemas amrestritosaumgrupode
usuáriosespe ialistas. Parailustraraimportân iadesseaspe to,éimportante itarqueausabili-
dadedesistemasdeMineraçãodeDados(MD)re entementefoiapontadaem[Kriegeletal.(2007)℄
omoumdos in ograndesdesaosdaárea. Entretanto,diversostrabalhosquejáforampropostos
rela ionadosaesseaspe to ontinuam fo ando nosusuáriosespe ialistas,bus andofa ilitarain-
teraçãoeinterpretaçãodosresultadosen ontradosparaosmesmos. Nestetrabalho,apresentamos
uma propostaoriginalnosentidodeampliarousodesse tipodesistemas ausuáriosleigos. Para
isso,ateoriadaEngenharia Semióti afoiutilizada omobase,bus andoauxiliaroentendimento
dosmesmosemrelaçãoàaspe tosdainteração.
EmrelaçãoaEngenhariaSemióti a,teoriaemqueomodelofoibaseado,elaargumentaqueseo
usuárionalentendeavisãodoprojetista,existemmais han esdeele onseguirutilizarosistema
ommaiore iên ia. Omodelopropõeapossibilidadedequeextensõespermitamquesejamfeitas
adaptações dosistema ao onhe imento dousuário. Paraisso, também fazusode expli ações,
utilizando omponentes omoabasede onhe imentoparamelhorara omuni açãoentreousuário
espe ialista e o leigo. Ao implementar o modelo utilizando o Tamanduá, sistema de segunda
geração, foi possível avaliar e obter indi adores positivos sobre a solução e, onseqüentemente,
sobreateoria. Dadoqueateoriaaindaére ente, oletar dadossobre oapoioqueela é apazde
ofere erna geraçãodesoluçõespráti aséimportante parauma avaliaçãomaisamplada mesma.
Entretanto, outras avaliações e análises devem ser feitas, espe ialmente observando o uso real
dosistema em um determinado ontexto,analisando omo osusuáriosfarão usodosre ursos de
extensãoeexpli açõesforne idas.
Otrabalhoaquiapresentadoforne eumexemplode omoaEngenhariaSemióti apodeapoiar
a riação de modelos(e sistemas) que possam melhorar aqualidade da omuni ação. No nosso
aso, asmelhorias da omuni ação onsistem em permitir que usuáriosespe ialistasapresentem
uma interfa e que ofereça han e de usuários leigos exploraremsoluçõesde mineração de dados
paraseusproblemas.
Outro aspe to relevante do trabalho éouso dataxonomia baseadana Engenharia Semióti a
para ara terizaçãode extensões. Aimportân ia nautilizaçãodataxonomiafoipermitiranalisar
a apa idadeepoderdasextensões,in lusive omvisõesdediferentesusuários. Assim,foipossível
ilustrar omoas ategoriaspodemdes reveraextensãoemtermosdosistema omputa ionaledos
usuários. Vale ressaltarqueataxonomiapermitiu analisaredistinguiraextensãosoboponto de
vistadousuárioespe ialista(queproduz aextensão)edousuárioleigo(queautiliza) etambém
dosistemademineraçãoemsi.
Vários autoresargumentamquea extensão éfundamental para queo sistema sejarealmente
de alta usabilidade [Nardi (1993)℄[Fis heretal. (2004)℄[deSouza eBarbosa (2006)℄. O trabalho
ofere eindi adoresnessadireçãojáquepermiteaadequaçãodesistemasgenéri osparasituações
usuáriosespe ialistas quantoleigos.
Existemtambém ontribuiçõespráti asemrelaçãoaoprojeto Tamanduá,visto queuma nova
versãofoidesenvolvida,nãoperdendoasfun ionalidadesjáexistenteseenglobandodiversosaspe -
tosimportantes quenãoexistiamnosistema anterior. Comisso,épossívelutilizaranovaversão
emdiferentes ontextose omusuáriosqueatéentãonãoeraminseridosnopro essodemineração.
Dado o ontextode uso atual do Tamanduá, apossibilidade de uso por parte de usuário leigos
éum grandebenefí io, vistoque existe uma grandedi uldade deinteraçãoatualmente. Paraa
versão riada,novasapli açõesepoten iaispar eirose lientesjáestãosendolevantados,vistoque
opúbli oalvopodeserampliado.
Contextualizandoas ontribuiçõesdestetrabalhoemrelaçãoà omputaçãoemgeral,éinteres-
sante itaros grandesdesaosda omputaçãoidenti adospela omunidadeno en ontropromo-
vido pela So iedade Brasileirade Computação (SBC), que apontampara problemas entrais da
omputação[SBC(2006)℄. Osproblemasse ara terizamporseremvisionárioseambi iosos,mas