BÖLÜM 5. MATERYAL METOD
6.10. Model ÇalıĢması
6.10.1. Kimyasal parametrelerin değiĢimine göre biyolojik parametrelerdeki değiĢimin testi
Existem v´arias linguagens relevantes para a formaliza¸c˜ao da taxonomia, incluindo variantes da l´ogica de primeira ordem [Abiteboul et al., 1995], restri¸c˜oes de integridade [Grefen, 1993] e restri¸c˜oes de recusa [Fan e Geerts, 2012].
Este trabalho aplicou uma linguagem de formaliza¸c˜ao baseada em [Fan e Geerts, 2012; Grefen, 1993; Maier, 1983; Ramaswamy et al., 2000] cujos elementos s˜ao apresentados em detalhes abaixo e resumidos no Quadro 4.1. Tal formaliza¸c˜ao ´e bem conhecida na comunidade de banco de dados e proporciona os elementos necess´arios a descri¸c˜ao dos defeitos nos dados. A avalia¸c˜ao da linguagem mais apropriada para descrever os defeitos est´a al´em do escopo deste trabalho.
Crit´erio de Qualidade Defeito no Dado
Acuracidade Granularidade Heterogˆenea Referˆencia Incorreta Tupla At´ıpica
Tupla Sobrecarregada Tuplas Duplicadas
Unidade Medida Heterogˆenea Valor Impreciso
Valor Incorreto Valores Homˆonimos Valores Sinˆonimos Completude Referˆencia Ausente
Subdom´ınios Disjuntos Tupla Ausente
Consistˆencia Replica¸c˜ao Incompat´ıvel Tupla Falsa
Viola¸c˜ao de Dependˆencia de Chave Viola¸c˜ao de Dependˆencia de Inclus˜ao
Viola¸c˜ao de Dependˆencia de Inclus˜ao Condicional Viola¸c˜ao de Dependˆencia Funcional
Viola¸c˜ao de Dependˆencia Funcional Condicional Viola¸c˜ao de Integridade Semˆantica
Viola¸c˜ao de Raz˜ao de Cardinalidade Viola¸c˜ao de Regra de Inferˆencia Viola¸c˜ao de Restri¸c˜ao de Dom´ınio Viola¸c˜ao de Restri¸c˜ao de Participa¸c˜ao Viola¸c˜ao de Restri¸c˜ao de Transi¸c˜ao
Tabela 4.2: Crit´erios de Qualidade versus Defeitos nos Dados (Font: Elaborado pelo autor)
R el a ci o n a l
Banco Dados Relacional Conjunto de esquemas de rela¸c˜oes, denotado por BD = {R1, R2, R3..., Rm}, m ≥ 1
Esquema da Rela¸c˜ao Conjunto de atributos, denotado por R(A) = {a1,..., ak}, k ´e a aridade da rela¸c˜ao
Subconjunto da Rela¸c˜ao Lista de atributos X, Y ⊂ R(A), R ∈ BD e (X ∩ Y ) = ⊘ Estado da Rela¸c˜ao Conjunto de tuplas, denotado por r(Ri) = {t1, t2, t3..., tn}
Tupla Cada tupla tp, p ∈ [1, n], ´e uma lista de q valores tp= {v1, v2, ..., vq}
Valores da Tupla Cada valor vs, s ∈ [1, q], ´e um elemento do dom´ınio de um atributo as,
denotado por t[as]
Relacionamento Regra de integridade referencial entre rela¸c˜oes RW (referencia) e RU (referenciada),
denotada por Rel : RW → RU, onde RW, RU∈ BD e Rel = {(a1w, au1), ..., (awg, aug)}
Enciclop´edia Universal Defini¸c˜oes l´exicas, relacionamentos e graus de similaridade dos termos de uso comum, denotado por LEX
O p er a ci o n a
l Predicados para Valores ⊖ = {<, ≤, =, 6=, ≈, ≥, >} Predicados para Conjuntos Q = {∈, /∈, ⊆, ⊂}
Conectores L´ogicos {∧, ∨} do tipo Boolean × Boolean → Boolean Conectores Un´arios {¬} do tipo Boolean → Boolean
Quantificadores {∀, ∃} s˜ao os quantificadores universal e existencial Operadores de Conjunto {∪, ∩}
Quadro 4.1: Resumo da Linguagem de Formaliza¸c˜ao e Conceitos de Bancos de Dados Relacionais (Fonte: [Josko et al., 2016])
Defini¸c˜ao A. (Banco de Dados Relacional): Um esquema de banco de dados re- lacional BD compreende um conjunto de esquemas de rela¸c˜ao representado por BD = {R1, ..., Rm}, m ≥ 1.
BD, ´e um conjunto finito de atributos A = {a1,..., ak} representado por R{a1, ..., ak} ou
R(A). O valor k denota o grau ou aridade de uma rela¸c˜ao. Cada atributo aj, j = [1, k], ´e
regulado por um dom´ınio Dj indicado na forma de dom(aj). Cada dom´ınio ´e um conjunto
n˜ao vazio de valores atˆomicos e finitos.
Defini¸c˜ao C. (Subconjunto da Rela¸c˜ao): Subconjuntos de um esquema da rela¸c˜ao, denominados X, Y , representam listas finitas de atributos, na qual X, Y ⊂ R(A), R ∈ BD e (X ∩ Y ) = ⊘.
Defini¸c˜ao D. (Estado da Rela¸c˜ao): Um estado da rela¸c˜ao r de uma rela¸c˜ao R repre- senta um conjunto de n tuplas na forma de r = {t1, t2, ..., tn}, denotado por r(R). Cada
tupla tp, p = [1, n], constitui uma lista de q valores representado por t = {v1, v2, ..., vq}.
Cada valor vs, s = [1, q], representa um elemento do dom´ınio do respectivo atributo -
dom(as) - cuja referˆencia ´e realizada por t[as]. Cada tupla descreve uma cole¸c˜ao de valo-
res relacionados que representam afirma¸c˜oes verdadeiras ou fatos sobre objetos - entidades, relacionamentos ou fenˆomenos - do UdD.
Defini¸c˜ao E. (Relacionamento): Um relacionamento Rel denota uma regra de inte- gridade referencial entre as rela¸c˜oes RW - referencia - e RU - referenciada - na forma de
Rel : RW → RU, na qual RW, RU ∈ BD e Rel = {(aw1, a1u), (aw2, au2), ..., (awg, aug)}. Cada
au
x, x = [1, g], ´e um elemento do subconjunto de atributos U que identifica univocamente
cada tupla da rela¸c˜ao RU, tal que U ⊆ RU(A) e n˜ao h´a subconjunto U′ ⊂ U com essa pro-
priedade. Cada aw
x, x = [1, g], ´e um elemento do subconjunto de atributos W da rela¸c˜ao
RW - no qual W ⊆ RW(A) - que referencia RU.
Defini¸c˜ao F. (Enciclop´edia Universal): Uma enciclop´edia universal - do inglˆes Uni- versal Thesaurus - provˆe as defini¸c˜oes l´exicas dos termos de uso comum e seus respectivos relacionamentos e graus de similaridades, denotado por LEX.
Ademais, cada defeito ´e ilustrado mediante exemplos hipot´eticos extra´ıdos de um caso simplificado do dom´ınio financeiro [Alves e Menezes, 2007], expresso no modelo de dados l´ogico da Figura 4.3. Nesse modelo, a entidade Cliente possui certas propriedades de Pes- soas F´ısicas e Jur´ıdicas propriet´arias de produtos cart˜ao de cr´edito ou d´ebito. A entidade ContaCartaoCredito denota as propriedades dos produtos de cart˜ao cr´edito adquiridos. A entidade ContaCreditoCliente representa todos os diferentes pap´eis de relacionamentos - titular ou co-titular - entre clientes e os cart˜oes de cr´edito. Por sua vez, o produto cart˜ao de d´ebito apresenta entidades com significados an´alogos, respectivamente ContaCartao- Debito e ContaDebitoCliente. Uma instˆancia I0 para cada uma das rela¸c˜oes mencionadas
Figura 4.3: Modelo l´ogico de dados relativo a caso do dom´ınio financeiro (Fonte: Elaborado pelo autor)
CCd Nome Cargo Salario UF Cidade CEP Idade Est.Civil ConjugeCd
c1: 1 John Taylor Bassist 20k SP SP 08000 52 E 19
c2: 3 Joan Ripley Tapster 320k BHZ BHZ 03000 20 M 40
c3: 8 John T. Bartender 20k MG BHZ 08200 52 W NULL
c4: 13 Ann P. Taylor Barkeeper 249k MG BHZ 03200 44 U 1
c5: 19 Chris Taylor NULL 8k SP SP 08100 39 J 28
c6: 28 Carl de la Poll Student 21k SP SP 08400 34 M 13
c7: 29 James Bond Bassist 22k SP SJC 08000 53 W NULL
c8: 40 Alice Bond Bassist 1k SP SP 08051 53 E 49
c9: 41 John N. T. Principle Manager 40k MG BHZ 03099 17 Y NULL
c10: 3 Ann P. Taylor Writer 38k MG BHZ 03200 44 J 1
c11: 52 Jean P. Jones Student 33k SP SJC 08400 15 S NULL
c12: 53 Dick Rhodes Writer 35k SP SJC 12200 45 W NULL
c13: 59 Laus Kisley Principal Manager NULL SP SP 08501 39 W NULL
Tabela 4.3: Uma instˆancia da rela¸c˜ao Cliente (Fonte: Elaborado pelo autor)
CCCredCd DataAtivacao TempoUso EhGratuito
cr1: 100 07/30/2001 13 N˜ao
cr2: 155 01/19/2004 10 N˜ao
cr3: 199 05/12/2005 9 Sim
cr4: 200 01/19/2004 1 N˜ao
cr5: 201 04/11/2013 1 N˜ao
Tabela 4.4: Uma instˆancia da rela¸c˜ao ContaCartaoCredito (Fonte: Elaborado pelo autor)
CCCliCd CCCredCd CCd Score EhTitular UF
cc1: 120 100 1 2.12307 Sim SP cc2: 312 100 13 3.00999 N˜ao MG cc3: 138 100 19 1.80500 N˜ao SP cc4: 813 100 3 3.10999 Sim SP cc5: 883 155 28 2.11001 Sim SP cc6: 901 199 44 3.89099 Sim SP cc7: 902 200 40 2.12320 Sim MG cc8: 903 201 52 1.83449 Sim MG cc9: 909 201 41 1.80011 N˜ao MG cc10: 911 100 3 19.13329 N˜ao SP
Tabela 4.5: Uma instˆancia da rela¸c˜ao ContaCreditoCliente (Fonte: Elaborado pelo autor)
CCDebCd Score BonusConta DataAtivacao
da1: 54 1.77707 50 12/23/2009
da2: 70 1.68123 50 01/20/2001
da3: 79 1.71167 25 04/11/2014
da4: 29 1.62344 33 04/11/2014
CDCCd CCDebCd CCd Score EhTitular
dc1: 62 54 8 2.77707 Sim
dc2: 37 70 53 1.68123 Sim
dc3: 39 79 41 1.71167 Sim
dc4: 45 29 59 1.60000 N˜ao
Tabela 4.7: Uma instˆancia da rela¸c˜ao ContaDebitoCliente (Fonte: Elaborado pelo autor)