Marmara IletiSirn Dergisi, Sayt:7, Temmuzl994
isurisrixsEr,
vERi
TABANLART
vE
BASrN
iSrnrUnrERiNDE
KARAR DESTEK
SiSrBUi
OLU$TURMAK
iQiN
KULLANTLABiLECEK BiR
isr.lrisrixsEt,
vERi
MoDELi
ArE.
Giir.
Cem S.SUfqt)
MARMARA
UMVERSITESI
iktisadi
veidari Bilimler
Fakiiltesi1.
Giril
Bu gahqmanrn amacr, Basrn Sektdriinde gahgrp,
belirli
konularda ka-rar vermek durumunda olan her diizeydeki y6neticinin ihtiyagduyabileceli
bir
Karar Destek Sistemi (KDS-Decision Support System-DSS)oluqturmak-tr.
Bu amag do[rulnrsunda kullanrlabilecek uygun ve verimli bir istatistikselVeri
TabanrY0netim
Sistemi(iVTYS-Statistical
Data Base Management System-SDBMS ) modelihazrlamaktr.
2.
Karar
DestekSistemleri (KDS)
Karar Destek Sistemlerinin amacr,
biligim
teknolojisini yOneticilerin hizmetine dahaiyi
bir
qekilde sunulmasrnr saglamaktr. KDS geqitli alanlar-dan kavram ve teknikleri bir araya getirerek karar verme durumunda olan kr-qilere "destek saflar". Bu alanlar; bilgisayar, matematik, ydnetim ve organi-zasyon,psikoloji
ve igletmegibi
gok farkh dallan kapsar. KDS, farkh alan-lardaki gahgmalann, gegitli bilgisayar teknikleri kullanilarak karar verme sii-recine katkrda bulunmasrnl temin eder [1].istatistiksel Veri Tabanr Ydnetim Sistenrleri de bu amaca ydnelik ola-rak kullanilabilen bilgisayar tekniklerinden
biridir.
S.
istatistiksel
Veri
TabaruYiinetim
Sistemleri
dVTYS)
Devlet istatistik Enstitiisii
(DiE) gibi
kurumlanniilke
gaprndaadalet, sosyal giivenlik, tartrn, madencilik, enerji, imalat sanayii, inqaat,
ulaq-t1rma ve haberlegme, turizm, ig ve drg ticaret, fiyat indeksleri, maliye ve
milli
hesaplar gibi qok gegitli konularda ve qokbiiyiik
miktarlardaki verinin, gegitli konularda ara$tlrma yapan kiqi ve kuruluglara faydah olabilmesi igin,kulla-nlclnln
kolayca ulagabilecefi,istedili
veriyi
yrlrn
arasmdan krsa zamandado!ru bir
gekildesiizebileceli bir
model iginde sunulabilmesi gerekmekte-oir. G[numiizde kullanrlanveri
Tabanr Yonetim Sistemleri -ya daiwYS
ile
ilgilenen aragtrmacrlafln ifadesiyle-
Ticari
(veya iq)Veri
Tabanr YonetimSistemleri (TVTYS-Commercial (or
Business)Data
Base ManagementSystems-CDBMS)
modellerinin
yaprsrndakibirtakm
eksikliklerden veya veri modeli diizeyi (data model level) ve kavramsal dtizeyi (conceptual level)gibi
aynmlan yapamamalan nedeniyle eleqtirilmektedir [3].ivTYS'lerin,
gerek kullanrm alanlan, amaqlarl hitapettikleri
kulla-nrcr kitlesi, gerekse bulundurduklan veritiirii,
muhafaza edilig bigimi, iizer-lerinde yaprlan sorgulama ve diizenleme iglemleri ve hacimleri bakmmdan, TVTYS'lerden farkholdufu,
80'liyrllafln
baqrndan itibaren ortaya atllmaya baglamrgtr [4].4.
TVTYS
veiVTYS
Arasrndaki
Farklar
veAlternatif Oneriler
ileri
siiriilen farklar qu baqhklar alunda toplanabilir:f .
iVTYS'de
bulunanveri,
sadece saytsalveridir.
Bunun yantnda TVTYS'de sadece sayrsal veridelil
alfasaylsal veri de bulunur (bir igletme-ninstoklalnrn
Ufuldugu veri tabant veya PTT'nin abonelerinin kayrtlannm tutuldupu veri tabangibi).
2. TVTYS'lerde
veri
modeli diizeyi detaylt olarak ele almmamtgtn' Bu konu daha detayh olarak SDM4S modeli konusunda agtklanacaktr.3.
TVTYS'lerde
iliqkisel Veri
TabanrModeli (ilvTM-Relational
Database
Model-RDBM)
kullanrlmaktadtr. Bu sistemde, de[iqkenler ve ka-tegoriler arasmdakiiligkiler
tespit edilmekte ve builigkiler
gozoniine alma-rak, toplanan giincel veri sattr ve siitunlardan oluqaniki
boyutlu, matris $ek-lindebir
tablo haline getirilmektedir. Bu model, ticari yazrhm girketleri tara-findan oldukga kabul gormiig ve giiniimiiziin belli bagh veri tabant program-larmda kullanrlmaktadr. Fakat veri sorgulama yeteneklerinin, SQL (Struc-tured Query Language-Yaprsal SorgulamaDili)
gibi gtiniimiiziin popiiler ve oldukqa yetenekli sorgulamadillerinin
kullantlmastnaralmen
yetersizkal-drlr ileri
siiriilmektedir.Onerilen alternatifler de
iki
noktada birleqmektedir:1. Semantik Yaklagrm (Semantic Approach): istatistiksel kategori ve deligkenlerin arasmdaki karmagrk
iliqkiyi
dahaiyi
agrklayabilecek birnesne-iliqki
(Entity-Relationship-ER) yaprsr olugturup, bunu konuqmadilinin
an-lam diizeyine yaklaqtrrrp iliqkisel veri tabanr yonetim sistemi sorgulamadi-linde iyilegtirmeler yapmak.
2.
Nesne
Y6nelimli
Veri
Tabanr
Ydnetim Sistemi
Yaklagrmr (NYVTYS -Obj ect Oriented Data B ase Managemenr S ysrem-OODBMS ) : Bu oldukgaradikal
yaklayma gtire.iLVTYS'deki
kalrtsaleksiklikler,
gokbiiyiik
veri tabanlannrn ycinetimini giiglegtirmektedir. Qiinkii, bu tip veri ta-banlan, NASA'nrn uydular aracrhfr ile eldeettifi
iklim,
hava kogullan, astro-fiz1kve okyanus veri sistemlerine ait veri igeren, defigkenleri arasrnda qok karmaykiligkiler
kurulmasr gereken ve giinde eklenen verimikan
36 Gbit'e (1Gbit=t09 bit)
kadar grkabilenriirdedirler
[2].NWTYS'de
de[iqkenler, kategoriler ve bunlarm arasrndakiiligkiler
birer nesne olarak belirlenmekte ve daha somut hale getirilmeye gahgrlmak-tadrr.
Ornefin,
Apple Macintosh bilgisayarlannrn iqletim sistemi de nesne y0nelimlibir
yaklagmrn iiriiniidi.ir.Bir
veri dosyau, klasOr nesnesi olarak ta-nrmlanmrg ve bu klasdriin silinebilmesi igin de sisteme bir gOp sepeti nesnesi dahil edilmigtir.Bu
iisttn
dzelliklerineralmen, NYVTYS
kullanan veri tabanr prog-ramlan heniiz qok yenidir. Hatta diinyada da kullanrml tam olarak yaygrnlaq-maml$tlr.Ticari
olarak yeni yeni kabul gdrmektedir [6].S.iVTYS
iqin
Hangi VTYS Uygun
Olabilir?
Bir
ivryS'nin
kullanrm alanr, kullanrcrprofili
gok geniqtir. Bu tipbir
veri tabanrnda bulunan veri, kullanrcrnln amactna uygun gekilde siiziildiikten sonra, eler uygun analiz teknikleri ve sorgulama prosediideri yeterli delilse, yetkin
bir
istatistik paket programma veya bagkabir
veri tabanr programrnaaktanlabilmeli
ve KDS'de kullanrlan matematiksel programlama, marjinal analiz,girdi-grktr
analizi,kuyruk
teorisi, envanter teorisi,proje
yOnetimi (PERT/CPM), simlilasyon,giivenilirlik
ve kalite kontrol, zaman serileri,riye ddnilk tahmin (forecasting) ve faktor analizi gibi yontemlerin iizederin-de uygulanabilmesine imkan
vermelidir'
Durum bu agtdan ele ahndr[rnda,
ILVTYS
kullanan programlann gokbiiyiik bir
avantaja sahip oldupu ortaya glkmaktadlr. Halen kullantlmakta olan ttim geligmiq veri tabanr programlan (dBase, FoxPro,oracle,
Sybase' paradox, Access gibi), elekuonik hesap tablolafl (Lotus-123, Excel, QProgi-bi)
ve istatistik paket programlan (SPSS, SASgibi)
ILVTYS
kullanmakta veya en azrndan bu tip veri tabanlarlyla ahgverig yapabilecek gekilde diizen-lenmektedir. GiiniimiizdeILVTYS, bir
endiistri standardt durumundadr.Orc yandan, veri
miktafl
her zamanNASA
veri tabanlanndaoldulu
gibi gok agur miktarda olmayabilir. Kavram di.izeyinde sorgulama gekilleri-nlo u" oegigtenler-kategoriler arasr
iligkilerin
iyi kurulabildili
bir
modelinbir
ILVTYS
olabilecefi
ifade edilmektedir.Bu sebeple. Basrn Sektorti ile
ilgili
Karar Destek Sistemininkullana-calr iVTyS'nin
modelinin iligkiselbir
model olmast, tercih edilmesi gerekenbir
durumdur.6.
ibtatistiksel
Veri Modelleri
(iWt-Statistical
DataModels'SDM)
NT'lerin,
istatistiksel amaglarla toplanan verilerin tablola$tmlmasl, istatistiksel verinin ara$tfmacllaf arastnda payla$lmlnln sallanmast gibi ne-denlefle geliqtirilmeye baqlanmasmarafmen,
ilk
yrllarda kullanrcrlar,veri
hakkrndabilgi
sahibi olan kigilerlesrnrh
kaltyordu ve bilgisayar kaynaklart yetersizdi.Bilgisayar donantmmdaki geligmeler ve bilgisayar kullantmtnm
po-piiler
olmasryla bu durum de[igmeye bagladr.ivT'ler
daha fazla alanda kul-lanrlmaya baglandr. vedo[al
olarak aragtrrdrgr veri tabanlndaki verininbo-yutlalndan
habersiz kullanrcilarm saylslafifi.
Sonuqta bu kullantctlar,kul-landrklan veri tabanmda hangi verinin
oldulu
ve onlara nasrl ulaqrlacalt ko-nulannda zorluklaria kargrlaqtrlar.fudrndan
da istatistikselverinin
yanhg kullanrmt ciddibir
problem haline geldi.Bu durumu diizeltmek
igin
198O'lerden itibaren pek gok ara$trmacl,iVT'lerin
manttksal yaptlannl tantmlayan notasyonlarln formulleqtirilmesi iizerinde gahqtrlar. Butip
notasyonlara istatistikselveri
Modeli
(IVM-Sta-tistical Data Model-SDM) denilmektedir.
Genel olarak bir veri modeli, (1) veriyi tanrmlayan bir notasyon ve (2)
veriyi
yonetmek igin kullanrlan iglemlerbiittnii
anlamrna gelmektedir. Bir istatistiksel veri modelinde, veri tabanrnda tutulacak olan verininbir
tanrmr yapilrr. Deligkenler, kategoriler belirlenir. Kavramlar ortaya ko-nur. Qahqmanrn bir Eergevesigizilir.
Bu gergeve igine verinin nasrlyedegtiri-leceli
(veri tabanr dosyasrnrn yaprsr) belirlenir. Son olarak da gergekdeler-ler, belirlenen yaplya uygun
bir
gekildeyerlegtirilir.
Bu amagla kullanrlabilecek genel yaprdaki
iVM'lerin ilki
1981 yrhn-da Chan ve Shoshani tarafrndan ortaya konulan ve oldukga yetkin bir diizey-de olan SUBJECT adh modeldir. Daha sonraSAM*,
GRASS,MEFISTO,
CSM, STORM ve SDM4S
gibi
modellergeligtirilmigtir.
Bu
modellerin hemen hemen tamamlkronolojik
olarakdilerinden
sonra gelen ve oncekilerin eksik taraflannr telafi eden modellerdir [5]. 6.1. SDM4S
Veri Modeli
(Statistical Data Model Based on 4 Sche-ma Concept-4 geSche-maiVn4-+givVt;
Bu model,
diler
iVM'lerden
veTVTYS
modellerinden farkhhkgcis-terir. Daha kapsamhdrr. Bu modelin
bir
uygulamasr 1990 yrhndan beri Ja-ponya Ulusal Arazi Ajansr(l.tI-A)
tarafindankullanrlmaktadr.
Ticari veri tabanlan da dahil olmak iizere tiim diEer iVM'lerde model
iig
agamadan oluqmaktadr.1. Kavramsal $ema Aqamasr (Conceptual Schema Level) 2.
VT
$emasr Agamasr(DB
SchemaLevel)
3. Enstantane
Veri
$emasr Aqamasr (Instant Data SchemaLevel)
Birinci
aqamada iVTYS'de olmas beklenen verinin bir tanrmr yaprlrr.iVT'nin
manflksal yaprsr olugturulur. Yani, veri tabanmda kavramsal olarak olabilecek nesne diinyasr (object world of database) tarif edilir. Bunun drgrn-daki herhangi birreri
nesnesinin veri tabarunda yer almasr miimktindelildir.
Omelin, $ekil
1.'deki 8,376bir
Ozet veridir. imalat sektOriindegalr-gan 39 yaq altrndaki erkek iggilerin 1980 yrhndaki saylslnl gostermektedir. 151
Yaq, cinsiyet birer dzetleyici deliqken, imalat sanayii, ttim endiistri, servis sektorti ise birer kategori defiqkenidir. Bu tablodaki
bilgiler
de 5yrl
araile
toplanmakradrr. Bu ozer
veri $ekil
2.'dekigibi bir
gapraz tablo geklinde de g0sterilebilir.$ekil
1. Beg YrldaBir
Yaprlan iggi-igveren Saytmt Detayh Sonuglan\
De$igkenler
x
0) o =. oOzet
Veri
5 Yrllrk Endtistri Ver i I eriCinsiyet ve yaga gdre iggiler igyeri Sayrsr
E 0, = -t o E. D = o
=
E K E K 1 980 Trim Endtlstri Urelim Grda Makina Diger Hizmetler Diger 1 985 Trim Endtistri 68942 18611 2329 6523 9762 3791I
12410 69037 8376 2329 6523 9762 3791I
12410 21 859 68942 3257 1231 5879 1 443 391 0 15672 68942 5584 2EA 5781 2458 12578 buv / 22738 68942 l\tvr ,{ 6a 426 5896 2547 9872 8768 8932 1 430 291 JZO 813 6320 1182 9468 4753 409 116 49 244 381 2 532 4848 41 79 1021 t/\t 277 2508 650 4620$ekil2.
Qapraz TabloIkinci
agama, veri tabanr dosyasrnrn kendisidir. Bu agamada veri taba-nrnda giincel olarak bulunan veritarifedilir.
Veri
tabanrnrn yapruolugturu-lur. Verinin tipi,
alangeniqlifi
tespitedilir.
Ornelin,
Yaglar 39 yaq altr ve 40 yag iistti olarak gruplanrr. Cinsiyet erkek ve kadrn olarakgruplanr.
Yaglar sayrsal deler, cinsiyet kategorikde-ler
alr.
Ugiincii agamada, VT'de yer alacak herbir 0zer veri tarif edilir.
Orne-!in,
"1985 imalat sanayiinde gahgan 40 yag tistii kadrn sayrsr 8768 dir.', gibi. Bu modelin eksik tarafi, biriVT
igin kawam gemasl agamasrnrn,iVT
nin kap-sadrlr alanrtarif
ederken yetersiz kalmasrdr.Ornelin, bir
firma elindeki riim iqgilere aitgekit
1. deki gibibilgileri
istatistiksel olmayan
bir
veri tabanrnda (Ticariveri
rabanrnda) tutuyorol-sun. Bu veri tabanrnda kayrth olan tiim igEiler bu iqletmenin iqgileri olacalr gibi,
VT
de yeralmayan bir iqgi o iqletmede gahgmryordur.Zatenbtda bekle-nen bir durumdur. QiinkiiTVTnin
gergekilgi
alanr sadece kendisi igingerek-li
olanbilgileri
kapsar. Fakat biriVI
igin b6yle bir durumun sozkousu olma-masr gerekir.Ornefin,
ivt,
TVT'nin
kapsamadrlr bagka igletmelerin iggile-rine aitbilgileri
de kapsamahdrr. Ancak bu sayede o veri rabanr gok farkh ve qegitli ihtiyaglan olan kullanrcilara cevap verebilir. Sonugta, bir TVT'nin veri dtinyasriVt
igin yetersiz kalmaktadrr.Bu
yetersizlili
ortadan kaldrrmak igin dOrdiinci.ibir
agamageligtiril-miq, daha agrk
bir
ifadeile
kavramsal aqamaiki
krsrma ayrrlmrgtrr. BudOr-diincii
agamaVeri Modeli
Aqamasr (Data ModelLevel)
drr.Bu aqamada
iVt'Oe
bulunan tiim veri (kategori deliqkenleri -satrlar-daki deligkenler- ve 0zetleyici defigkenlerin -siitiinlardaki deligkenler- kap-samlan) tarif edilir. Buna ihtiyag vardrr. Qtinkii birigyainin
veri tabanr statikbir
veri tabanr olabilir. Ama istatistikselVeri
Tabanrnrn geligen/dinamikbir
veri
tabanr olmasr gerekir. Kullanrcmrn aradrlrbir
veriyelVt'de
ulagmasr miimktin defilse, o veriye en yakrn veriye ulaqmasrnr sallamak igin diizenle-meleryaprlr.
Ornelin, $ekil
1.'deki tabloyaek
olarakgekil
3. deki tablonun daiVt'0e
yer aldrlrnr diigiinelim, Bu tablo, ara yrllarda iggi ve igveren Anketi sonuglannrn, cinsiyet ve ya$aynmr
yaprlmadan toplanmasryla elde edilmiq olsun.Kullarucr, ', 1982 yrlrnda imalat sanayiinde gairgan 40 yaq
iistii
kadtn sayrsrkagtr?"
sorusuna cevap olarak "B0ylebir
veriyok"
mesajr almamah. oorrny".lne
,'imalat sanayiinde gahqan 40 yagiistii
kadrn sayrsrdelerleri
5yrtda Ulr almmaktadr. Fakat 1980 yrh igin imalat sanayiinde gahgan 40 yaq
iistii
kadrn sayrsr 1,397'dir" mesajtntalabilmelidir'
YILLAR
EndUstrilere
Gore l99i
SaYtlart TtimEndustri
Uretim
Hizmetler
Diger
1
980
1 981 1982
bUUC/
70923
72341
18685
19339
19687
37865
38925
39782
12307
12659
12872
$ekil 3. Ara
yrllarda
Yaprlan iqgi ve iqveren Anketi Genel Sonuglart Boylebir
modelbir
iliqkiselveri
tabant iizerine kurulabilmektedir' 6.2. BasrnSekttiriinde
Bir
iVM
DenemesiBasrn sektririi ile
ilgili
olan aragtrmactlann gereklibilgileri
bulabile-cekleri bir veri tabant ve bubilgileri
qeqitli ydntemlerle delerlendirebilecek-leri bir Karar Destek Sistemi yaplsl oluqturulmasrnda 4 qema istatistiksel vgri modelikullanrlmtqtr.
Modelin
genel aqamalan 9u gekildedir:- Bastn Sektdriinde yOneticilerin ihtiyag
duydulu
bilgi
kapsammtn tespit edilmesi._ Bu
Eergeve iqinde,
yazh
Basrn, Gorsel ve igitsel Basrn gibi iistkate-gori srnrflaflnm (superclass) ve gahqanlar, satrglar, gairganlafln cinsiyeti gibi alt srnrflartn (subclass) kavramsal olarak tespit edilmesi'
- Olugturulan bu yaprya gore veri tabanrna verinin yedeqtirilmesi.
G_
ne[in,
"Yazrh Basrnda Gazetelerde gahgan kadrn sayrsr" nrn sorgulanabile-cepi qekilde veri tabanrn yaplslnln oluqturulmau.-
veri
rabanmda yer alan rek rek verinin tarif edilmesi.ornefin,
"ya-alr
Basrnda Gazetelerde gahgan kadm sayrsr 12g9 dur',.Veri Modeli Agarnasr $ernasi
Kavrarnsal,\arna $enasr
ato
Enstaltane Veri $emasr
$ekil 4. 4 $ema uzerine oturtulmug Basrn Sektorii istatistiksel
veri
Modeli
Genel YaprsrBu agamalardan
ilki
olanVeri Modeli
Agamasr, gahgmanrn en uzunsiirecek ve en kapsamh
b6liimlinii
olu$mrmaktadrr' Qiinkii bu aqamad'a basln sektoriinde hangi verininioplanabilecefinin belirlenmesi gerekir. Daha son-ra da bu topianan verinin bir karar verme siirecinde kullanrlabilmesi iginne
gitt O.irtni"-"lere
tabi tutulmaslgerektili
belirlenecektir' 7. SonuqBiristatistikselVeriModelikultanrlarakBasrnSekt0rijndeyonetici-lerin ihtiyaq
duyabilece[iilil;
Destek Sistemi hazrrlamak iqin'4$iVM
modeli uygunbir ,"q"nJk
ottut
karqtmtza grkmaktadrr' Bununda
@melse-bebi
diler
modellerdenl'itt
J"tvft
tt
gen1Oe oluqturulmuqolmasdrr'.Iliy
kisel veri tabanl yaplsm'O"ton"tnoi'
veri modeli a$amaslnl da gOzOniinde bulundurmasr,rulanrcrtai
agrsrndan avantajlar taqrmaktadrr.Qiinkii
giinii-miizde ticari olarak mrianrLan hemen hemen biidin veri tabanr yonetim sis-temleri iliqkiselvuptv'
J""-Cemektedir'
Bu da4$iVM
modeline esnekliksa$amaktadr.
BibliografYa
[1] Angehru, Albert
A'
Stimulus Agents: An AlternetiveFrameworkfor
,
-'
"-''co*prrt
er_,q,ide,
i i
ecision Making. I2thlnternadonal
conferenceon Decision Support Systems' 1992' s' 81 [2] French,
L
C', Suppirtfor
Scientffic!91a.base Management' Statisti-cal and Scientitic iatabases'
(Z'
Michalewiczed')Ellis
Horwood' Chichester, West Sussex' 1991' s' 55'[3] Sato, H., Nokano,
i',
Foku'u*u
Y''
Hotaka P.'' Conceptual Schema-'
--
io,
awide
scoie
stattstical Database and its Applicotions. Proce-edings of trO.intt*utlonal
Working Conference on Statistical and Scientific Database Management' 1986'[4] Shoshani A., Oil<en
F',
WongH' K'T
"
Statistical and Scientific Da-tubase Issues'iBgg
Traniactions on Software Engineering'Vol'
SD-11,
No: 101985'
ss' 1040-1M7'15) Stat:istical
and
Scientific Databases'IvtichalewiczZ"
ed"