Haber Videolarinda
Ilgililik Geribeslemesiyle
Icerik Tabanli
Eri§im
Content-Based Retrieval of
News
Videos
Using
Relevance Feedback
Ozge
(QavuA,
Selim
Aksoy
Bilgisayar Muihendisligi
B6luimui,
Bilkent
Universitesi,
Bilkent, 06800, Ankara
{cavus,saksoy}@cs.bilkent.edu.tr
Ozetce
metiniceren
habervideolarlzengin
icerikleri
vesagladiklarl
Gerek kamusal gerekse ozel video arsivlerinin genislemesi ve sosyal etki
dolayislyla
cogul
ortamkaynaklarl
arasinda
onemli
yayginlabmasiylabirlikte, ozelliklehaber videolarinda icerik ta- bir yere sahiptir [1]. Bu
kaynaklarin
iceriktabanli
indekslen-.. indekslen-.. indekslen-... ., , . ..~~~~~mesi,
qcozimlenmesi
vesorgulanmasi
ibcin
gereken
sistemlerin banlierisimonemkazanmistir.Ilgililikgeribeslemesi, icerikta- mbanlierisim sistemlerinde kullanilan bir tekniktir. Bumakalede, tasarimi gungectikce daha daonemlibir
arastirma
konusu ha-farkli6zniteliklerin, videolardan alinangorulntuflerinfarkliyer- linialmaktadir.
lerindeki onemini baz alarak kullandigimiz ilgililik geribesle-
Iberik
tabanligorulntui
vevideo sorgulama tekniklerinde ilk mesi teknigini aclkladik. Bunu da lzgara kullanarakboldulguimulz
yapilan,gorulntulerdeki
altduizey
oznitelikleri clkarmak
veolus-resimlerdekiher bir parcaya her bir oznitelik icin farkli bir agirlik turulan
oznitelik
vektorlerini
kullanarakgoiriuntuler
arasiuzaklik-degeri vererek
gerqeklestirdik.
Bu agirlik degerleri kullanicin larlhesaplamaktir[2, 3]. Bu konuyla ilgiliqalismalarda,
gorun-verdigi her geribeslemenin ardindan giincellenmektedir. Bu ge-
tuinuin
butitinui
baz alinarakclkarilan
oznitelikler
kullanilmistir.
ribeslemeler, kullanicinin donen sonuclarl pozitif ya da negatif Yakinzamandagerqeklestirilen qalismalarda
iseoznitelik clkarma
olarak etiketlemesinden ibarettir. Her biragirligin yeni degeri, daha cok
bolgesel
tabanliq6ztimlemelere
dayanmaktadir [4]. pozitif ve negatif goruntuilerin birbirlerine olan uzakliklarininGoruntuyu parcalara
aylrdlktan sonra buparcalardanclkarilan
standart sapmasinin,buitiun pozitifgoriintilerinbirbirlerine olan oznitelikvektorleriiki
goriintui
arasindaki uzakliginoMqtimtinde
uzakliklarinin standartsapmasina olanoranlylabulunur.Teknigin kullanilmaktadir.
etkinligi, farkli oznitelikleringodriuntunuinfarkliyerlerindeki one- Her ne kadar
goriintulnun biitiinuinden
clkarilan
6znitelik-minibelirten agirlik degerlerinin kullanimlyla, TRECVID vi- ler sonucundasinirliveriler
tizerinde
basarili sonujlar
alindlysadeokuimesindekisporhaber videolarluizerinde
g6sterilmi§tir.
da kapall veaclk
alandakaydedilmis
olan habervideolarinda aydinlatma,yer,durusvekapatilmayla ilgili pek coksorun yasan-Abstract maktadir.Bu nedenle,gorulntulnuin
butitinuinden
clkarilan
ve
go-Content-based retrieval in news video databaseshas become an ruintuiyuisinirli sekildeifade edebilenozniteliklerilegorufntuidekiimportant taskwith the availability of large quantities of data in nesne
qesitliligi
vearkaplan karmabikligi modellenememekte-both public andproprietary archives. We describe a relevance dir.Diger taraftan azsayidahomojenboltimlere ayrllmls gorun-feedbacktechniquethat captures the significance of different fe- tuiler (Corelveritabanindaki gibi)uizerindekullanilanpek ok atures atdifferentspatiallocations in animage. Spatialcontent taninmis otomatikparcalamateknikleride,diti§ik
qozuinuirltiklfu
ha-is modeled by partitioning images into non-overlapping grid ber videolarindadtitiuk
veri kalitesi veyuikseknesneqesitliligi
cells. Contributions of different features at different locations nedenleriyleiyisonuclarvermemektedir.aremodeledusingweightsdefined foreach feature in eachgrid Bu
qalismada,
ilk olarakgoruntuleribirbirinden ayrik parca-cell. Theseweights areiteratively updatedbased on user's fe- lara bolerek iceriklerini modelledik. Bireysel olarakgoruintudekiedback in terms ofpositive and negativelabeling ofretrieval her bir bolge icin renk, doku ve ayrit gibi oznitelikleri clkardlktan results. Giventhis labeling, the weightupdating scheme uses sonra, bu ozniteliklere vebelli agirlik degerlerine gore hesap-the ratios of standard deviations of hesap-the distances between re- ladigimiz
goiriuntuler
arasi uzakliklarl aralarindaki benzerlikleri levant and irrelevant images tothe standard deviations ofthe belirlemek icin kullandik. Her bir ozniteligin her bir bolge icin distances between relevantimages. Theproposedtechniqueis hesaplanmis olan agirlik degeri, bu ozniteligin o bolge icinone-quantitativelyandqualitativelyevaluatedusing shots related to minibelirtmektedir. Kullanicinin sorgulama sonucu donen sonuclar several sports fromthe news video collection of the TRECVID arasindanpozitif ve negatif olarak etiketledigi
gorulntuflerle
verdigi video retrieval evaluationwhere theweightscouldcapture rela- geribeslemesi, her sorgulama oncesinde bu agirlik degerlerinin tivecontributions of different features andspatiallocations. giincellestirilmesiicin kullanilir.Onceki
ilgililik geribeslemesi teknikleri,metinselbelgesor-1. GiriE gulama
literatuirunden
alinansorgunoktasihareketi [4] ileo5zni-teliklerinagirliklandirilmasini yeher sorgulamada buagirliklarin
Son yillarda teknolojideki hizli geli5smeyle beraber gerek ka-
guincellenmesini
[5, 6]i5cermektedir.Daha yeni5cali5smalarda
ise musal gerekseoizel
ar5sivlerde
c5ok buiyuk
miktarlarda5cogul
or- en uygunagirliklari
veyaoiznitelik dointi5tmlerini
hesaplamaya tamyeni kullanmil goizlenmektedir.
Ozelliklego5rsel o5ge,
sesye5cali5an
eniyilemetabanli
teknikler [7, 8]ye
degoiruntu yeni
Bugal1isma
TUBITAK 104E077ye
DPT 2004K120720numarali
tabanini
siniflandirmayi
oigrenmek
ic5in
pozitifye
negatif geri-projeler tarafindandestek1enmiostir.
beslemeoirneklerini
kullanan destekvektoir
makinesi (supportvectormachine) gibi teknikler [4] yayginlasmaktadir. Fakat ge- larl yapilarak, kelimeleri iceren goriuntuiler sorgulama sonucu ribesleme ormeklerinin yetersizligi nedeniyle eniyileme tabanli olarakdondriilur. Bu demec ozetleri, ham olan video metninin teknikler pek uygulanabilir degildir [7]. Ayni zamanda destek koklerine aylrma, etiketlendirme, frekans tabanli siizgecleme vektor makinesi teknikleri de az sayida ornek kullanilmasi ne- gibi islemlerden gecirildikten sonrakihalidir.
deniyle yakinsaklik ve kararlilik sorunu yasayabilirler [9]. Metin tabanli sorgulama sonrasinda kullanici kendisine donen Bizim bu makalede onerdigimiz teknik, agirlik guincelle- gorulntuilerarasindan bir ya da birdenfazlagoruntusecervebu meye dayanan ilgililik geribeslemesi kullanmaktadir[10].Agirlik gorsel sorgulama ormekleriyle beraber buitiin veri tabani
uize-degerleri, pozitif ve negatifgorulntfler arasindaki uzakliklarin rindeoznitelik vektorlerine dayandirilan gorulntuitabanli bir arama standart sapmasinin, pozitifgorulntullerinbirbirlerine olan uzak- gerceklestirilir.Bu ilkgorsel sorgulamada, gorulntuflerarasi ben-liklarin standart sapmasina orani seklinde bulunmaktadir. Bu
zerlikler, gorulntulnuln
her parcasina aitoznitelik
vektorlerininteknigin
ba§arimi
TRECVID videosorgulama yarismasina [1] arasindaki Euclidean uzakliklar bulunarakhesaplanir. Ilk gorselaitsporhaber videolarl kullanilarak degerlendirilmistir. sorgulama dongulsulndeher birgoruntu parcasina ait her
ozni-Makalenin geri kalani su
§ekilde
organize edilmistir: 2. bo- teligin bu sorgulamaya ayni oranda katkisi olduguvarsayllir.
limdeuzamsal lzgara plani uizerinden elde edilen alt duizey ozni- Son olarak bundan sonraki
sorgulamalarda
kullanici kendisine teliklerlegorulntuigosterimi anlatilmaktadir. Metinsel vegorsel donengoruintui
sonuclarini pozitifya danegatifolarak etiketler. sorgular kullanilan erisim senaryosu 3.bolfumdeyer almaktadir.4.
bolulmde doinguflu erisim icin
ilgililik geribeslemesine, son4.
Ilgililik
Geribeslemesi
olarak 5.b6ftilmde ise
deneysel
sonuqlara
yerverilmi~tir. Veritabani aramasinda,
geribeslemebilgileri,
go5riuntuler
arasi
2.
Gojruintiu
Modellemesi
benzerlik hesaplamaasamasinda
her bir oznitelikvektorunuin
her bir
goruntu
parcasina
olankatkisinidegistirmek icin
kul-Buqallsmada,
gorulntuflerin
uzamsal iceriklerinigo5riuntuleri
par- lanilir. Bu katkidegisimi,
her birparca icin
her biroznitelik
calara aylrarak modelledik. 5 sira ve 7 suitun olmak uizere 35
vektoriine
bir agirlik degeri atanarakvebu agirlikdegerleriniayrnkparcalara bolduiguimuiz 352 x 240 6ziintirliklhivideo
go-
herdongui
sonucundaalinangeribesleme bilgilerinegoreguincel-ruintiilerinin her bir parcasi icin renk, doku ve ayrit ozelliklerine leyerek
gerqeklestirilir.
Sekil
1'degorulduigui uizere
i numarali dayanan alt duizey oznitelikler clkardik. Bu parcalardaki pik- siradave j numarallsuitunda
yer alanparcaya
ait k numarali sellerin RGB, HSV ve LUV degerlerinin ortalamasi ve stan-oznitelige
atanan agirlikdegeriWijk ilegosterilmektedir
(i =dartsapmasi o parcanin renkozniteligini,bupiksellerin3farkli I .... 5, j = 1, .... 7 ve k = 1,...
.5).
Elimizde iki ayrioMqekte
ve 4 farkliyonelimde Gabor dalgaclk tepkilerinin is-grintui
oldugunuvarsayalim.Ilkolarak i numarallsiraj numa-tatistikleri ise parcanin dokusalozniteligini temsil eder. Canny rallstitunda
bulunanparcalarin
knumarall oznitelik vektorleri ayrntdetektor clktilarnningradyan yonelim degerlerininhistog- arasindaki uzakligihesaplayalim vedegerine dijk diyelim. Bu ramlarl iseayrntoznitelikleri olarak kullanilir. Ayrit oznitelikleri durumda, ikigorunti
arasindaki geneluzaklikya da benzerlik 45 derecelik araliklarlapiksel yonelim degerlerinisayan 8 kutu hesapladigimizher birparca
arasindaki uzakliklar kullanilarakveayrnt olmayan piksellerinsayisini tutan bir kutudanolusan9 d Wjkdj
elemanli birhistogramkullanilarak 6zetlenmektedir. E E E Wiikdiik (1)
Buislem sonucundaher birgoiruntuiparcasi i in 5 ayri 6zni- i j k
telikvektoruelde edilir. Buvektorler,RGB, HSV ve LUV ista- olarakhesaplanir.Bu
qalismada
her biroznitelik bileseni icintistiklerininher biri icin6,Gaboricin 24,ayrnt yonelim histog- ayrnbiragirlik kullanilmamistir.Bununnedeni, boylebir
i§lemin
ramlarlicin 9deger icerir. Her bir oznitelikvektorunuinbireysel her bir iterasyonda cok sayida parametrenin kestirimine gerekbilesenleri,
btitiun
oznitelikerimleriniyaklabikolarakeqitlemek
duymasivedolayislyla geribeslemedekullanilanorneksayisinin veher biri icin benzerlik hesaplamalarindahemen hemen ayni azolacagig'oz o'nuinealindigindakitiqik
orneklem problemi (smalletkiaraligini yakalamakicin birimdegisintisinenormalize edi- sample problem)ilekarbilabilmasini onlemektir.
lir. Burada farklioznitelik vektorleri vegoruntiparcalarl
arasin-dakiuzakliklarlhesaplarken su varsaylmlkullanmaktaylz.
Be-3. Goruntu
Eri§imi
lirli birparcanin
belirli biroznitelik
vektorunuin
o anki sorgugorunturnisinde
onemlibiroznitelikolmasiicin,geribesleme ola-Neyazlkkigorunti parcalamasikullanilsa bile kullanilanhicbir rak verilen pozitifgoruintui
ornekleri belirtilen parcanin buozni-oznitelik
ylkarma
algoritmasitamamenba§arill
sonuclarverme- telik vektoru bakimindan birbirlerine benzerolmall,yani buozni-yebilir,birbirinegorselolarak benzerolmayan parcalarin6zni- telik vektorlerinin bu ornekler arasinda degisintisi dar olmalidir. telikleri birbirineyakin clkabilirvebu durumdasorgulamago- Diger taraftan da, pozitifvenegatif goruintui omekleri bu
6zni-ruintuisuindenilgisiz olangoruintfulersorgulama sonucunda gorule- telik bakimindan birbirlerinden farkli olmall, yani bu
6znite-bilirler. Anlambilimsel ucurum(semantic gap) denilen buprob- lik vektorlerinin pozitifvenegatif ornekler arasinda degisintisi lem, etkilebsimli eribsimi, benzerligin
ye
insanalgilamasindaki
genibsolmalidir.
Bu nedenle agirlikdegerleri pozitifyenegatifoiznelligin uist duizey
ibcerigini
korumayayoinelik
bcok
oinemli
birgoiruntuiler
arasindaki uzakliklarin
standartsapmasinin
pozitifarabtirma
problemi haline getirir.goiruintuilerin
birbirlerine olanuzakliklarinin
standartsapmasina
Eribsim
senaryomuzda,kullanici
ilk olaraksorgulamasina,
orani bseklinde
bulunur. Ilk sorgulamada iseagirlik
degerlerinin metin sorgusu olarak bir ya da birden fazla anahtar kelime gire- herbini 1l'e
ebsitlenir.
rek
babslar.
Babslangibc
olarak bu kelimelerin, otomatikkonubsma
Sonubc
olarak,agirlik
degerleri belirli bir sorgugoiruintuisu
ibcin
gerleri bir goriintui icin farkli bolgelerde farkli oznitelikleri
mo-delleyerek
goruintiuler
arasibenzerliklerinhesaplanmasinda
onemli birbalarieldeetmi~,
btitin znitelikkombinasyonlarl
i ingeri-bildirimle alinansonualar
geribildirimsiz
sonuslaragy( redaima|
RGBistatistikleri ||Gaboristatistikleri|
Edgehistogramni
(a) Futbol (b) BasketbolbSekil 1: 3 x5'likbirizgara planiornegiyeher birparbcaya denk Tei Butnkteorle gelenagirlikdegerleri. Deneylerde 5 x 7'likbir planye 5ayri 61 =11lkdSongguu 051 -liksIsgl-.
1.d-g. ~
konumlaritemsil eder.Ornegin bSekil1 deki resimde seyirci ka- 2 5\;
labaligininbulunduguuist kisimdadokusaloiznitelikler oinemliy- 0 2 ~ = =
kenyebsil sahanin genibsyerkapladigi altkisimlardarenk ozni- 0
telikleri daha agIr b a s m
aktadir.si
isi(Nurrlb., -ges rtrieved) Erisil- gorutusyisi(Nurrlb., -ges rtrieved) (c)Tenis (d) Btunkategoriler5. Deneysel Sonuivar
ekil
3:pllk
sorgu ye daha sonraki 3 geribesleme
dotngusl
iin
TRECVID 2005yaribsmasina
[1]ait 137 adet haber videosuuize-
RGB,HSV, LUV renko5znitelikleri
yeGabor dokuo5znitelikleri
rinde makalede bahsettigimizteknikleri uyguladik. TRECVID kullanilarak elde edilen sorgulama
sonubclari.
x-ekseni eribsilen katilimcilari tarafindan elle etiketlenen futbol, basketbol, golf,goiruntul
sayisini, y-ekseni iseduyarlilik(precision) degerlerini tenis ye Amerikan futbolu olarak 5 ayrituirde
spor konulari goIstermektedir.igeren
video goruntulerini, TRECVID yen tabanindaki 43907 anaiterlevegoriuntusul
iin ground truth olarakkullandik. Sekil2'de herkategoriiedinornekvideogoIrntuleriyeralmaktadir. 6. Kaynakca
Elde ettigimiz bu ground truth'u otomatik sorgularn ret- [1] U.S. National Institute of Standards and
Tech-mek, 43907gsa
ruintugyi
hersorgu
sonucunagkireslralamak, e nology, "TREC video retrieval evaluation (TREC-herdoingul
sonunda, elde edilen ilk 30goiruntul
ibindeki her bir VID)," 2005. [Online]. Available:http:llwww-goirulntulyu
otomatik olarak eger sorgugoiriinttustyle
ayni gro- nlpir.nist.gov/projects/trecvid/ und truth grubuna ait ise pozitif, geri kalanlariise negatifola-r eB[2] Y. Rui, T. S. Huang, and S -F. Chang, "Image retrieval:
ground truth'da bulunanherbirgoirulntugitin 3 defa geribesleme -g- teh iques, E,isil-giretis, -g-
is-sues" Journal of Visual
Communication
and ImageRep-ekil 3'te ground truth'daki farkli kategoriler
ieiin
degiikresentation, vo
10,sno1,p
39
Marh 1oznitelik kombinasyonlari
kullanildgindaki duyarlilik
grafik- [3] A. W. M. Smeulders, M.Worring,
S.Santini,
A. Gupta,.en
makale
(e.senirlami nedniyuesadec.bugraIklerand
RJam, "Content-basedimage
retrieval
at the end ofktlimcilastrlmbtarafna
(erllle
etietlnenubl,l
sbsaueebolu
golf,le
g6iniaiii-kseiiedyrii
peiin
eelrngoisterilmibstir).
Sbekil4yes5
ise renko5zniteliklerini
kullandigimiz the early years," IEEE Transactions on Pattern Analysis futbolvebasketbolkategori sorgulamask5rneklerinigrstermek-
and Machine
Intelligence, vol. 22, no. 12, pp. 1349-1380, tedir.Bvtin oznitelik kombinasyonlarI arasinda, Gaboryerenk December 2000.(RGB, HSV, LUV)
o5znitelikleri
enytuksekortalama duyarlndigi
[4] F. Jing, M. Li, H.-J. Zhang, and B. Zhang, "An efficientvermilhle kategorierineayrit
yapslmnipek and effective region-based image retrieval framework,"nemi
olmamasi
nedeniyle,ayrit
yonelimotzniteliklerinin
kom- IEEE Transactionson Image Processing, vol. 13, no. 5,binasyonlara
katilmasl durumunda
performans areki
gobzlenme-
h pp.699-709, May2004.midtir.
Binalar, evler,ofislerin yer
aldigl
aehir
girsentleri
iaeren
[5] Y. Rui, T. S. Huang, M.Ortega, and S. Mehrotra,"Re-kategorilerde
buoznitelikler bok
daha fazlaoinem
arz edebilir- levance feedback: A power tool for interactivecontent-ler. based imageretrieval,"IEEETransactionson Circuitsand
Duyarlmlikta
enbuyuikyuikselme
ilkdoingul
sonucunda
elde Systems for VideoTechnology, Special
Issue onSegmenta-edilmiitir.
Bunu takip edendoingurlerde
bu deger etrafinda bir tion, Description, and Retrieval of Video Content, vol. 8,Sekil 2: Buitiun ground truth gruplarlicinornekgorulntuiler.Yukaridanasaghya:futbol, basketbol, tenis, golf ve Amerikanfutbolu.
(a)Ilk sorgu sonuclari (19dogru) (a)Ilk sorgusonuclari(14dogru)
(b) Birincidongusonuclari (30dogru) (b)Birincidongiisonuclari(20dogru)
Sekil 4:Ornekbir futbol sorgususonujlarl(ilk 30gorufntui). 5ekil5: Ornek birbasketbol sorgusu sonuclarl(ilk30
goruntul).
[6] S.Aksoy, R. M. Haralick, F A. Cheikh, and M. Gabbouj, timallearningmethods,"inProceedingsofIEEE
Interna-"Aweighted distance approach to relevance feedback," in tionalConferenceonImageProcessing,vol. 3, Thessalo-Proceedings of15thIAPR International Conference on niki, Greece, October 2001, pp. 2-5.
PatternRecognition, vol. IV, Barcelona, Spain, September [9] X. S. Zhou and T. S. Huang, "Relevance feedback in
2000,pp.812-815. image retrieval: A comprehensive review," Multimedia
[7] Y. Rui and T. Huang,"Optimizing learning in image ret- Systems, vol. 8, pp. 536-544, 2003.
rieval," inProceedings of IEEE Conference on Computer [10] 5. Aksoy and 0. Cavus, "A relevance feedback technique Vision and Pattern Recognition, vol. 1, Hilton Head Is- formultimodal retrieval of news videos," in Proceedings land, South Carolina, June 2000, pp.236-243. ofEUROCON, Belgrade, Serbia & Montenegro, Novem-[8] T. S. Huang and Z. S. Zhou, "Image retrieval withrele- ber 2005.