. .,rX7.00n
Yiuz
BulmaYontemlerilnln
HaberV'ideolari ICln SIstemat'ik KarE1a tird1masi
Systematic
Evaluation of Face Detection
Algorithms
onNews Videos
Can
Acar,
Arda
Atlas,
Koray
Cevik,
IsaOlmez,Mustafa
Unliu,
Derya
Ozkan,Pinar
Duygulu
Bilgisayar
Miihendisligi
Boliimii Bilkent Universitesi, Bilkent, Ankara
Ozet,e
Haber videolarinin etkin eri,imi icin, haberlerdeki en 6nemli
oge
olanki,ilerinbulunmasiolduk,a 6nemlidir. Literatiurde ,ok ,esitliyiizbulmayontemi yeralmasinaragmen,
kontrolliu or-tamlarda,ok iyi sonu,larverenbuyontemler,haber videolarinda verilerin ,esitliligi vegoriintiulerin giiriultiilii olmasinedeniyle,ok iyi
qali*mamakta
ve olduk,ahatali sonuclarvermektedir. Ayricaher bir yontem farkli ozellikte ve sayidakiyiizleri bula-bilmektedir. Buqali*mada
varolanyontemlerdeneniyiverimin alinabilmesi amaciyla, yiizbulmayontemlerininsistematik birdegerlendirmesi
yapilmi*tir.
Deneylerde, haber videolarindanolusan TRECVID 2006verikiumesi
kullanilmi*
vedortfarkliyiizbulmay6ntemi
degerlendirilmi,tir.
Abstract
Peoplearethe mostimportant subjectsin newsvideos and for properretrieval of people images; face detection is a very cru-cial step. However, face detection andrecognitionin news vi-deos is a verychallengingtask due to thehuge irregularitiesand
highnoise level in the data. In addition tothat, with different face detectionalgorithms,the number and the type of the faces maydiffer. In this study, inorder to get the bestperformance
fromexisting methods, systematicevaluation of these methods isperformed.Intheexperiments,newsvideosfrom TRECVID 2006data set are used and for evaluation four different face de-tection methods are chosen.
1.
Giri,
Geli,en teknolojiile birlikte ,okbiiyiikresim ve videoar,ivleri
ortaya
qikmi*,
bu ar,ivlere etkin ve hizli bir ,ekilde eri,mek biiyiikonemkazanmi*tir
[1].Haber videolarindanolu,an ar,ivler, sosyal ve kiultiirel etkisininyaninda, resim, video, ses ve me-tingibifarklibir,ok veriyibir arada bulundurmalarindandolayi olduk,a onemli bir verikaynagidir.
Bu onemidolayisiyla
ha-bervideolari,NIST(AmerikanStandartlarEnstitilsil)tarafindandiizenlenenTRECVIDvideoeri,imi
degerlendirme
yari*masinin
da konusunuolu*turmaktadir
[2]. Buyari*mada
amac verilen bazi sorguciumlelerinedenkgelenvideoboliumlerini kullaniciyasunmaktir.
Haber videolarinda en ,okrastlanansorgular ki,ilerile
il-giliolanlaridir.Yapilan
qali*malar
gostermi,tir ki,sorgusadece metiniizerinde yapilipg6rsel
bilgikullanilmadigi
zamanyanli*
sonu,larla
kar*ila*ilabilmektedir.
Ornegin,
birki,iileilgilibir haberspikertarafindan sunulurkenki,ininismige,mekte,oysaki,inin
goriuntiusiu
ilerleyen dakikalarda,belki oki,i konu,urkenverildiginden,
kisive isim arasindaki ili,ki kaybedilmektedir.Bunedenle ,ogu zaman ses tanima yontemlerinin
iirettigi
me-tinler iizerindeyapilan sorgularhatali sonuc iiretmekte,istenilen kisining6riintiusiiyerine spikering6riintiusiukullaniciya sunul-maktadir.Sorgulanan kisiile ilgili
dogru
habergoriintiulerinin bulu-nabilmesi i,in gorsel verilerin kullanilmasi ve otomatik olarakyiizlerin taninmasi gerekmektedir. Ancak, yiizii tanima prob-lemi,yapayzeka vebilgisayarlagoriintiualanlarinda ,ok
qali*ilmi*
bir konu olmasinaragmen,
heniuz ,cziulmiusdegildir.
Elde edi-lenba*arili
tanima oranlari kontrollii ortamlarda ,ekilmi, re-simleri,erenveri tabanlarinda sinirli kalmaktadir [3].Ozelliklevideogibi poz ve aydinlatmanin ,esitlilik
gosterdigi
veresimc6ziuniuruliguiniin dicuisk oldugu
vern
ar*ix
lerindeyiiztanimak,okdaha zor birproblemhalinegelmektedir. Gercekzamanli ortam-lari dahaiyiyansitanbugibiveritabanlariuizerinde yiiztanima
problemini incelemek,kontrolliuortamlarda elde edilmi, resim-leri incelemekten ,okdaha farkli vegeni, kullanim alanlarina
sahiptir.
Yiiz tanimayontemlerininenonemli
a*amasi
goriintiudeyer alanyazlerin bulunmasidir. Bulunanyiizlerin sayi ve kalitesiyiiztanimayonteminin
ba*arisini
dogrudan
etkilemektedir.Li-teratiurde yiizbulmaama,li bir,oky6ntemyeralmakta[4],
an-cak ,ogu sistem videoar,iviningiiriultiiluyapisi vediusi,k c6zioniurliuigu
ne-deniyle yetersizkalmaktadir.Ayrica,farkliy6ntemlerfarkli sayi ve6zelliktekiyiizleri bulmakta, hi,bir y6ntemtek
ba*ina
iyibir sonuc iuretememektedir.Sonrakia,amalardayiizbulmay6ntem-lerinden eniyiverimin alinabilmesii,in,kullanilacaky6ntemin cok iyi
degerlendirilmesi,
eksikyanlarininanla*ilabilmesi
ge-rekmektedir.Bu
qali*mada,
yiizbulmayontemlerinin ozelliklerininanla*ilabilmesi
veilerikia,amalarda birlestirilebilmesi amaciylafarkli yontem-lerindetaylibir
degerlendirmesi
yapilmi*tir.
Literatiurdevarolancok sayidayontemarasindanse,im yapilirken probleme uygun-luk ve daha sik kullanimg6z 6niindebulundurularakdortfarkli
y6ntem
se,ilmi,tir.Bunlarensik kullanilany6ntemlerden
biriolantenbulma
y6ntemi
[5],literatiurde
varolanoldukcaba*arili
yontemlerden biri olan Rowley, Baluja veKanade tarafindangelistirilmi, olan yontem [6], haber video ve
fotograflari
uize-rinde daha onceba,ka
qali*malarda
dakullanilmi*
olan biryontem
[7]veeri,iminin
kolayliki
nedeniyle olduk,asik kullanilanOpenCVtarafindan
saglanan
yontemdir [8].Deneyler,TRECVID 2006haber videolariiizerinde
yapilmi*
ve sonu,lar oldukca geni, bir ,erceveden se,ilen 1000 resim
Sekil 2:Elle
etiketlenmi*
dogruyuiz bolgeleri.
$ekil1
I Videodanyiiz
6rnekleri2.
Yuz Bulma Problemi
Yakin tarihli bir
qali*mada,
ger,ek hayattakifotograflari
daha iyi yansitmasi amaciyla Yahoo haber kanali uizerindentopla-nan
fotograflarda
var olanyiiz tanima algoritmalarininba*arisiz
oldugu gozlenmi,tir[9]. Bu
qali*mada
verilenyiiztanima oran-lar %10-17araligindadir. Bu sonu,lardan daanla*ilacaki
uizere,gercekveriar,ivlerindeyiiztanima,okdaha zor birproblemdir.
Bunaneden olarak, resimlerdeki poz degi,iklikleri, aydinlatma
farkliliklari, ifadedegisiklikleri, resimdeki diuzeltmelerve
re-simlerin ozuiniuruligi g6sterilebilir. Ayni etmenleryiiz bulma yontemlerinin
ba*arisini
dabenzer,ekilde etkilemektedir.Videodakiyiiz orneklerinin ,esitliligi
$ekil
1'degosterilmi,tir. Orneklerdendegoriildiuigu uizere, videodaki resimlercokfarkli ortamlarda ,ekilmi,,farkliboyutlarda yiizleri icermektedir.Poz ve ifadeler ,okca degi,iklik gostermektedir. Yiizler ,okkiiuiik olabilmekte; ondenyadayandan degi,ik acilarda ,ekilebilmekte; sakal, biyik,gozliuk, ,apkayadae,arplabir kismikapatilabilmekte;irksal ten rengi farkliliklari gosterebilmekte; ya da
i*ikin
farklia,ilardanvurmasinedeniyleg6lgelenebilmektedir. Biitiunbu et-menler,g6riintiulerdeyeralanyiizlerinbulunmasini
zorla*tirmaktadir.
Bu nedenle video ar,ivleri,yiizbulma ve tanima algoritmalarii,in ,okzorbiruygulamaortami
olu*turmaktadir.
3.2. Yontem 2
Yontem 2 olarak
tanimlayacagimiz
Mikolajczyk [7] tarafindangelistirilmi, yiiz bulmayontemi, yiizlerin pozisyonuhakkinda bir kisitlamasi olmayan,
kar*idan
veyayandanbakan yiizleriiki adet detekt6rle bulabilen bir y6ntemdir. Daha 6nce haber video ve
fotograflari
uizerindekibenzerbaskaqali*malarda
dakullanildigi
ic,in tercih edilmi,stir.3.3. Yontem3
Yontem 3 olarak
tanimlayacagimiz
yontembir,ok onemli re-simi,lemevebilgisayarli gorme algoritmalarini gercekle,tirenC++ siniflarinin birkoleksiyonu olanOpenCV'den se,ilmi,tir
[8].Yontemdenesneleri,inistatistiksel birmodel(tanimlayici)
egitilir
venesneleri bulmaki,inkullanilir. Oncelikliolarakyiiztanimlamak i,in
kullanilmi*
olan bu yontem, istatistiksel mo-del i,in basit Haar tipi 6zellikler ve kademelihizlandirilmi*
siniflandiricilar kullanmaktadir.3.4. Yontem4
Yontem 4olarak
tanimlayacagimiz
Rowleyveekibi tarafindangelistirilmi, olan yontem [6] iki
a*amali
birnoralag
kullanmak-tadir.Literatiirdekiba*arili
yotemlerden biri oldugu i,in se,ilmi,tir.4. Degerlendirme
Buyontemlerinsistematik bir,ekilde
degerlendirilebilmesi
amaciyla,3. Degerlendirilen Yontemler
TRECVID 2006veri
kiumesi i,erisinden
farkliboyut, poz
ve ozellikteyiizler
i,eren1000video karesise,ilmi, veyiiz
bolge-Bu
qali*mada
probleme uygunluk,ba*ari
vesik kullanim kriter- lerielle i,aretlenmistir.$ekil
2'de bukiume i,erisinden 10 re-leri gozoniindebulundurularakdegerlendirilmek
iizerea*akidaki
simuizerinde elle etiketlenen bolgeler gosterilmektedir. Bu1000 dortyotemse,ilmi,tir. resim uizerinde d6rt y6ntem ayri ayriqali*tirilmi*
ve
her biry6ntem
i,inba*ari
orani, bulunanyuiz b6lgeleri
iledogru
yuz3.1. Yontem 1
b6lgeleri
kar*ila*tirilarakyapilmi*tir. Ancak, bulunan vei,aretlenen
yuiz b6lgeleriher zaman tam olarak
fist
iistegelmedigi
vefarkli Tenbulma tabanliyontemleryiizbulmadaolduk,asik kullanilmaktadir.buiyuikluikte
olabildigi
i,in
degerlendirme yapilirken
kui,ick
deBa*ari
oranlaridiger yontemleregoredahadiu,isk
olmasinaragmen,
olsa birqaki*ma
varsadogru
sayilmi*,
degilse
sonu,yanli*
ola-kar*ila*tirmada
bir taban ,izgisi olusturabilmekveilerikiqali*malarda
rakyorumlanmi*tir.
Buvarsayimile alinansonuclar
Tablo1'de
diger yontemlerle birle,tirebilmesi icin iyivekotii yanlarinigore-
ozetlenmi,tir. Sonu,lar yiiz
olan birbolgenin
dogru
olaraki,aretlenmesi
bilmek amaciyla se,ilmi,tir. Bu calismada [10]'datanimlanan
(Dogru/Dogru),
yiiz
oldugu
halde yontem tarafindan buluna-tenrengitabanliyuizbulmayontemikullanilmi*tir.
Bucali*mada
mamasi(Dogru/Yanli,)
veyiiz
olmayan
birbolgede
yontemta-RGB renk uzayinin
i*ik
parlaklikina
olanhassasliki
nedeniyle rafindanyiiz
bulunmasi(Yanli*/Dogru)
,eklinde verilmi,tir.
RGBrenk
degerleri
YCbCr uzayinaqevrilmi*tir.
Yapilanara*tirmalarda
Gruildiugii
uzere bu yontemler sirasi ile ,u geri cagirmaveveriarsivinde yapilan incelemeyletenrengininYbilesenine vekesinlik
degerlerini
vermektedir:(0.539, 0.672), (0.264, 1),
bagli olmadigi,
CbveCrdegerlerinin
ise tenrengi i,inkiiuiik
bir(0.551, 0.876), (0.454, 0.954).
Busayilar,
budegerlendirme
ilearalikta
kuimelendigi
g6ruilmui,tfir.
Kullanilany6ntem
bu veri- Y6ntem3'uin
dahaiyi
oldugunu
g6stermektedir.
Tablo 1: Yuz olan bir b6lgenin
dogru
olaraki*aretlenmesi
(Dogru/Dogru),
yiiz oldugu halde y6ntem tarafindanbuluna-mamasi(Dogru/Yanli*)
veyuzolmayanbir bolgedeyontemta-rafitnan 1Zbulunmasi
(Yanhli/Dogirui
DogruJDogru
Dogru
Yanli YanliDogru
Yontem 1 663 567 324
Yontem 2 325 905 0
Yontem 3 678 552 96
Y6ntem 4 558 672 27
$ekil
3: Her bir yontem tarafindanqikarilan
dogru yuz bolgeleri.arasindakikiiuiik bir caki,ma dahi
dogru
olarakdegerlendirilmektedir.
Oysa
qaki*ma
yiizdesi de yonteminba*arisi
hakkindaolduk,aonemli bir etkendir. Bu
degerlendirmenin
yapilabilmesi amaciyla$ekil
4'tegosterildigi
iizereqaki*an
bolge B,dogru
yiizbolge-sindegeride kalan kisim A, bulunanyiizbolgesinde geride
ka-lankisim ise C olarak
adlandirilmi*
veB/(A+B) ve B/(B+C) oranlarihesaplanmi*tir.
B/(A+B) varolan biryuzunne kadardogrulukla bulunabildigini,
B/(B+C)oraniiseyonteminneka-dar
dogrulukla
biryiiziubulabildigini
gostermektedir.$ekil
5'dey6ntemlerin bu oranlarag6re
ba*ari
yulzdelerinin dagiiminig6ster-mektedir. Biry6ntemin
ba*arisi
grafiklerinnekadarsaga (bulyulkyiizdelere) yakinolduguna
baglidir.
1000'likveri tabani iistiinde yapilan testlerde, kesi,meorani
sadece 0.01 verilsebile, bulunan yuiz oranlarinin 0.55iniistiune
,ikmadigi
gorilmiu,tuir. B/[A+B] olarakbakildiginda
Yontem3'finiyi bir performans
gosterdigini
gormekteyiz. Fakat Yontem 3 ile bulunan alan,dogru
yuiz alaninindi*ina
fazla,iktigi
i,in, geri kalan alanorani(B/[B+C])olarakbakildiginda
Yontem4daha
dogru
sonu,laraula*maktadir.
Bunun nedeniYontem 4'tebulunanyuiz alanining6zulstiinden hemen kesilip, dudak
son-rasindasonbulmasidir. Y6ntem 2'de ise bunlardan daha farkli amaaynizamanda daha kesinsonu, verenbiralgoritma
bulun-maktadir, amabu durumbir,cok yuizuin atlanmasina neden
ol-$ekil
4:Kesi*im
alanlarig6sterimi.maktadir. Yontem 1 iseyiiziunduru, a,isina
bagli olmadigi
i,inyandan ,ekilmi, olanyiizresimlerinde dahaiyisonu, vermi,tir.
Fakat tenrengib6luimlemesindeiyi bir algoritma
kullanilmadiki
i,in ,ikansonu,lar
dogrultusunda
bu algoritmanin sadece yardimciama,likullanilmasi
gerektigi
sonucunaula*ilmi*tir.
Bubulgu-lar sonucunda vegrafikler
dogrultusunda,
Tablo-1'de
de alinan sonuc ile uyumlu olarak, bu verikiimesi i,in Y6ntem3'uinenba*arili
algoritmaoldugunu
gormekteyiz.$ekil
3'deyontemlerin yukarida gosterilen10resimuizerin-dekisonu,larigosterilmektedir. Gruildiuigu iuzereYontem1,ten
rengininyiiz
di*inda
ba,kabolgelerdegecmedigi
ve ten rengi-nin netg6riuldiugiiresimlerdeba*arili
olurken,Y6ntem2yiiziun a,ikbir,ekilde g6riuldiiuig veaynizamanda 6ncepheden yiiziu g6renresimlerde
ba*arili
olmaktadir. Y6ntem 3 ise yine 6ncephe-den ,ekilmi, yiizlerde ve digerlerine oranla daha kiiuiik
pik-selleresahipyiizlerde
ba*arili
olmaktadir,bunaragmen
,ekilde goriuldiuigu iuzerebazi resimlerdefazladanyiizbulabilmektedir. Yontem 4 onden cekilmi, yiiz resimlerinde ve yiizlerin fazla yan yanagelmedigi
resimlerdeba*arili
olmaktadir.5.
SonuV
ve
Degerlendirme
Bu
qali*mada
yiizbulmay6ntemleri olduk,azorbir verikiumesiolan TRECVID 2006 haber videolariuizerinde
kar*ila*tirilmi*tir.
En cokkullanilan yontemlerdenbiri olan ten bulmayontemi,
farkli verikiimelerinde
ba*arisini ispatlami*
olanRowley-Baluja-Kanade yontemi, benzer
qali*malarda kullanilmi*
olanMiko-lajczyk yontemive
ula*ilabilirlikinin
vekullanimininkolayliki
nedeniyle
se,tigimiz
OpenCV'den secilen dortyontemkar*ila*tirilmi*
vesonu,larelleetiketlenmi, 1000resimuizerindedegerlendirilmi,tir.
Bu
qali*manin
amaci,yiiz taniyabilmek amaciylaendogru
yiiz bolgelerinin bulunmasidir. Elde edilen sonu,lar Yontem3'fin
bu verikiimesindeen
dogru
sonuclariverdigini
g6stermektedir.Ancak
y6ntemlerin
artive eksiy6nleri g6z
6niineal1indiginda
y6ntemlerin
birle,tirilmesinin de daha iyi sonu,lar verebilme ihtimaligorullmu,stuir.
6.
Te~ekkur
Yardimlarindan dolayi Muhammet Ba,tan'a te,ekkiurederiz. Bu
qali*ma
TUBITAK Kariyer 104E065 ve TUBITAK 104E077no'lu projelertarafindandesteklenmistir.
7.
KaynakVa
[1 C.G.M. Snoek and M. Worring, "Multimodal video
inde-xing: Areview of thestate-of-the-art," Multimedia Tools andApplications, 2005, Acceptedforpublication.
[2] "Trec video retrieval evaluation,
http:Hwww-nlpir.nist.gov/projects/tv2005,".
[3] W. Zhao, R. Chellappa, A. Rosenfeld, and P. Phillips, "Face recognition:Aliteraturesurvey,"2000.
[41 Kriegman
D.Yang
M-H. andAhuja
N., "Detecting
fa-cesinimages:Asurvey," IEEETransactionsonPattern
Analysis and MachineIntelligence,vol.24,no. 1,pp.
34-58,2002.
[51
"Skin segmentation using color pixel classification: Analysis and comparison," IEEE Trans. Pattern Anal.Mach.Intell.,vol.27,no. 1,pp.148-154,2005, Member-Son Lam Phung and Sr. Member-Abdesselam
Bouzer-doum and Sr.Member-DouglasChai.
[6] Henry A. Rowley, Shumeet Baluja, and Takeo Kanade,
"Neural network-based face detection," IEEE
Transac-tions onPatternAnalysis and Machine Intelligence, vol.
20,no.1,pp.23-38,1998.
[7] KrystianMikolajczyk, FaceDetector, Ph.D.thesis, IN-RIARhone-Alpes.
[8] "Opencv: Opensourcecomputer visionlibraryreference
manual,".
[9] T.Berg,A. C.Berg,J.Edwards,M. Maire,R.White, Y.-W.Teh, E.Learned-Miller,and D.A.Forsyth, "Faces and
names inthenews," inIEEEConf onComputer Vision
and PatternRecognition(CVPR),2004.
[10] Chang-TsunLiWen-Hsiang Lai, "Skin colour-based face detection in colourimages," 2006,pp.56-56.
$ekil5: Herbiryontemiyin
ba*ari
yuzdeleri Yontem IYontem2
qW0
2_
2m~~~~~~~~~~~~~aFkWimyrSE
Yontem3
B,rAtBheWsWyCtiEC
WD-Yoritem:4
..~~~~~~~~~~~~~~~~~~~~---4 t F G<JA; CP1 V '1 n- S i 4 4 @ n , X @ _ Q Z