• Sonuç bulunamadı

109

110

kullanılma sebepleri film çekim tekniğinde yer alan bazı kuralların içinde gizli olabilir.

Literatürde bu konu ile ilgili yayınlar (Adams et al. 2000, Vasconcelos and Lippman 2000, Sundaram and Chang 2002, Tavanapong and Zhou 2004) yer almaktadır. Bu kurallardan ilki 180o kuralıdır. Bu kural görsel benzerlik ile betimlenebilir. Film yapım iĢinde genellikle kamera daha önceden belirlenmiĢ bir doğrunun sadece bir tarafında yer alır. Böylece peĢ peĢe yer alan çekimler arasında bazı kesiĢen ortak alanlar yer alabilir ve bu neden ile görsel içerik ve aydınlatma koĢulları benzerlik gösterebilir. Bu durum genellikle durgun sahnelerde yer alır. Bir diğer özellik filmin temposudur. Bir filmin temposu hareket içeriği ve çekim uzunluğu ile betimlenebilir (Adams et al. 2000).

Önerilen yöntemlerde düĢük seviyeli öznitelikler kullanılmıĢtır fakat daha yüksek seviyeli çekimler arası benzerlik öznitelikleri de önerilen yöntemler içerisinde kullanılabilir. Yeni özniteliklerin belirlenmesi de ileride yapılabilecek çalıĢmalardan birisidir.

Video sahne sezmedeki son basamak benzerlik değerlerine göre karar vermedir. Bu tez çalıĢmasında getirilen katkılar temel olarak bu basamak içerisine dâhil edilebilir. Çekim sezme ve çekimler arası benzerlik betimlemesi basamaklarında temel olarak daha önce literatürde var olan yöntemler üzerinden gerçekleĢtirimler yapılmıĢtır. Karar verme basamağında çizge kuramsal üç video sahne sezme yaklaĢımı sunulmuĢtur.

GeliĢtirilen yöntemlerden ilki çizge temelli çok seviyeli zamansal video bölütleme yaklaĢımıdır. Önerilen yöntemin bir uygulaması olan video sahne sezme yaklaĢımı detaylı olarak açıklanmıĢtır. Bununla birlikte önerilen yöntem daha geneldir ve daha farklı uygulamaları olabilir: Bunlardan birisi televizyon yayınlarının bölütlenmesi olabilir. Ġki veya daha fazla seviyede çizgeler kurularak haberlerin, dizilerin, reklamların v.b. türlerin sezildiği bir yaklaĢım geliĢtirilebilir. Önerilen GBMVSD literatürde var olan yöntemler ile karĢılaĢtırılarak değerlendirilmiĢtir. Bu amaç ile DVD sahne bilgileri esas sahne bilgisi olarak kullanılmıĢtır.

GeliĢtirilen yöntemlerden bir diğeri çizge üleĢtirme temelli video sahne sezme yöntemidir. Bu yöntemde iki farklı çizge temelli betimleme bir tek çatı altında birleĢtirilmiĢtir. Ayrıca k-ortalama ile çalıĢan yaklaĢımda eğer belirli koĢullar sağlanır

111

ise yöntemin iĢlem karmaĢıklığı doğrusal olmaktadır. Bu hesaplama yükü açısından bir avantajdır.

GeliĢtirilen yöntemlerden üçüncüsü baskın kümeler ile video sahne sezme yöntemidir.

Problem Ģu Ģekilde ortaya konmuĢtur: Seçilen bir özniteliğe göre daha baskın karaktere sahip çekim grupları ilk önce sezilerek video sahneleri sezilmektedir. Ġki farklı bölütleme yaklaĢımı önerilmiĢtir. Bunlardan TBM verilen bir çizgeye göre otomatik olarak video sahne sayısına karar verebilir.

Doğru bir değerlendirme ölçerinin ve test veri kümesinin belirlenmesi önemlidir. Bu tez çalıĢmasında temel olarak F ölçeri değerlendirme ölçeri olarak kullanılmıĢtır. Hata analizleri çerçeve seviyesinde yapılmıĢtır. Video sahne sezme için test veri kümesi olarak filmler kullanılmıĢtır. Esas sahne sınırı bilgisi için ise iki tip veri kümesi oluĢturulmuĢtur. Bunlardan birincisi genellikle literatürde yer alan bir yaklaĢım olan esas sahne sınırlarının filmi seyreden bir kiĢi veya kiĢiler tarafından belirlenmesidir (Sundaram and Chang 2002, Tavanapong and Zhou 2004, Rasheed and Shah 2005, Zhao et al. 2007). Tez çalıĢmasında bu tip esas sahne bilgisi içeren yaklaĢık yedi saat kırksekiz dakikalık bir veri kümesi oluĢturulmuĢtur. Ġkinci yaklaĢım ise DVD sahne bilgilerinin esas sahne bilgisi olarak kullanılmasıdır (Rasheed and Shah 2005, Zhai and Shah 2006). Tez çalıĢmasında bu tip esas sahne bilgisi içeren yaklaĢık onbeĢ saat otuzaltı dakikalık bir veri kümesi oluĢturulmuĢtur. Özellikle DVD sahne sınırları ile oluĢturulan veri kümesi üzerindeki iki film kullanılarak, literatürde yer alan bir yöntemin gerçekleĢtirimi yapılmadan önerilen bir yöntem ile performans karĢılaĢtırılması yapılmıĢtır.

Çizelge 9.1 önerilen yöntemler için bir özet sonuç çizelgesidir. GBMVSD daha farklı bir veri kümesi üzerinde test edilip parametreleri belirlenmiĢtir. Bu test kümesinde anlamlı bir sonuç elde etmek için bazı parametre değiĢiklikleri yapılmıĢtır. Bu değiĢiklerden ilki kullanılan özniteliklerdir. Bu çizelgedeki tüm yöntemler iki özniteliği (görsel ve hareket) kullandığı için çekim uzunluğu benzerliği çıkarılmıĢtır (c1,1 =0.5, c1,2

=0.5, c1,3 =0.0, c2,1 =0.5, c2,2 =0.5, c2,3 =0.0). Ayrıca DVD sahne boyutları ile bu test kümesideki sahne boyutları farklılık içerdiğinden uyarlanır kesim eĢik değeri seçme

112

parametrelerinin bu yeni probleme uygun değerler alması gerekmektedir (Λ1 = 2.05 10-8, Ω1 = 0.93, Λ2 = 1.0 10-9, Ω2 = 1.11). Burada belirtilen parametreler dıĢındaki değerler değiĢtirilmemiĢtir.

Çizelge 9.1’de deney sonuçları sunulan yöntemlerin ortak özellikleri vardır. Çekim sezme ve çekimler arası benzerlik betimlemesi aĢamaları hemen hemen aynıdır. Tüm yöntemlerde aynı çekim sezme ve anahtar çerçeve sezme yöntemi kullanılmıĢtır. Ayrıca tüm yöntemler görsel ve hareket içeriği benzerliği olmak üzere iki özniteliği kullanmaktadır. Yöntemler arasındaki asıl fark karar verme aĢaması içerisinde yer almaktadır. Ayrıca çizelgede yer alan tüm yöntemler çizge temelli yaklaĢımlardır.

Çizelge 9.1’e göre baskın kümeler ile video sahne sezme yöntemine ait iki yaklaĢım ilk iki sıradadır. Bütün yöntemlerin bir önceki paragrafta açıklandığı gibi aynı altyapıyı kullandığı düĢünülür ise baskın kümeler ile video sahne sezme yönteminin elde ettiği bu farkın önemi daha da ortaya çıkmaktadır. Baskın kümeler ile video sahne sezme yöntemini çizge üleĢtirme temelli video sahne sezme yöntemine ait iki yaklaĢım takip etmektedir. Bu iki yaklaĢımın ardından çizge temelli çok seviyeli video sahne sezme yöntemi gelmektedir. Son sırada da RS yer almaktadır, ancak GBMVSD ve RS arasındaki fark çok küçüktür. Bununla birlikte DVD sahnelerinin esas sahne olarak kullanıldığı veri setinde yapılan deneyler sonucunda GBMVSD 0.751, RS_d ise 0.717 ortalama değerlerini vermiĢlerdir.

Çizelge 9.1 KarĢılaĢtırmalı performans sonuçları

Yapılan deneysel çalıĢmalar sonucunda baskın kümeler ile video sahne sezme yaklaĢımının karĢılaĢtırılan yöntemler arasında en baĢarılı yöntem olduğu ortaya çıkmıĢtır. BaĢarılı sonucun nedeni baskın kümeler ile video sahne sezme yönteminin

Yöntem CP BM GS ME Ortalama

OBM 0.759 0.752 0.721 0.692 0.731 TBM 0.753 0.773 0.732 0.665 0.731 GPBVSD_DS 0,713 0,731 0,713 0,658 0,704 GPBVSD_k 0,712 0,733 0,688 0,664 0,699 GBMVSD 0.724 0.720 0.646 0.655 0.686 RS 0.713 0.720 0.646 0.656 0.684

113

video sahne sezmede yer alan birçok soruna çözüm yaklaĢımı önermesidir. DüĢük seviyeli öznitelikler kullanılarak video sahne sınırı sezilirken, mevcut veri içerisindeki en tutarlı bilgi ilk önce kullanılmaya çalıĢılmaktadır. Bu amaç ile görsel içeriğe ve çekimler arası zamansal yakınlığa göre oluĢturulan ağırlıklı ve yönsüz bir çizgedeki en büyük düğüm örgütünü sezmek için baskın kümeler yöntemi kullanılmıĢtır. Ġkinci aĢamada ise hareket içeriğine ve çekimler arası zamansal yakınlığa göre oluĢturulan ağırlıklı ve yönsüz bir çizgedeki en büyük düğüm örgütü sezilmeye çalıĢılmıĢtır. Her iki özniteliğe göre de sezilemeyen sahneler olabileceğinden, dolaylı olarak sezim yaklaĢımı da sunulmuĢtur. Ġki farklı sahne içerisinde yer alan ama görsel olarak birbirine çok benzeyen iki çekimin olması, bu iki ayrı sahnenin bir sahne altında birleĢtirilmesine sebep olabilir. Bu problemin üstesinden gelmek için çizgede en büyük düğüm örgütünü bulmaya dayanan evrensel bir yaklaĢım kullanılmıĢtır. BaĢka bir deyiĢ ile çekim kümesinin genel davranıĢına göre karar verilmiĢtir. Aynı sahne içerisindeki çekimlerin görsel olarak birbirlerine yeterince benzememeleri sonucunda bir sahne birden fazla sahneye bölütlenebilir. Bu problem için ise, sadece görsel içeriğin kullanılmayarak ikinci aĢamada hareket içeriğinin kullanılması ve üçüncü aĢamada ise dolaylı olarak sezme iĢleminin yapılması önerilmiĢtir. Sezilen baskın kümeden sahne sınırı belirlenirken istatistiksel bir yaklaĢım kullanılarak zamansal bütünlük problemine bir çözüm getirilmiĢtir. Baskın kümeler ile video sahne sezme yöntemini etkileyen en kritik parametre d parametresidir. Bu parametre video sahne uzunluklarının belirlenmesinde önemli bir rol oynamaktadır. Fazla veya az bölütleme sorunu yaĢamamak için d parametresinin her bir video için uygun olarak seçilmesi bir problemdir. Bu sorunun aĢılması için de filmin temposuna dayalı uyarlanır bir seçim yaklaĢımı sunulmuĢtur.

Tüm bu sıralanan yaklaĢımlar baskın kümeler ile video sahne sezme yöntemini Çizelge 9.1’de üst sıraya taĢımıĢlardır.

Çizelge 9.1’de yer alan yöntemlerden çizge üleĢtirme temelli video sahne sezme yöntemine ait iki yaklaĢım dıĢındaki tüm yöntemler oluĢturulan bir çizge üzerinde çalıĢmaktadır. BaĢka bir deyiĢ ile tüm çekimler birbirleri ile karĢılaĢtırılarak kenar ağırlık değerleri hesaplanmaktadır. Bu durumda çekimler arası benzerlik hesaplama iĢlem karmaĢıklığı O(N2)’dir, (çekim sayısı) * (çekim sayısı-1) / 2 karĢılaĢtırma gereklidir. Çizge üleĢtirme temelli video sahne sezme yönteminde ise sadece zamansal

114

bir pencere içerisindeki çekimler birbirleri ile karĢılaĢtırılmaktadır. Bu durumda iĢlem karmaĢıklığı doğrusal olabilir (O(N)) ve hesaplama yükü açısından bu bir avantajdır.

Bununla birlikte diğer yöntemlerde de iĢlem karmaĢıklığı doğrusal bir seviyeye indirilebilir. Bunun için oluĢturulacak matris üzerindeki elemanların hesaplamasında ihmaller gereklidir. Zamansal benzerlik fonksiyonunun belirli bir değerin altında olduğu zamansal uzaklıklarda çekim benzerlik hesabının yapılmasının gerek olmadığı kabul edilir ise, bu durumu kapsayan benzerlik matrisi değerleri hesaplama yapılmadan 0.0 olarak kabul edilebilir. Bunun sonucu olarak performansta bir düĢüĢ beklenebilir ama iĢlem karmaĢıklığındaki düĢüĢ bazı durumlarda daha çok tercih edilebilir. Bu konu da ileride yapılabilecek çalıĢmalardan birisidir.

Tez çalıĢması kapsamında araĢtırılan bir diğer konu baskın kümeler yönteminin video içerik analizinde farklı kullanım alanlarıdır. Bu amaç ile farklı tip videolarda (Haber, reklam, çizgi film, basketbol, belgesel) deneyler yapılmıĢtır. Görsel içeriğe göre oluĢturulan bir çizge üzerinde baskın kümeler yöntemi kullanılarak sezilen çekimlerin özellikleri araĢtırılmıĢtır. Haber videolarında ve reklam kuĢağı videolarında baskın kümelerin zamansal video bölütlemede kullanılabileceği bulgusuna ulaĢılmıĢtır. Tezde, sadece görsel içeriğin baskın kümeleri araĢtırılmıĢtır. Bununla birlikte, özellikle tekrarlayan ve birbirine çok benzeyen hareket içeriğine sahip spor videolarında baskın kümelerin hareket içeriğine göre oluĢturulan bir çizgede nasıl sonuçlar vereceği ayrı bir araĢtırma konusudur.

Bu tez çalıĢmasında özet olarak, yüksek seviyeli zamansal video bölütlerinin sezilmesi için çizge kuramsal üç video sahne sezme yöntemi önerilmiĢtir: Çizge temelli çok seviyeli video sahne sezme, çizge üleĢtirme temelli video sahne sezme ve baskın kümeler ile video sahne sezme. Her bir yöntemde ağırlıklı ve yönsüz bir çizge kurulmaktadır. Önerilen video sahne sezme yöntemleri ile yapılan deneysel çalıĢmalarda, insan yardımı olmadan video sahnelerinin düzenlenmesi için umut verici sonuçlar elde edilmiĢtir.

115 KAYNAKLAR

Adams, B., Dorai, C. and Venkatesh, S. 2000. Novel approach to determining tempo and dramatic story sections in motion pictures. In: Proc. IEEE International Conference on Image Processing, vol. 2, pp. 283–286, 10-13 Sept. 2000.

Ahanger, G. and Little, T.D.C. 1996. A Survey of Technologies for parsing and indexing digital video. Journal of Visual Communication and Image Representation, 7(1); 28-43.

Aigrain, P., Zhang, H. and Petkovic, D. 1996. Content-Based Representation and Retrieval of Visual Media: A State of the Art Review. Multimedia Tools and Applications, 3(3); 179-202.

Alatan, A. A., Akansu, A. N. and Wolf, W. 2001. Multi-Modal Dialog Scene Detection using Hidden Markov Models for Content Based Multimedia Indexing. Multimedia Tools and Applications, 14; 137-151.

Anonymous. 2006. The Open Video Project, Web sitesi. http://www.open-video.org.

EriĢim Tarihi: 18.05.2006.

Anonymous. 2006. TRECVID, TREC Video Retrieval Evaluation, Web sitesi.

http://www-nlpir.nist.gov/projects/trecvid/, EriĢim Tarihi:18.05.2006.

Anonymous. 2006. NIST, National Institute of Standards and Technology, Web sitesi.

http://www.nist.gov/. EriĢim Tarihi: 20.05.2006.

Anonymous. 2006. TREC, Text Retrieval Conference, Web sitesi. http://trec.nist.gov/.

EriĢim Tarihi: 20.05.2006.

Anonymous. 2008. The Internet Movie Database, Web sitesi. http://www.imdb.com.

EriĢim Tarihi: 21.01. 2008.

Ardizzone, E. and Cascia, M. L. 1996a. Multifeature Image and Video Content Based Storage and Retrieval. In: Proc. SPIE, Multimedia Storage and Archiving Systems, vol. 2916, pp. 265-275.

Ardizzone, E. and Cascia, M. L. 1996b. Video Indexing Using Optical Flow Field. In:

Proc. ICIP'96, vol. 3, pp. 831-834, Lausanne, Switzerland, September, 1996.

Arman, F., Hsu, A. and Chiu, M. Y. 1993. Image Processing on Compressed Data for Large Video Databases. In: Proc. First ACM International Conference on Multimedia, pp. 267-272.

AĢan, E. 2008. Video Shot Boundary Detection by Graph Theoretic Approaches.

Master of Science Thesis, Department of Electrical and Electronics Engineering, Middle East Technical University.

Belkaya, A.G. ġ. 2001. Film Çözümlemede Temel YaklaĢımlar. Der Yayınları, Ġstanbul, Türkiye.

Benitez, A. B., Chang, S. F. and Smith, J. R. 2001. IMKA: A Multimedia Organization System Combining Perceptual and Semantic Knowledge. In: Proc. ACM MM 2001, Ottawa, Canada.

Bescos, J., Cisneros, G., Martinez, J. M., Menendez, J. M. and Cabrera, J. 2005. A Unified Model for Techniques on Video-Shot Transition Detection. IEEE Trans. Multimedia, 7(2); 293-307.

Boccignone, G., Chianese, A., Moscato, V. and Picariello, A. 2005. Foveated Shot Detection for Video Segmentation. IEEE Trans. Circuits and Systems for Video Technology, 15(3); 365-377.

116

Boreczky, J. S. and Rowe, L. A. 1996. Comparison of Video Shot Boundary Detection Techniques. In: Proc. SPIE, vol. 2670, pp.170-179.

Boreczky, J. S. and Wilcox, L.D. 1998. A Hidden Markov Model Framework for Video Segmentation Using Audio and Image Features. In: Proc. International conference on Acoustics, Speech, and Signal Processing, vol.6, Seattle, pp 3741-3744.

Bouthemy, P., Gelgon, M. and Ganansia, F. 1999. A Unified Approach to Shot Change Detection and Camera Motion Characterization. IEEE Trans. Circuits and Systems for Video Technology, 9(7); 1030-1044.

Brown, M. G., Foote, J. T., Jones, G. J. F., Jones, K. S. and Young, S. J. 1995.

Automatic Content-Based Retrieval of Broadcast News. In: Proc. ACM Multimedia'95,San Francisco, 5-9 November, pp 35-43.

Brunelli, R., Mich, O. and Modena, C. M. 1999. A Survey on Automatic Indexing of Video Data. Journal of Visual Communication and Image Representation, 10, 78-112.

Can, T. ve Duygulu, P. 2007a. Reklamların Belirlenmesi ve Takibi, IEEE 15. Sinyal ĠĢleme ve ĠletiĢim Uygulamaları Kurultayı (SIU), Anadolu Üniversitesi, EskiĢehir, Turkey, 11-13 Haziran 2007.

Can, T. and Duygulu, P. 2007b. Searching for repeated video sequences. In Proc. The International Workshop on Workshop on Multimedia information Retrieval (Augsburg, Bavaria, Germany, September 24 - 29, 2007), MIR '07.

Canny, J. 1986. A Computational Approach to Edge Detection. IEEE Trans. Pattern Analysis Machine Intelligence, 8(6); 679-698.

Ceyhun, Y. 1976. Çizge Kuramı Üzerine Kısa Bir Ġnceleme. Orta Doğu Teknik

Üniversitesi, Mühendislik Fakültesi, Elektrik Mühendisliği Bölümü, Yayın No:

54.

Chang, H. S., Sull, S. and Lee, S. U. 1999. Efficient Video Indexing Scheme for Content Based Retrieval. IEEE Trans. Circuits and Systems for Video

Technology, 9(8); 1269-1279.

Chen, H. Y. and Wu, J. L. 1995. A multi-layer video browsing system. IEEE Trans.

Consumer Electronics, 41(3); 842 – 850.

Cortes, C. and Vapnik, V. 1995. Support Vector Network. Machine learning, 20, 273- 297.

Dailianas, A., Allen, R. B. and England, P. 1995. Comparison of automatic video segmentation algorithms. In: Proc. SPIE, vol. 2615, pp. 2-16.

Davenport, G., Smith, T. A. and Princever, N. 1991. Cinematic Primitives for Multimedia. IEEE Computer Graphics and Applications, 11(4); 67-74.

DeMenthon, D., Kobla, V. and Doermann, D. 1998. Video Summarization by Curve Simplification. In: Proc. ACM Multimedia'98, Bristol, UK, pp. 211-218, 1998.

De Santo, M., Foggia, P., Percannella, G., Sansone, C. and Vento, M. 2006. An unsupervised algorithm for anchor shot detection. In: Proc. International

Conference of Pattern Recognition, IEEE Computer Society Press, Hong Kong, China. vol. 2, pp. 1238-1241, August, 2006.

Dhillon, I.S., Guan, Y. and Kulis, B. 2007. Weighted Graph Cuts without Eigenvectors:

A Multilevel Approach. IEEE Trans. Pattern Analysis and Machine Intelligence, 29(11); 1944-1957.

Ding, C.H.Q., He, X., Zha, H., Gu, M. and Simon, H.D. 2001. A min-max cut algorithm for graph partitioning and data clustering. In: Proc. IEEE International

117

Conference on Data Mining, pp. 107-114, 29 Nov.-2 Dec. 2001.

Duda, R.O., Hart, P.E. and Stork, D.G. 2001. Pattern Classification, 2nd ed., A Wiley- Interscience Publication, John Wiley & Sons, Inc.

Dufaux, F. 2000. Key Frame Selection to Represent a Video. In: Proc. ICIP 2000, pp.

275-278.

Ebadollahi, S., Chang, S. F. and Wu, H. 2002. Echocardiogram Videos:

Summarization, Temporal Segmentation And Browsing. In: ICIP 2002, Rochester, NY, September.

Ekin, A. ve Tekalp, A. M. 2003. Gerçek Zamanda Futbol Video Özeti Çıkarımı. 11.

Sinyal ĠĢleme ve ĠletiĢim Uygulamaları Kurultayı, Koç Üniversitesi, Ġstanbul, pp. 141-143, 18-20 Haziran, 2003.

Esen, E., YaĢaroğlu, Y., Önür, Ö., Soysal, M., Tekinalp, S. ve Alatan, A. A. 2003.

MPEG-7 Uyumlu Video Yönetim Sistemi. SĠU 2003 11. Sinyal ĠĢleme ve ĠletiĢim Uygulamaları Kurultayı, Ġstanbul pp. 144-147, 18-20 Haziran 2003.

Feng, J., Lo, K. T. and Mehrepour, H. 1996. Scene Change Detection Algorithm for MPEG Video Sequence. In: Proc. International Conference on Image Processing (ICIP 96), Lausanne, 1996.

Ferman, A. M. and Tekalp, A. M. 1998. Efficient Filtering and Clustering for Temporal Video Segmentation and Visual Summarization. J. Visual Communication Image Representation, 9(4); 336-351.

Ferman, A. M. and Tekalp, A. M. 1999. Probabilistic Analysis and Extraction of Video Content. In: Proc. IEEE International Conference on Image Processing, Kobe, Japan, October, 1999.

Ferman, A.M. and Tekalp, A.M. 2003. Two-stage hierarchical video summary extraction to match low-level user browsing preferences. IEEE Trans.

Multimedia, 5(2); 244- 256.

Fischer, S., Lienhart, R. and Effelsberg, W. 1995. Automatic Recognition of film Genres. In: Proc. ACM Multimedia'95, San Francisco, 5-9 November, pp 295- 304.

Fischer, S. 1996. Automatic Violence Detection in Digital Movies. In: Proc. SPIE Multimedia Storage and Archiving Systems, vol. 2916, pp. 212- 223.

Gao, X. and Tang, X. 2002. Unsupervised video-shot segmentation and model-free anchorperson detection for news video story parsing. IEEE Trans. Circuits and Systems for Video Technology, 12(9); 765-776.

Gargi, U., Kasturi, R. and Antani, S. 1998. Performance Characterization and Comparison of video Indexing Algorithms. In: Proc. Conference on Computer Vision and pattern Recognition (CVPR).

Gargi, U., Kasturi, R. and Strayer, S. H. 2000. Performance Characterization of Video Shot Change Detection Methods. IEEE Trans. Circuits and Systems for Video Technology, 10(1), 1-13.

Gong, Y. and Liu, X. 2000. Video Summarization Using Singular Value Decompositon.

In: Proc. Int. Conf. Computer Vision Pattern Recognition, vol. 2, pp. 174-180.

Gong, Y. 2003. Summarizing audiovisual contents of a video program. EURASIP Journal on Applied Signal Processing, 2003; 160-169.

Gu, Z., Mei, T., Hua, X.-S., Wu, X. and Li, S. 2007. EMS: Energy minimization based video scene segmentation. In: Proc. IEEE International Conference on

Multimedia and Expo, pp. 520-523, 2-5 July 2007.

118

Güllü, M. K., Urhan, O. and Ertürk, S. 2004. Dissolve Detection for Archive Films.

IEEE SĠU 2004 12. Sinyal ĠĢleme ve ĠletiĢim Uygulamaları Kurultayı, KuĢadası, Aydın, pp. 510-513, 28-30 Nisan 2004.

Günsel, B. and Tekalp, A. M. 1998. Content-based video abstraction. In: Proc.

International Conference on Image Processing (ICIP 98), vol. 3, pp. 128-132, 4-7 Oct. 1998.

Günsel, B., Ferman, A. M. and Tekalp, A. M. 1998. Temporal Video Segmentation Using Unsupervised Clustering and Semantic Object Tracking. J. Electronic Imaging, 7(3); 592-604.

Hafner, J., Sawhney, H. S., Equitz, W., Flickner, M. and Niblack, W. 1995. Efficient Color Histogram Indexing for Quadratic Form Distance Functions. IEEE Trans.

Pattern Analysis Machine Intelligence, 17(7); 729- 736.

Hamid, R., Johnson, A., Batta, S., Bobick, A., Isbell, C. and Coleman, G. 2005.

Detection and explanation of anomalous activities: representing activities as bags of event n-grams. In: Proc. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 20-25 June 2005, vol. 1, pp. 1031- 1038.

Hampapur, A., Jain, R. and Weymouth, T. E. 1995. Production Model Based Digital Video Segmentation. Multimedia Tools Appl., 1(1); 9-46.

Hanjalic, A., Lagendijk, R.L. and Biemond, J. 1999a. Semi-automatic news analysis, indexing, and classification system based on topic preselection. In Proc. SPIE, vol. 3656, pp. 86-97.

Hanjalic, A., Lagendijk, R. L. and Biemond, J. 1999b. Automated high-level movie segmentation for advanced video-retrieval systems. IEEE Trans. Circuits and Systems for Video Technology, 9(4); 580-588.

Hanjalic, A. and Zhang, H.J. 1999. An Integrated Scheme for Automated Video Abstraction Based on Unsupervised Cluster Validity Analysis. IEEE Trans.

Circuits and Systems for Video Technology, 9(8); 1280-1289.

Hanjalic, A. 2002. Shot Boundary Detection: Unraveled and Resolved? IEEE Trans.

on Circuits and Systems For Video Technology, 12(2); 90-105.

Hanjalic, A. 2004. Content-Based Analysis of Digital Video. Kluwer Academic Publishers, ISBN 1-4020-8114-6.

Hanjalic, A. 2007. Towards theoretical performance limits of video parsing. IEEE Trans. Circuits and Systems for Video Technology, 17; 261-272.

He, L., Sanocki, E., Grupta, A. and Grudin, J. 1999. Auto-Summarization of Audio-Video Presentations. In: Proc. ACM MM 99, pp. 489-498, Orlando, FL,

November, 1999.

Heng, W. J. and Ngan, K. N. 2003. High accuracy flashlight scene determination for shot boundary detection. Signal Processing: Image Communication, 18; 203- 219.

Hjelsvold, R., Langorgen, S., Midstraum, R. and Sandsta, O. 1995. Integrated Video Archive Tools. In: Proc. ACM Multimedia'95, San Francisco, 5-9 November, pp 283-293.

Jain, A.K., Murty, M.N. and Flynn, P.J. 1999. Data clustering: a review. ACM Computing Surveys, 31(3); 264 –323.

Kasturi, R. and Jain, R. 1991. Dynamic Vision, in R. Kasturi, R. Jain (Eds.) Computer Vision:Principles, IEEE Computer Society Press, Washington DC, pp. 469-480.

Kender, J.R. and Yeo, B.-L. 1998. Video scene segmentation via continuous video

119

coherence. In: Proc. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 367-373, 23-25 June 1998.

Kikukawa, T. and Kawafuchi, S. 1992. Development of an automatic summary editing system for the audio visual resources. Trans. of the Institute of Electronics, Information and Communication Engineers, J75-A(2); 204-212.

Koprinska, I. and Carrato, S. 2001. Temporal Video Segmentation: A Survey. Signal Processing: Image Communication, 16; 477-500.

Lienhart, R., Pfeiffer, S. and Fischer, S. 1997. Automatic Movie Abstracting and Its Presentation on an HTML- Page. Technical Report, Praktische Informatik IV, University of Manheim.

Lu, S., King, I. and Lyu, M.R. 2005. Novel video summarization framework for document preparation and archival applications. In: Proc. IEEE Aerospace Conference, pp. 1–10, 5-12 March 2005.

Ma, Y. F., Lu, L., Zhang, H. J. and Li, M. 2002. A User Attention Model for Video Summarization. In: Proc. ACM Multimedia'02, Juan-les-Pins, France, pp. 533- 542, December 1-6, 2002.

Manjunath, B. S., Salembier, P. and Sikora, T. 2002. Introduction to MPEG-7 Multimedia Content Description Interface. John Wiley & Sons Ltd., England, ISBN 0 471 48678 7.

Mentzelopoulos, M. and Psarrou, A. 2004. Key-Frame Extraction Algorithm Using Entropy Difference. In: Proc. ACM SIGMM Multimedia Information Retrieval, MIR'04, pp. 39-45, New York, New York, USA, October 15-16, 2004.

Nagasaka, A. and Tanaka, Y. 1992. Automatic video indexing and full-video search for object appearances. In: E. Knuth, L. M. Wegner (Eds.): Visual Database

Systems, II. Proceedings of the IFIP TC2/WG 2.6 Second Working Conf.

[ISBN: 0-444- 89609-0], North-Holland, vol. A-7, pp. 113-127, 1992.

Naphade, M., Mehrota, R., Ferman, A. M., Warnick, J., Huang, T. S. and Tekalp, A. M.

1998. A High Performance Shot Boundary Detection Algorithm Using Multiple Cues. In: Proc. International Conference on Image Processing (ICIP 98), vol. 1, pp. 884-887, Chicago, IL, October, 1998.

Ngo, C. W., Pong, T. C. and Chin, R. T. 2001. Video Partitioning by Temporal Slice Coherency. IEEE Trans. Circuits and Systems for Video Technology, 11(8);

941-953.

Ngo, C. W. 2003. A Robust Dissolve Detector by Support Vector Machine. In: Proc.

ACM Multimedia'03, Berkeley, USA, pp. 283-286, November 2-8, 2003.

Ngo, C. W., Ma, Y. F. and Zhang, H. J. 2005. Video Summarization and Scene detection by Graph Modeling. IEEE Trans. Circuits and Systems for Video Technology, 15(2); 296-305.

Odobez, J.-M., Gatica-Perez, D. and Guillemot, M. 2003. Spectral structuring of home videos. In: Bakker, E.M., Lew, M.S., Huang, T.S., Sebe, N., Zhou, X.S. (eds.) CIVR 2003. LNCS, vol. 2728, pp. 310-320. Springer, Heidelberg.

Otsuji, K., Tonomura, Y. and Ohba, Y. 1991. Video Browsing Using Brightness Data.

In: Proc. SPIE, vol. 1606, pp. 980-989.

Öngören, M. T. 1993. Senaryo ve Yapım, Yapım Tekniği, Üçüncü Kitap. Alan Yayıncılık, Ġstanbul, Türkiye.

Pavan, M. and Pelillo, M. 2003. Dominant sets and hierarchical clustering. In: Proc.

IEEE International Conference on Computer Vision, vol.1, pp. 362-369, 13-16 Oct. 2003.

120

Pavan, M. and Pelillo, M. 2007. Dominant Sets and Pairwise Clustering. IEEE Trans.

Pattern Analysis and Machine Intelligence, 29(1); 167-172.

Patel, N. V. and Sethi, I. K. 1997. Video Shot detection and Characterization for Video Databases. Pattern Recognition, 30; 583-592.

Peng, Y. and Ngo, C.W. 2006. Clip-based similarity measure for query-dependent clip retrieval and video summarization. IEEE Trans. Circuits and Systems for Video Technology, 16; 612-627.

Perona, P. and Freeman, W. 1998. A factorization approach to grouping. In: Burkhardt, H., Neumann, B. (eds.) ECCV”98. LNCS, vol. 1406, pp. 655-670. Springer, Heidelberg.

Petersohn, C. 2004. Fraunhofer HHI at TRECVID 2004: Shot boundary detection system. TREC Video Retrieval Evaluation Online Proceedings. TRECVID 2004, Kaynak: http://www-nlpir.nist.gov/projects/tvpubs/tvpapers04/fraunhofer.pdf, EriĢim Tarihi: 27.04.2006.

Petersohn, C. 2008a. Logical unit and scene detection - a comparative survey. In: Proc.

SPIE, vol. 6820, 682002.

Petersohn, C. 2008b. Improving scene detection by using gradual shot transitions as cues from film grammar. In: Proc. SPIE, vol. 6820, 68200D.

Pfeiffer, S., Lienhart, R., Fischer, S. and Effelsberg, W. 1996. Abstracting Digital Movies Automatically. Journal of Visual Communication and Image Representation, 7(4); 345-353.

Porter, S. V. 2004. Video segmentation and Indexing using Motion Estimation. Phd.

Thesis, University of Bristol, February 2004.

Qian, R., Haering, N. and Sezan, I. 1999. A Computational Approach to Semantic Event Detection. In: Proc. Computer Vision and Pattern Recognition, vol. 1, pp. 200- 206, Fort Collins, CO, June 1999.

Rabiner, L. R. 1989. A tutorial on hidden Markov model and selected applications in speech recognition. IEEE Proc., 77; 257-286.

Radhakrishnan, R., Divakaran, A., Xiong, Z. and Otsuka, I. 2006. A content-adaptive analysis and representation framework for audio event discovery from

unscripted multimedia. EURASIP Journal on Applied Signal Processing, 2006, Article ID 89013, 24 pages, DOI:10.1155/ASP/2006/89013.

Rasheed, Z. and Shah, M. 2005. Detection and representation of scenes in videos. IEEE Trans. Multimedia, 7; 1097-1105.

Rasheed, Z., Sheikh, Y. and Shah, M. 2005. On the Use of Computable Features for Film Classification. IEEE Trans. Circuits and Systems for Video Technology, 15(1); 52-64.

Rui, Y., Huang, T.S. and Mehrotra, S. 1999. Constructing table of content for videos.

Multimedia Systems, 7(5); 359-368.

Sadlier, D. A. and O'Connor, N. E. 2005. Event Detection in Field Sports Video Using Audio-Visual Features and a Support Vector Machine. IEEE Trans.

Circuits and Systems for Video Technology, 15(10); 1225-1233.

Sahouria, E. and Zakhor, A. 1999. Content Analysis of Video Using Principal components. IEEE Trans. Circuits and Systems for Video Technology, 9; 1290- 1298.

Sakarya, U. and Telatar, Z. 2007a. Graph-based multilevel temporal segmentation of scripted content videos. In: Escolano, F. and Vento, M. (eds.), Proc. The 6th IAPR-TC-15 International Workshop on Graph-Based Representations in

Benzer Belgeler