• Sonuç bulunamadı

2. UZAKTAN ALGILAMA KAVRAMI

2.3 Değerlendirme

Tez kapsamında UASS probleminin çözümü için CNN modellerle çalışılması planlanmaktadır. Bu sebeple, model eğitimi için kullanılacak modelin seçilmesi önemli bir aşamadır. Veri kümesi kullanımı söz konusu olduğunda iki ana tercih söz konusu olmaktadır. (1) Sıfırdan veri kümesi oluşturmak, (2) Mevcut veri kümelerini araştırarak arasından bir seçim yapmak.

Sıfırdan veri kümesi oluşturmak hem deneylerde kullanılacak sınıf şemasını hem de her bir sınıfta kullanılacak imgeleri araştırmacıya bıraktığı için daha avantajlı bir yöntem gibi düşünülse de oldukça uzun zaman alabilen bir süreçtir. Oluşturulacak veri kümesinin sınıflarının belirlenmesi alan uzmanlığı gerektirmektedir. Sıfırdan oluşturulacak bir veri kümesi, CNN mimarileri ile çalışmaya uygun olacak şekilde yüksek miktarda örnek imge içermelidir. Veri kümesinde kullanılacak imgeler aynı zamanda UASS probleminin kendine özgü bazı zorluk unsurlarını da içermelidir. Farklı ışık ve farklı hava koşullarının

27

dışında, farklı mekânsal çözünürlüklerde imgeler veri kümesine dahil edilmelidir. UASS probleminin zorluğunu arttıran iki temel unsur olan sınıf içi ayrışma ve sınıflar arası benzeşme sorunlarına örnek olacak şekilde tasnif yapılmalıdır.

Literatürde halen kullanılmakta olan mevcut veri kümeleri arasından bir seçim yapma yöntemi ise, süreci oldukça kısaltmaktadır. Böylece sınıflandırma modeli geliştirme sürecine odaklanılmıştır. Bir diğer avantaj ise, tez kapsamında yapılan deneylerden alınan sonuçlar ile literatürde yer alan diğer çalışmaların sonuçlarının karşılaştırılması olanağıdır.

Mevcut açık veri kümelerinin incelenmesi sonucunda, tez kapsamında yapılan model eğitimi deneylerinde kullanılmak üzere NW45 veri kümesi tercih edilmiştir. NW45 veri kümesi (Cheng vd. 2017), yukarıda belirtilen, UASS problemine ilişkin belirsizlik getiren pek çok soruna ilişkin imgeleri içeren, zorluk derecesi yüksek bir veri kümesidir.

Yayınlandığı tarihten bu yana, 2021 yılı dâhil olmak üzere, yapılan pek çok çalışmada tercih edilen veri kümelerinden birisi olup, kullanıldığı bazı çalışmalara örnekler Bölüm 5’te verilmiştir.

28 3. EVRİŞİMSEL SİNİR AĞLARI (CNN)

Evrişimsel sinir ağları (Convolutional Neural Networks, kısaca CNN), görüntü sınıflandırma konusunda, en çok kullanılan makine öğrenmesi algoritmalarından birisidir. CNN mimarilerinin en önemli özelliği öznitelik vektörlerini çıkarma basamağı ile sınıflandırma basamaklarının birleşmiş olmasıdır. Uçtan uca sınıflandırma olarak adlandırılan bu özellik sayesinde, derin öğrenme ağlarına, girdi olarak imgenin kendisi verilirken, çıktı olarak direk sınıflandırma bilgisi alınır. Öznitelik vektörleri, model eğitim sürecinde evrişimsel katmanlarda oluşur.

Bu bölümde ilk olarak CNN mimarilerine ilişkin genel bilgi ve tez kapsamında kullanılan mimariler hakkında kısa açıklamalara yer verilmiştir. İkinci olarak, önceden eğitilmiş olan CNN modellerin başka problemlerin çözümünde kullanılabilmesine olanak sağlayan transfer öğrenimi kavramı ve CNN modellerin transfer öğrenimi ile eğitilmesine ilişkin yöntemler kısaca aktarılmıştır

3.1 CNN Mimarilerinin Yapısı

Yapay sinir ağları, giriş katmanı, gizli katman (hidden layer) ve çıkış katmanı şeklinde üç katman ile modellenir. Yapay sinir ağlarının özel bir formu olan CNN mimarilerinde, giriş ve çıkış arasında kalan bölüm çeşitli blokların birbirine eklenmesiyle oluşmaktadır.

Bu bloklar ise, evrişimsel katman, havuzlama katmanı, aktivasyon katmanı ve tam bağlı katman olmak üzere farklı amaçları gerçekleştiren katmanlardan meydana gelmektedir.

Çıkışta ise sınıflandırma katmanı bulunmaktadır.

CNN mimarilerinde sınıflandırma ve öznitelik vektörü oluşturma aşamaları aynı anda tek yapı içinde tamamlanır. Ağın çalışma prensibi, sınıflandırma problemine konu olan imgeyi girişi olarak alması ve çıkışında bulunan olasılık dağılımı yapısı sayesinde imgeyi uygun sınıf bilgisine etiketlemesi üzerine kuruludur. Ağın girişi; imgenin farklı bantlarının parlaklık değerlerinden oluşan bir matris veya tensor yapısındadır. Çıkışı ise;

(sınıf_sayısı x 1) boyutlarına sahip bir vektördür. CNN mimarilerinde model eğitimi,

29

çıkıştaki tahminin doğru olup olmamasına göre hesaplanan hatanın, geriye yayılması (backpropagation) algoritması ile yapılmaktadır.

Şekil 3.1 Evrişimsel ağ ile sınıflandırma

Giriş Katmanı (input): CNN mimarilerinde giriş katmanı, giriş imgesinin her kanalındaki, pikselin parlaklık değeri ile oluşturulan, (en, boy, kanal sayısı) boyutlarına sahip bir matris yapısıdır. Kanal sayısı olarak adlandırılan parametre ile, imgeyi oluşturan farklı frekans bantları belirtilmektedir. Örneğin, RGB imgeler için giriş kanal sayısı;

kırmızı, yeşil ve mavi olmak üzere üç olarak tanımlanır.

Evrişimsel Katman (convolutional layer): Evrişimsel katmanda yer alan filtreleri (kernel) oluşturan nöronların her birinin bir alıcı alanı vardır. Ağın veriden öğrenmesi ve öznitelik vektörü oluşturması sürecinde yer alan temel katman bu katmandır. Ağın eğitimi sırasında, filtrelerde yer alan ağırlık değerleri öğrenilir.

Havuzlama katmanı (pooling layer): Uzamsal biriktirme katmanı olarak da adlandırılır ve genellikle evrişimsel katmanların ya da evrişimsel katmanlardan oluşan blokların çıkışında yer alır. Evrişimsel katmanın oluşturduğu öznitelik vektörünü küçülterek hem baskın özelliklerin ortaya çıkmasını hem de küçültülen boyutlarla daha etkin bir ağ eğitiminin olmasını sağlar. Ortalama havuzlama (average pooling) ya da maksimum havuzlama (maximum pooling) olarak iki şekilde yapılır. Bu kullanım aynı zamanda, girişe uygulanan öznitelik vektöründe oluşan gürültüyü azaltır.

30

Aktivasyon katmanı (activation layer): Bu katman, evrişimsel katmanların çıkışında yer alır ve lineer olmayan fonksiyonların kullanıldığı katmandır. Bu katman ağın doğrusal olmayan fonksiyonları öğrenmesine yardımcı olduğu için önemlidir. Derin modellerde yaygın olarak, ReLU (max(0,x)) aktivasyon fonksiyonu kullanılmaktadır.

Tam Bağlı Katman (fully connected layer): Tüm evrişimsel bloklar tamamlandıktan sonra, sınıflama fonksiyonlarına geçmeden önceki aşamada yer alır. Bu katmanla birlikte giriş katmanından kabul edilen imge; tek bir vektöre dönüştürülür. Bu katman, sınıflandırma katmanını besler. Bu katmandan sonra uygulanan kayıp fonksiyonunu kullanarak, geri yayılım (backpropagation) yöntemiyle ağ eğitilir. Bu yapı, çok katmanlı perceptrona (multilayer perceptron) benzer şekilde çalışır. Tüm düğümlerin birbiriyle bağlantısını gerektirdiği için öğrenilecek parametre sayısı bakımından ağa büyük bir yük getirir. Bu sebeple yeni nesil ağlarda bunun yerine 1x1 boyutlarında evrişimsel kernelden oluşan katmanlar tercih edilmektedir.

Sınıflandırma Katmanı: Evrişimsel sinir ağının son katmanıdır; derin modellerde ağırlıklı olarak softmax (Goodfellow vd.2016) fonksiyonun çalıştığı katmandır. Buradaki düğüm sayısı, modelin sınıf sayısına eşittir. Denklem 3.2’de verilen Softmax fonksiyonu, normalleştirilmiş üstel fonksiyon olarak da adlandırılır.

𝑆(𝐾)𝑖 = 𝑒−𝐾𝑖

∑ 𝑒𝑁𝑗 −𝐾𝑗 (3.2)

Denklem 3.1 ile; X giriş vektörü ve W ağırlıklar vektörü olmak üzere, Softmax fonksiyonundan önceki katmanlar tarafından oluşturulan fonksiyon K=f(X, W) olarak tanımlanmıştır. Softmax fonksiyonunun girişine K vektörü uygulanır ve fonksiyon çıkışından, S olasılık vektörü elde edilir. S vektörünün boyutu sınıf sayısına eşittir.

Bu katmanların farklı şekillerde kullanılmasıyla oluşan bloklar ve blokların zincir şekilde arka arkaya getirilmesiyle farklı CNN mimarileri oluşturulur. Bunların en bilinenleri ve sık kullanılanları VGGNet, GoogLeNet, ResNet, DenseNet mimarileri olup ResNet ve DenseNet tez kapsamında yapılan deneylerde kullanılmıştır.

31

LeNet (LeCun vd. 1998): CNN mimarilerinin ilk başarılı uygulaması olarak değerlendirilir. El yazısıyla yazılmış olan harfleri, rakamları okumak için tasarlanmıştır.

AlexNet (Krizhevsky vd. 2012): 2012 yılında, ILSVRC sonuçlarına göre en yüksek doğruluk oranıyla imge sınıflandırma yapan modelin mimarisidir. LeNet ile benzer bir yapıda olmakla birlikte daha fazla katmandan oluşan bir mimaridir. Her bir evrişimsel katmanın mutlaka bir havuz katmanı ile sonlandırılmasına ilişkin yaklaşımı değiştirmiştir.

Birbirini takip eden evrişimsel katmanlar bir havuz katmanıyla sonlandırılır ve bir blok oluşturulur. Bu tip bloklar uç uca eklenmiştir. Ağın sonunda tam bağlantı katmanı ve softmax sınıflandırıcı bulunmaktadır.

ZF Net (Zeiler ve Fergus 2013): ILSVRC 2013 yılının birincisi olan tasarımdır. AlexNet tasarımının, hiperparametrelerinin değiştirilmesi ile oluşturulmuş bir ağdır. Orta katmanda yer alan evrişimsel katmanların boyutları arttırılmış, filtre boyutları değiştirilmiştir.

GoogLeNet (Sezgedy vd. 2014): ILSVRC 2014 yılı birincisidir. AlexNet’in 60 milyondan fazla olan parametre sayısını 4 milyona düşürmüştür. Ayrıca, ağın sonunda tam bağlantı katmanı kullanmak yerine havuzlama katmanı kullanımı tercih edilmiştir.

CNN tasarımına getirdiği en büyük yenilik ise, “başlama modülü (inception module)”

adını verdikleri evrişimsel bloktur. Bu modülde, bir önceki katmanda alınan tensor, farklı filtre boyutlarına sahip farklı evrişimsel katmanlara dağıtılır. Paralel çalışan evrişimsel katmanların ürettiği sonuç vektörleri birleştirilir ve bir sonraki katmana yönlendirilir.

VGGNet (Simonyan ve Zisserman 2014): 2014 yılında, ILSVRC yarışmasında GoogLeNet tasarımının ardından ikinci olan tasarım VGGNet’dir. VGGNet mimarisi, daha derin CNN mimarileri oluşturma fikri üzerine kurulmuştur. Ağ derinliğinin arttırılmasının ağın sınıflandırma başarımını arttırdığını göstermiştir. AlexNet’de bulunan 7x7 evrişim katmanı filtreleri yerine peş peşe gelen 3x3 boyutunda evrişimsel filtreler kullanmıştır. Dezavantajı ise 140 milyondan fazla parametrenin öğrenilmesi gerekliliğidir. Bu parametrelerin büyük bölümü tam bağlı katmandan gelmektedir.

32

ResNet (He vd. 2015): Artık sinir ağı (residual network) mimarisi, ILSVRC yarışmasının 2015 yılı birincisi olmuştur. Atlama bağlantıları (skip connection) ile CNN tasarımına yenilik getirmiştir. Gradyen azalması problemine getirilen bu çözüm ile ağ derinliğini daha fazla arttırmak mümkün olmuştur. Bu mimaride yığın normalleştirme (batch normalization) kullanılmıştır. ResNet-18, ResNet-50, ResNet 101 gibi, ağ derinliğine göre adlandırılan türleri bulunmaktadır. Sonraki dönemlerde, GoogLeNet mimarisinde bulunan başlangıç bloğuna benzer blokların kullanıldığı ResNeXt (Xie vd. 2017) mimarisi de yine ResNet tabanlı olarak tasarlanmıştır.

DenseNet (Huang vd. 2017): DenseNet mimarisinde her evrişimsel blok, bir önceki tüm katmanların çıkışında oluşan öznitelik vektörlerini girişten alır ve kendi öznitelik haritasını oluşturarak bir sonraki katmana iletir. Her bir evrişimsel blok çıkışı, önceki blokların çıkışıyla birleştirilir ve bir sonraki bloğa aktarılır. Her katman için gerekli filtre sayısı büyüme oranı olarak adlandırılan bir k katmanı ile belirlenir. ResNet mimarisine benzer şekilde, farklı derinliklere sahip tasarımlar geliştirilmiş ve bu çözümlere derinliğini gösteren isimler verilmiştir: DenseNet-121, DenseNet-169, DenseNet-201, DenseNet-264.

CNN modeller, güdümlü öğrenme ya da gözetimli öğrenme adı verilen metotla eğitilir.

Bir CNN mimarisini baştan tasarlamak ve ağı sıfırdan eğitebilmek için çok yüksek sayıda etiketlenmiş imge gerektirmektedir. Bu durum, CNN mimarisi ile model eğitiminin önemli dezavantajlarından birisi olarak ortaya çıkmaktadır. CNN modellerinin sıfırdan eğitilmesinin getirdiği bazı dezavantajlar, transfer öğrenimi ile aşılmaya çalışılmıştır.

3.2 Transfer Öğrenimi

CNN mimariler, uçtan uca şeklinde tanımlanan yapıları sayesinde, öznitelik vektörü oluşturma ve sınıflandırma aşamalarını bir arada gerçekleştirirler. Bu sayede, imge sınıflandırmaya ilişkin klasik yöntemlerde çok uzun zaman ve hesaplama maliyetine sebep olan öznitelik vektörlerini çıkarma aşamasını ortadan kaldırmışlardır. Getirdikleri

33

yüksek doğruluk oranlarıyla, imge sınıflandırma probleminin en önemli algoritması olmuşlardır. CNN modellerin eğitilmesi konusunda iki temel yaklaşım vardır:

• Yeni bir mimari tasarlayarak sıfırdan model eğitimi yapmak ya da mevcut bir mimariden yararlanıp eldeki veriyle yine sıfırdan model eğitmek.

• Transfer öğrenimi tekniklerinden yararlanmak.

İlk yöntemin tercih edilmesi; eğitim aşaması için yüksek maliyetli donanım, çok büyük miktarda etiketlenmiş örnek imge ve uzun zaman gerektirmektedir. Ayrıca, aşırı öğrenme (overfitting) sorunundan kaçınmak için iletim sönümü (dropout) ve/veya düzenlileştirme (regularization) parametrelerinin atanması gerekmektedir. Hiperparametre olarak adlandırılan bu parametrelerin, başlangıçta en yüksek verimi alacak şekilde atanmasına ilişkin çeşitli çalışmalar yapılmış ve bu kapsamda en iyi sonucu verdiği belirtilen bazı değerler açıklanmış olsa da hiperparametre atanması daha çok deneyime dayanır.

Modellerin sıfırdan eğitilmesi, farklı parametreler kullanılarak uzun süreler isteyen deneyleri, kimi zaman defalarca yapmayı gerektirmektedir

İkinci yaklaşım olan transfer öğrenimi ise öğrenme aktarımı olarak da adlandırılan bir makine öğrenmesi yöntemidir. Bir problemin çözümü için tasarlanmış ve eğitilmiş olan bir modelin başka bir model için yeniden tasarlanması ve kullanılması olarak tanımlanır.

Başka veri kümeleri kullanılarak eğitilmiş ve başarımı kanıtlanmış CNN modelleri bu yöntemle yeni problemlere uyarlanır. Önceden eğitilmiş CNN modellerinin kullanımı konusunda, en çok ön plana çıkan ise; ImageNet (Deng vd. 2009) verileri ile eğitilmiş modellerdir. Transfer öğreniminde ise iki yaklaşım bulunmaktadır: İnce ayar ve öznitelik vektörü çıkarma.

İnce Ayar: Önceden eğitilmiş ağın giriş katmanlarında bulunan parametreler sabit tutulurken, sınıflandırma katmanına daha yakın diğer katmanların parametreleri ağ yeniden eğitilerek değiştirilir. Ağın yeniden eğitimi sürecinde, yeni probleme ilişkin imge setleri kullanılır. Bazı uygulamalarda, modelin belirli katmanlardan alınan çıkışları bir başka ağa gönderilir ya da buradan itibaren yeni evrişimsel katmanlar uygulanır.

34

Öznitelik Vektörü Çıkarma: Bu yöntemde, önceden eğitilmiş model olduğu gibi kullanılır. İnce ayarda olduğu gibi, bir kısım model parametrelerinin yeni probleme göre tekrar ayarlanması aşaması yoktur. Bunun yerine, önceden eğitilmiş modelin evrişimsel katmanlarının çıkışından elde edilen öznitelik haritalarını öznitelik vektörü olarak kullanılır. Bazı uygulamalarında ise, ağın sınıflandırma katmanının bir öncesinde yer alan tam bağlı katman ya da global havuzlama katmanı çıkışı öznitelik vektörü olarak kullanılmaktadır. Bu şekilde oluşturulan öznitelik vektörleri, tıpkı ilk seviye öznitelik vektörü kullanılarak yapılan çalışmalardaki gibi, farklı bir sınıflandırıcıya gönderilirler.

Bu tip uygulamalarda en çok tercih edilen sınıflandırıcı algoritmaların başında ise destek vektör makineleri (support vector machine – SVM) (Cortes ve Vapnik 1995).

3.3 Değerlendirme

UASS çalışmaları için üretilmiş etiketli veri kümesi sayısı azdır. Bu sebeple, seçilen bir CNN mimarisinde, sıfırdan model eğitmenin getireceği deneysel yük yerine transfer eğitiminin getirdiği avantajlar dikkate alınmıştır. Sıfırdan ağ tasarlanması ve eğitilmesi yerine, farklı imge sınıflandırma problemlerinde iyi sonuçlar vermiş olan modellerin incelenmesi ve seçilecek mimari ile çalışılması yöntemi benimsenmiştir. Bu yöntem, literatür kapsamında incelenen pek çok çalışmada kullanılmıştır.

Kullanılacak CNN mimarileri arasında yapılması gereken tercih deney sonuçlarına göre yapılmıştır. Tez kapsamında, model eğitimi için seçilen NW45 veri kümesinin sınıflandırılması için, ince ayar yöntemiyle çeşitli deneyler yapılmış ve bu deneyler sonucunda ResNet ve DenseNet mimarileri ile çalışmaya devam edilmesi yönünde bir seçim yapılmıştır. Bir diğer karar ise transfer öğreniminde hangi yaklaşımın kullanılacağı yönünde olmuş ve ince ayar yöntemi ile model eğitimi tercih edilmiştir.

Transfer öğrenimi yöntemleriyle çalışmanın, UASS problemi çözümünde kullanımına ilişkin literatür kapsamında örneklere ise dördüncü bölümde değinilmektedir.

35 4. KAYNAK ÖZETLERİ

Uzaktan algılama teknikleriyle elde edilen imgelerin, farklı kaynaklardan gelen sinyaller, ışık, gölgeler, geometrik çözünürlük, görüntünün elde edildiği yükseklik gibi sebeplerden dolayı çeşitli belirsizlikler içermesi söz konusudur Uzaktan algılama imgelerinin sınıflandırılmasına ilişkin tüm problemlerin çözümünde üç farklı yaklaşım benimsenmiştir: (1) piksel seviyesi (2) nesne seviyesi (3) sahne seviyesi. Başlangıçta sınıflandırma çalışmaları arasında, piksel seviyesi ve nesne seviyesi temelinde olanlar çoğunluktayken, imgelerin kalitesinin ve tespit edilebilen detayların artmasıyla, sahne seviyesi sınıflandırma çalışmaları ağırlık kazanmıştır. Uzaktan algılama sahne sınıflandırma problemi ise, imge sınıflandırma problemi olarak ele alınmış olup, yine üç farklı yaklaşım altında çözülen bir problemdir: (1) Alt seviye öznitelik vektörleri, (2) orta seviye öznitelik vektörleri, (3) üst seviye öznitelik vektörleri.

Bu bölümde ilk olarak, uzaktan algılama teknikleriyle elde edilen imgelere ilişkin çeşitli sınıflandırma yaklaşımlarına değinilmektedir. İkinci bölümde ise imge sınıflandırma problemi olarak UASS çalışmalarında kullanılan teknikler aktarılmaktadır.

4.1 Uzaktan Algılama İmgelerinde Sınıflandırma Yaklaşımları

Uzaktan algılama yöntemleri ile elde edilmiş sinyaller ile oluşturulan imgelerin sınıflandırılması sürecinde üç temel yaklaşım bulunmaktadır (Cheng vd. 2020): (1) Piksel düzeyinde sınıflandırma, (2) Nesne düzeyinde sınıflandırma, (3) Sahne düzeyinde. Şekil 4-1’de aynı imgenin farklı sınıflandırma yaklaşımı ile bölütlenmesi ve sınıflandırılmasına ilişkin örnekler yer almaktadır.

36

(a) İmge (b) Piksel Seviyesi (c) Nesne Seviyesi (c) Sahne Seviyesi

Şekil 4.1 Uzaktan algılama yöntemleriyle elde edilen imgelerde sınıflandırma yaklaşımları (Zonguldak, Türkiye, Google Earth 2021)

Piksel seviyesindeki yöntemler, anlamsal bölütleme (semantic segmentation) algoritmalarını kullanmaktadır. Bu yöntemde, her piksel; ait olduğu sınıfa göre renklendirilir. İmgelerin mekânsal çözünürlüklerinin çok düşük olduğu ilk dönemde yapılan sınıflandırma çalışmalarında yoğunlukla tercih edilmiştir (Minhe ve Jansen 1999). Anlamsal bölütleme halen hem çözünürlüğün düşük olduğu imgelerde, hem de multispektral ve hiperspektral verilerin analiz edilmesine ilişkin çalışmalarda tercih edilmekte olup aktif bir araştırma konusudur (Tuia vd. 2011, Li vd. 2019, He vd. 2017).

Uzaktan algılama imgelerinde mekânsal çözünürlüğün artmasıyla birlikte öncelikle nesne tabanlı sınıflandırma çalışmaları gündeme gelmiştir. Piksellerin anlamlandırılması yerine, imge üzerinde yer alan nesnelerin belirlenmesinin daha doğru sonuçlar vereceği düşünülmüştür (Blashke ve Strobl 2001). Bu düşünce ile sınıflandırma çalışmalarında kullanılan piksel temelli sınıflandırma yöntemleri, yerini büyük oranda nesne temelli sınıflandırma yöntemlerine (Yan vd. 2006) bırakmıştır.

Piksel seviyesinde sınıflandırma yöntemlerinden farklı olarak, nesne seviyesinde sınıflandırma yöntemleri, önce bir görüntü bölütleme algoritması kullanır ve pikselleri homojen görüntü nesnelerinde toplar. Örneğin binalara ait imgeler farklı, yollar farklı olmak üzere her bir obje homojen renk grupları ile ifade edilir. Böylece, imge üzerinde yer alan nesneler tek tek tespit edilmiş olur ve tespit edilen nesneler sınıflandırılır (Liu ve Xia 2010).

Park

37

Nesne seviyesindeki yaklaşımların piksel seviyesindeki yaklaşımlara göre çeşitli avantajları vardır. Birincisi, tuz-biber etkisi (salt and pepper effect) gibi tek tek pikseller ele alındığında ortaya çıkacak gürültü etkisini azaltmasıdır. Diğeri ise sınıflandırma birimini piksellerden nesnelere dönüştürerek, sınıf içi spektral varyasyonun getireceği hataları minimuma indirmesidir. Bir başka avantaj ise öznitelik vektörlerinin nesne bazında oluşturulmasına olanak sağlamasıdır (Guo vd. 2007). Böylece nesnelerin birbiriyle olan ilişkisi tespit edilebilmektedir.

Nesne seviyesinde yaklaşımın getirdiği avantajların yanında; bölütleme aşamasında ortaya çıkan önemli problemler bulunmaktadır (Möller vd. 2007, Kampouraki vd. 2008):

(1) Yetersiz bölütleme, (2) Aşırı bölütleme. Yetersiz bölütleme, farklı sınıflara ait olması gereken piksellerin tek nesnede toplanması durumudur. Bu şekilde birden fazla sınıfı kapsayan nesneler oluşur. Aşırı bölütleme ise nesnenin farklı bölümlerinin farklı bir nesne gibi işaretlenmesidir. Işık, görüş açısı gibi çok fazla spektral çeşitlilik oluşturan durumlar, uzaktan algılama imgesinde bulunan yeryüzü şekline ilişkin nesnelerin belirlenmesini zorlaştırmakta ve yanlış bölütleme yapılmasına yol açmaktadır. Yanlış bölütleme sonucu oluşan nesneler, gerçek nesnelerin özelliklerini (örneğin şekil ve alan) temsil etmemekte ve sınıflandırmanın başarımını azaltmaktadır (Song vd. 2005).

Sensör teknolojisindeki gelişmeler sayesinde imgelerin görüntü kalitesi ve mekânsal çözünürlüğü artmış ve daha fazla detay tespit edilir olmuştur. Böylece uzaktan algılama imgelerinin sınıflandırılmasına ilişkin üçüncü aşamaya geçilmiş ve “sahne” seviyesinde sınıflandırma kavramı gündeme gelmiştir. “Sahne seviyesinde sınıflandırma”

yaklaşımına adını veren “sahne” terimi, “Bir bölgenin, ya da bir alanın arazi örtüsünü veya arazi kullanım şeklini açık ve net bir biçimde gösteren imge ya da imge parçası (Cheng vd. 2015)” olarak tanımlanmaktadır. Böylece uzaktan algılama sahne sınıflandırması (UASS) problemi olarak adlandırdığımız problem ortaya çıkmıştır (Hu vd. 2015). Arazi kullanım şekli ve yeryüzü şekli belirleme (Gomez-Chova vd. 2015), doğal afet tespiti (Martha vd. 2011), bitki örtüsü tespiti, şehir planlama (Li ve Shao 2013) gibi pek çok farklı disiplinde ortaya çıkan çeşitli sınıflandırma problemlerinin çözümü için yapılan çalışmalar, sahne kavramı üzerinden yapılmaya başlanmıştır.

38

4.2 Sahne Sınıflandırma / İmge sınıflandırma Problemi

UASS problemi, imge sınıflandırma probleminin bir alt başlığı olduğu için çözüm teknikleri, görüntü işleme algoritmalarını ve diğer imge sınıflandırma algoritmalarını içermektedir. Bir imge sınıflandırma problemi matematiksel olarak denklem 4.1 ile ifade edilir.

𝑓(𝑋, 𝑊) = 𝑦 𝑋, 𝑊 ∈ ℝ𝑛 , 𝑌 ∈ ℝ (4.1)

Denklem 4.1’de verilen X ve W n boyutlu birer vektördür. X vektörü, imgenin öznitelik vektörünü temsil eder. Görüntü işleme metotlarıyla elde edilen bir vektör olabileceği gibi derin öğrenme metotlarında olduğu gibi imgenin piksel değerleri de olabilir. W ise, her bir öznitelik vektörünün ağırlık katsayısını gösterir. Burada yapılması gereken; giriş vektörü X’i, y sınıfına atayan fonksiyonu ortaya çıkarmak için en uygun ağırlık katsayılarını hesaplamaktır.

X vektörünün elde edilmesi, bir sınıflandırma probleminin öncelikli basamağıdır. Bu ilk basamakta, imge için ayırt edici öznitelik vektörleri oluşturulur. İkinci basamakta ise elde edilen öznitelik vektörleri seçilen bir sınıflandırıcıya gönderilir ve en iyileme (optimization) yöntemleri kullanılarak sınıflandırıcı eğitilir. Bazı çalışmalarda, birinci

X vektörünün elde edilmesi, bir sınıflandırma probleminin öncelikli basamağıdır. Bu ilk basamakta, imge için ayırt edici öznitelik vektörleri oluşturulur. İkinci basamakta ise elde edilen öznitelik vektörleri seçilen bir sınıflandırıcıya gönderilir ve en iyileme (optimization) yöntemleri kullanılarak sınıflandırıcı eğitilir. Bazı çalışmalarda, birinci