Boyut Normalleştirme - KARAKTER TANIMA ĐŞLEMĐNĐN AŞAMALARI

3. KARAKTER TANIMA ĐŞLEMĐNĐN AŞAMALARI

3.1.5. Boyut Normalleştirme

El yazısı karakterler çok farklı boyutlarda yazılabileceği için, ölçek farklılıkları düzenleyen bir normalleştirme işlemine ihtiyaç duyulur. Normalleştirme işlemi sonucu farklı boyutlardaki karakterler, öngörülen boyutlardaki sabit çerçeve içerisine tam olarak yerleşecek şekilde yeniden düzenlenir [Li, 1997]. Bu uyarlama, farklı karakterlerden çıkarılan özellik bilgileri arasındaki ilişkilerin korunmasını sağlar. Şekil 3.10’da örnek bir normalleştirme işlemi görülmektedir.

(a) (b)

Şekil 3.10. Boyut normalleştirme, (a) Orijinal karakter görüntüsü, (b) Normalleştirilmiş karakter

3.1.6. Meyil-Eğim düzeltme

El yazısı karakter tanıma uygulamalarında, meyil ve eğim düzeltme önemli bir işlemdir. Meyil; ana hattın yatay yöndeki sapmasıdır (Şekil 3.11). Eğim ise dikeye yakın çizgilerin ortalamasının dikey doğrultudaki sapmasıdır (Şekil 3.12).

Şekil 3.11. Kelime örneği Şekil 3.12. Kelime örneği a) Orjinal resim a) Orjinal resim

b) Meyili düzeltmiş resim b) Eğimi düzeltmiş resim

Bu işlem için kullanılan iki metot vardır. Birincisinde, önce meyil açısı sonra eğim açısı düzeltilir. Đkincisinde ise önce eğim, daha sonra meyil açısı düzeltilir [Slavik ve Govindaraju, 2001].

Ana hattın yatay çizgiden α kadar saptığı ve dikeye yakın çizgilerin ortalamasının da dikey eksenden β kadar saptığı bir kelime farz edilsin (Şekil 3.13). Ana hattın, koordinat sisteminin orijini ile kesiştiği farz edilsin.

1. Metot

Meyil düzeltmek için, (x,y) koordinat değerlerine sahip bir nokta, bütün resmin orijin etrafında -α açısıyla döndürülmesinde sonra (x',y ) değerlerine sahip olur. '

= (3.3)

-β açısı ile eğim düzeltme işleminden sonra noktanın yeni koordinatları şöyle olur.

= = T (3.4)

döndürme ve eğim düzeltme işleminin bileşim matrisi :

T = (3.5) x' y' cos α sin α -sin α cos α x y x'' y'' 1 -tan β 0 1 x y x' y'

cosα + sinα tanβ sinα – cosα tanβ - sinα cosα a)

Şekil 3.10’da görüldüğü gibi γ, dikeye yakın çizgilerin ortalamasının dikey eksenden sapma açısıdır (γ = β- α).

tanβ – tanα = (1 + tanα tanβ)tan(β-α) (3.6.)

= (1+ tanα tanβ)tan γ

(3.6.) formülü kullanılarak T şöyle hesaplanır :

T = cosα

= cosα = D_T.R ,

R = (3.7)

R, yatay doğrultuda – γ açısı ile, dikey doğrultuda – α açısı ile eş zamanlı eğim ve meyil düzeltme işlemi için bir matristir.

D_T = (3.8.)

D_T , resmi y yönünde daraltan ve x yönünde genişleten (veya cosα+sinα tanβ değerine göre daraltan) bir diyagonal matristir. T’nin determinantı 1’dir. Bu yüzden resmin alanı korunmuştur.

1 + tanα tanβ tanα – tanβ - tanα 1 1 + tanα tanβ 0 0 1 1 - tanγ - tanα 1 1 - tanγ - tanα 1

cosα + sinα tanβ 0

2. Metot

(x, y) koordinat değerlerine sahip bir nokta, - γ açısıyla eğim düzeltme işleminden sonra (x , ' y ) değerlerine sahip olur. '

= (3.9)

ω açısıyla meyil düzeltme işleminden sonra ise aşağıdaki değerlere sahip olur.

= (3.10)

Şekil 3.15’te Birinci ve ikinci metot ile yapılan eğim-meyil düzeltme işlemleri sonucunda üretilen kelime çerçevesinin boyutları gösterilmektedir.

Şekil 3.13. Birinci metot Şekil 3.14. Đkinci metot x' y' 1 - tanγ 0 1 x y x'' y'' 1 0 -tanω 1 x' y'

a) b)

Şekil 3.15. a) Birinci Metot b) Đkinci Metot

Kelimenin meyil açısının hesaplanması

Kelime görüntüsü, -40 ile 40 arasında 10’ar derece aralıklarla kendi etrafında döndürülür. Her bir döndürme sonucunda elde edilen kelime görüntüsünün yükseklik değerleri karşılaştırılır. En küçük yüksekliği netice veren döndürme açısı, kelimenin muhtemel meyil açısıdır.

Kelimenin eğim açısının hesaplanması

Kelime görüntüsü üzerinde, -40 ile 40 arasında 10’ar derece aralıklarla eğim düzeltme işlemi uygulanır. Her bir eğim düzeltme işlemi sonucunda elde edilen kelime görüntüsünün genişlik değerleri karşılaştırılır. En küçük genişliği üreten eğim düzeltme açısı, kelimenin muhtemel eğim açısıdır. Şekil 3.16’da eğim ve meyil düzeltme örnekleri gösterilmiştir.

a) b) c) Şekil 3.16. a) Eğim Düzeltme b) Meyil Düzeltme c) Meyil + Eğim Düzeltme

3.1.7. Đnceltme

Bu aşamadaki amaç, karakterin bir piksel kalınlığındaki iskeletinin üretilmesidir. Eğer karakterin özellik setinin çıkarılması gerekiyorsa inceltmeye ihtiyaç duyulur. Đnceltme algoritmalarında aranan özellikler çatallanma olmaması, bir piksel kalınlık elde edilmesi, bağların muhafaza edilmesi, bilgi kaybı olmaması gibi durumlardır.

Son yıllarda bir çok inceltme algoritması geliştirilmiştir. Bazı klasik algoritmalar güzel sonuçlar elde etmiştir ama hâlâ eksiklikleri mevcuttur. Mesela bazı algoritmalar imajın bağlarını muhafaza edememektedir. Datta’nın algoritmasında inceltmenin bazı temel özellikleri sağlanır [Datta ve Parui, 1994]. Ama çok geçişli tekrarlama kullanılmaktadır ve tam paralel işleyen bir algoritma değil. Han 5x5 maskesi bilgisine dayalı tam paralel işleyen bir algoritma önerir [Han vd., 1997]. Fakat Han’ın algoritması çok zaman kullanmaktadır. Ek olarak bütün bu algoritmalar bazı özel durumlarda verimli değillerdir.

Huang’ın algoritmasında bağlanabilirlik problemini çözmek için bazı yeni kurallar ve bilgi kaybını önlemek için şekil bilgisi kullanılır. Bu algoritma ile bir-piksel kalınlık ve bağlanabilirlik elde edilir. Đskelet orta eksene yakın konumdadır. Böylece imajın topolojisi muhafaza edilir. Đkili resim siyah ve beyaz piksellerle temsil edilir. 1 siyah pikseli, 0 ise beyaz pikseli gösterir.

Silme Kuralları

Silme kuralları inceltme algoritmasının çekirdeğidir ve algoritmanın performansını oluşturur. Datta, dört adet 1x3’lük şablon ve bir adet 3x3’lük pencere kullanır. Han, algoritmasında ağırlık-değerlerini(8-komşu toplamı) kullanır.

Huang, algoritmasında 3x3’lük pencere kullanır. Nesne pikselin 8-komşusu ile meydana gelebilecek bütün çeşitleri düşünülür. Şekil 3.17’de bütün kurallar gösterilmektedir. Đlk kolon, pikselin komşu sayısını gösterir. Çoğu pencere Han’ın kuralları ile aynı olmasına rağmen aralarında temel farklılıklar vardır. Han algoritması, 8-komşu üzerine dayalı ve 8-komşunun ağırlık değerlerini de hesaba katmaktadır. Bunlara ek olarak 5x5’lik pencere bilgisi de kullanır. Bu algoritmada sadece 3x3’lük pencere bilgisi kullanılır. Ek olarak, şeklin biçimini bozabilen ve bağları silebilen bazı elimine kuralları kaldırılır.

Bütün kurallar her bir piksele aynı zamanda uygulanır. Fakat algoritma bazı özel durumlarda iyi çalışmıyor. Mesela, dikey ve yatay yönlerde 2-piksel kalınlıktaki çizgiler silinebilir ve bu da nesne örüntüsündeki bağların kopmasına neden olabilir. Mesela iki piksel kalınlığındaki dikdörtgen örüntüsü tamamen kaybolmaktadır. Bağlanabilirliği muhafaza etmek için bu piksellerin silinmemesi gerekir. Öte yandan 2-piksel kalınlığına dokunulmazsa iskelet bir piksel kalınlığında olmamaktadır. Datta algoritmasında, her bir geçişte tek bir şablon uygulanır ve bunun çıkışı diğer geçişe uygulanır. Bağlanabilirlik ve bir piksel kalınlık garanti edilir. Jang bu problemi çözmek için on adet 3x4, 4x3 ve 4x4’lük pencere kullanır [Jang ve Chin, 1992]. Lei Huang algoritmasında, Jang’ın şablonlarının değiştirilmiş hali kullanılır. Yeni şablonlar şekil 3.18’de gösterilmektedir. Eğer piksel, bu şablonlardan birine uyarsa piksel silinmez.

Şekil 3.17. Silme kuralları. Boş kutu beyaz pikseli gösterir.

Đnceltme algoritması: 1. Arama tablosu oluştur.

2. Her bir piksel için indeks numarası hesapla.

3. Piksel silinecekse indeks numarası ve arama tablosunu kullan. Eğer piksel silinmeyecekse 5. adıma git.

4. Nesnenin kalınlığını hesapla. Eğer 2-piksel kalınlığında değilse sil. Aksi takdirde 3x4, 4x3 ve 4x4’lük şablonları kullan. Eğer şablonlardan birine uyuyorsa pikseli silme, hiçbirine uymuyorsa sil.

Şekil 3.19’da inceltme algoritmasının ürettiği sonuçlar gösterilmiştir.

Şekil 3.18. Muhafaza şablonları. Boşluk beyaz pikseli gösterir. “X” dikkate alınmayacak.

Şekil 3.19. Đnceltme uygulamasından bazı örnekler

Nagendraprasad-Wang-Gupta inceltme algoritmasının simetrik bir modeli, ekstra hesaplama maliyeti getirmeden el yazısı karakterlerin basit ve zarif iskeletlerini üretir [Carrasco ve Forcada, 35].

Algoritma, pikselleri değiştirmek için maskeler kullanır. Şekil 3.20’de gösterildiği gibi seçilen piksele en yakın 8 komşusu saat yönünde numaralandırılır.

Şekil 3.20. Komşu piksellerin numaralandırılması

NWG algoritması şekil 3.21’de gösterilmiştir.

b(p), p’nin komşuluğundaki siyah piksel sayısıdır. a(p), komşular üzerindeki değişim işlemi sayısıdır. c(p), e(p), ve f(p) fonksiyonları şöyledir :

Eğer p(0) = p(1) = p(2) = p(5) = 0 ve p(4) = p(6) = 1 ise c(p) = 1 olur Eğer p(2) = p(3) = p(4) = p(7) = 0 ve p(6) = p(0) = 1 ise c(p) = 1 olur Diğer durumlarda c(p) = 0 olur

e(p) = (p(2) + p(4)) * p(0) * p(6) f(p) = (p(6) + p(0)) * p(4)* p(2)

NWG algoritmasının performansı şekil 3.22’de gösterilmiştir. Elde edilen iskeletin bağı korunur ve el yazısının tanınmasını güçleştirecek gerekenden fazla hiçbir piksel silinmez. Bununla beraber, Şekil 3.23’teki gibi, algoritmadaki asimetri nedeniyle bazı gereksiz pikseller kalır. Bu sorun, g = 1(tek iterasyonlar) olan iterasyonlardaki c(p) fonksiyonunun değiştirilmesiyle çözülür.

a(p)=1 veya c(p)=1

şöyle değiştirilir:

a(p) = 1 veya (1 - g) * c(p) + g * d(p) = 1

Eğer p(1) = p(4) = p(5) = p(6) = 0 ve p(0) = p(2) = 1 ise d(p) = 1 olur. Eğer p(0) = p(3) = p(6) = p(7) = 0 ve p(2) = p(4) = 1 ise d(p) = 1 olur. Diğer durumlarda d(p) = 0 olur.

Sonuç, genellikle daha zarif iskeletler üreten simetrik bir algoritmadır. Şekil 3.23 yapılan değişikliklerin olumlu etkisini gösteriyor. Algoritma önceden “D” gibi bir iskelet üretirken şimdi “0”a benzer bir iskelet üretir. NWG Algoritması şöyledir.

Şekil 3.21. NWG inceltme algoritması

a) b) c)

Şekil 3.23. a) El yazısı sembolü. b) NWG ile üretilen iskeleti. c) NWG’nin değiştirilmiş versiyonu

3.2. Özellik çıkarma

Görüntüde yer alan farklı her bir bilgi, özellik olarak tanımlanabilir. Bunlar, görüntü piksellerine yansıyan karakteristik özelliklerdir. Piksel gri tonlarındaki değişimler, arka zemin niteliği, doku yapısı ve bölgesel doku farklılıkları bunlara örnek olarak verilebilir. Şekil tanıma açısından ise özellikler, herhangi bir nesneye ait fiziksel biçimi karakterize eden bilgilerden oluşmaktadır. Özellikler, sözü edilen bilgilerin görüntü ya da şekilden ayrıştırılarak seçilmesi sonucu elde edilen sayısal verilerden meydana gelmektedir. Özellik bilgisi çıkartımında, şekil yapısında yer alan köşe noktaları, kenar çizgileri gibi yapısal özellikleri tanımlayan veriler ile birlikte, yine şekilden dönüşüm yöntemleri (moment, fourier v.b.) ile elde edilen veriler de kullanılabilmektedir [Çelik, 1999].

Şekil tanıma işleminde bir çok özellik çıkarma yönteminden hangilerinin kullanılacağı, seçilen uygulama doğrultusunda belirlenmektedir. Şekil tanıma amacıyla üretilen özellik bilgilerinden bir özellik seti oluşturma işlemi şu bilgileri sağlamayı amaçlar :

a) Aynı sınıfa ait örnekler için özellik bilgilerindeki değişim küçük olmalıdır. b) Farklı sınıflar arasındaki değişimler ise büyük olmalıdır.

Özellik bilgilerinin bu şartları taşıma oranı, tanıma işleminin verimliliğini doğrudan etkileyen bir faktördür.

3.2.1. Histogram özellikleri

Bu özellikler gri tonlu görüntü üzerinden ve histogram fonksiyonu kullanılarak elde edilir. Histogram fonksiyonu bir görüntüde yer alan gri tonlara ait piksel seviye değerlerinin oluşma sıklığını tanımlayan bir olasılık dağılım fonksiyonudur [Jain, 1989]. Gri seviye değerleri x değişkeni ile tanımlandığında histogram fonksiyonu :

p_u(x) = x = 0, 1, ….. , K – 1 (3.10)

(N_x= x gri seviyeli piksel sayısı, N_T= toplam piksel sayısı.) eşitliği ile tanımlanmaktadır.

Histogram fonksiyonu aynı zamanda nesnelerin arka zeminden ayrıştırılmasında kullanılmaktadır. Şekil 3.24’te bir histogram fonksiyonu görülmektedir. Bu şekildeki histogram yapısına sahip bir gri tonlu görüntü, tek değerli eşikleme yöntemi ile ikili düzen formata çevrilebilir. Eşik değeri, fonksiyonun vadi noktasına karşılık gelen gri seviye değeri olarak seçilmektedir. Histogram fonksiyonunun birden fazla vadi noktası ürettiği görüntü örnekleri için çok seviyeli eşikleme işlemleri gerçekleştirilir [Sahoo vd., 1988].

Şekil 3.24. Bir görüntüye ait histogram fonksiyonu

Histogram ile elde edilen özellik bilgileri şunlardır: Serpinti (dispersion) etkisi, ortalama değer, değişinti (variance), ortalama enerji, kaykılma (skewness) etkisi, ortalama değer çevresinde yoğulaşma (kurtosis).

arka zemin nesne

eşik T x N N P_u(x)

Histogramın dar olması düşük seviyeli kontrastı tanımlarken fonksiyonun gri ton ekseninde sağa veya sola yaklaşıklığı ışığa doymuşluk veya yetersizlik derecesini yansıtır.

3.2.2. Şekil özellikleri

Nesnenin fiziksel yapısını yansıtan profiline şekil adı verilir. Şekil özellikleri, ikili forma dönüştürülmüş görüntü aracılığı ile elde edilebilir. Şekiller üzerinde gerçekleştirilen temel özellik yöntemleri Şekil 3.25’teki gibi sınıflandırılmaktadır [Jain, 1989].

Şekil 3.25. Şekil özelliklerinin sınıflandırılması

3.2.3. Sınır eğrisi

Sınır eğrisi (contour), nesne şeklini kuşatan birbiri ile bağlantılı noktalardan oluşmaktadır. Herhangi bir nesnenin sınır eğrileri ile temsil edilmesi, görüntüde dokusal özelliklerin gözardı edilerek, şeklin daha az sayıdaki veri ile tanımlanmasını

Geometrik Ölçüm özellikleri Moment tabanlı Geri çatılabilir özellikler • Çevre uzunluğu • Alan • Max-min yarıçap ve eksenlik • Bükülme enerjisi • Köşeler • Yuvarlaklık • Ağırlık merkezi • Eksenel doğrultu • Sınır dörtgeni • Eksenellik Şekil özellikleri • Sınır eğrisi • Bölge kodlama • Moment değişmezleri

sağlar. Sınır eğrisini tanımlayan noktalar, piksellerin 4’lü veya 8’li komşuluk ilişkisine (Şekil 3.26) göre tanımlanan bağlantılı piksellerden meydana gelir [Haralick ve Shapiro, 1992]. Đkili görüntüden sınır eğrisinin üretilmesi, sınır eğrisi çıkarma algoritmaları ile gerçekleştirilir. Đşlem sonunda, tek boyutlu dizi halinde elde edilen sayısal veriler, iki boyutlu sınır eğrisini temsil eden açılımlardır. Zincir kod, sınır eğrisi açılım yöntemlerinden birisidir.

P4 P3 P2 P5 P P1 P6 P7 P8

a) b)

Şekil 3.26. a) 4’lü piksel komşuluğu b) 8’li piksel komşuluğu

3.2.4. Zincir Kod

Đlk kez Freeman tarafından tanımlanan zincir kodlar, 4’lü veya 8’li piksel komşuluğuna göre tanımlanan standart doğrultulu vektörlerden oluşmaktadır [Ansari ve Huang, 1991]. Şekil 3.27’de zincir kodlar görülmektedir. Sınır eğrisinin zincir kod açılımı, sınır eğrisi piksellerinin sıralı dizilimini yansıtır. Sıralama, piksel izleme yönüne göre gerçekleşmektedir. Bu şekilde açılım, sınır eğrisi noktalarının tek boyutlu bir dizi halinde tanımlanmasını sağlamaktadır. N adet vektörden oluşan herhangi bir sınır eğrisine ait zincir kod açılımı (3.11) eşitliğindeki gibi ifade edilmektedir.

V = a₁, a₂, ……, a_n ∀ a_i ∈ { 0, 1, ….., 7 } (3.11) Birim vektör uzunlukları ise, çapraz doğrultularda 2, diğer doğrultularda 1 olarak kabul edilir.

P2 P4 P P1 P3

(a) (b)

Şekil 3.27. (a) Yön bilgisi, (b) 4’lü ve 8’li zincir kod vektörleri, (c) Sınır eğrisinin 8’li zincir kod ile tanımlanması

Vektörler 8’li komşulukta 45 derece açılı tanımlanır ve bunların uzunlukları 45 derecenin tek katlarında 2, diğerleri için 1 birim olarak tanımlanır.

3.3. Dilimleme

Dilimleme, kelimedeki karakterlerin ayrıştırılması işlemidir. Karakterlerin tanıma algoritmalarına gönderilmeden önce yapılan en önemli aşamadır. Çünkü doğru bir tanımlama yapılması için, karakterlerin doğru bir şekilde ayrıştırılması gerekir. Günümüzde, el yazılarındaki karakterlerin ayrıştırılması tam olarak çözülememiş bir problemdir. Son yıllarda bu konuda bir çok çalışma yapılmıştır, önemli gelişmeler sağlanmıştır ve çeşitli yöntemler geliştirilmiştir. Karakterlerin dilimlenmesi stratejileri dört gruba ayrılır [Casey, ve Lecolinet, 1995]:

4 2 3 0 7 4 1 1 2 3 6 5

a) Parçalama yöntemi ile dilimleme : Karaktere benzeyen özellikler kullanılarak, dilimler tanımlanır. Görüntüyü, anlamlı bileşenlere kesme işlemine parçalama(dissection) denir. Parçalama, görüntüyü, şekil bilgisinin özel sınıflarını kullanmadan analiz eden akıllı bir işlemdir. Đyi bir dilimleme için, geçerli karakterlerin sahip olduğu genel özellikleri içeren parçaların bulunması önemli bir kriterdir. Kullanılan parçalama tabanlı yöntemler, karakter sıklığı ve beyaz alanları , dikey projeksiyon analizini, birleşik bileşenlerin analizini, dönüm noktalarını kullanır.

b) Tanıma tabanlı dilimleme : Daha önce tanımlanan sınıflar ile eşleşen görüntü bileşenlerini bulmaya çalışır. Dilimleme tanıma güvencesi ile yapılır ve bu güvence, sonucun sözdizimsel ve anlamsal doğruluğuna bakılarak kuvvetlendirilir. Bu yaklaşımda iki farklı metot kullanılır; bazı arama işlemi yapan metotlar ve görüntünün özelliklerini kullanan metotlar.

Birinci metot, özellik tabanlı parçalama algoritması kullanmadan, kelimeyi karakterlere ayrıştırmaya çalışır. Kavramsal olarak bu metotlar, makine baskısı yazıları tanımak için kullanılan bazı şemaları kullanır. Temel prensip, karakter tanıma ile doğrulanan muhtemel dilimleme dizisi elde etmek için, değişebilen genişliklere sahip bir pencere kullanmaktır. Diğer bir teknik, dinamik programlama ve sinir ağlarını birleştirir [Burges, 1992].

Đkinci metot, görüntünün bütününden elde edilen uzaysal özelliklerin altkümelerinin sınıflandırılması ile görüntüyü dilimlere ayırır. Bu metot iki kategoriye ayrılır: Saklı Markov Modeli tabanlı yaklaşımlar ve Markov olmayan yaklaşımlar. Saklı Markov Modelinin amacı, el yazısını, direk gözlenemeyen olasılıklı bir yapı olarak modellemektir. Literatürde, tanıma uygulamalarında kullanılan bu yaklaşım hakkında zengin bilgiler mevcuttur [Gilloux, 1994]. Markov olmayan yaklaşımlar, kapalı nesnelerin tanınmasında kullanılan makine görüşünde kullanılan kavramlardan kaynaklanır. Bu tipteki tanıma tabanlı yaklaşımlar, geriye doğru eşleştirme ve düzenlilik kavramlarını kullanır.

c) Karışık stratejiler, parçalama ve arama metotlarını hibrit bir şekilde birleştirir. Görüntüye parçalama algoritması uygulanır. Fakat burada çok fazla dilim sayısı elde edilir. Yani kelimedeki karakter sayısından daha fazla sayıda dilim elde edilir. Sonra bu dilimlerin alt kümeleri bilgileriyle doğru dilimleme noktaları tespit edilir [Sinha, 1993].

d) Holistik stratejiler kelimeyi bir bütün olarak tanımaya çalışır. Böylece kelimenin dilimlenmesine ihtiyaç kalmaz. Kelimenin bütününden çıkartılan özellik bilgilerinin, veritabanında bulunan mevcut kelimelerin özellik bilgileriyle karşılaştırılması sonucu tanıma işlemi yapılır. Bu teknikler dinamik programlama veya saklı Markov zincirleri tabanlıdır. Holistic metotlar genellikle özel bir sözlük ile sınırlıdır [Arıca, 1998].

Dilimleme üzerine yapılan bazı çalışmalar

Fukushima, evvelce desenleri tanıma fonksiyonu kadar, onları dilimleme kabiliyetine sahip olan bir “seçici dikkat modeli” kurmuştur [Fukushima ve Imagawa, 1993]. Đki veya daha fazla desenlerin içerikliği bileşik bir uyarım tanıtıldığında, bu model onun dikkatini desenlerden birine seçerek odaklar, onu geriye kalandan ayırır ve tanır. Daha sonra, bu model dikkatini diğer desenleri tanımaya çevirir. Bu model ayrıca bütüne ait hafıza fonksiyonuna sahiptir ve bozuk desenleri de onarabilir. Bu fonksiyonlar, öğrenme desenlerinin öğrenme işlemi boyunca tanıtılmayan deforme olmuş versiyonları için bile icra yapmakta başarılı olabilirler.

Bununla beraber bu model, çok sayıda desen aynı anda tanıtıldığında , her zaman çok iyi çalışmaz. Bu model el yazısındaki bağlanmış karakterlerin tanınması için değiştirilebilir ve genişletilebilir. Bir inceleme denetleyicisi aynı anda işlenen desenlerin sayılarını kısıtlamak için orijinal modele eklenir. Bu yeni model, inceleme denetleyicisi tarafından taşınan küçük bir “arama alanında” bulunan desenleri işler. Arama alanının

durum kontrolü doğru olmaya ihtiyaç duymaz, orijinal model gibi kendi tarafından, tanıma ve ayırma özelliğine sahiptir, temin edilen tanıma desenlerinin sayısı azdır.

El yazısındaki tanımada, karakterlerin enlerinin ve boylarının bilgisi önem oluşturur. Örneğin, el yazısında “l” karakterinin tipi, “e” karakterinin tipinin deformasyonudur. Sadece boyları farklıdır. Seçici dikkat modeli, her iki karakterin de aynı karakter gibi tanımasına karşı gelen bir özelliğe sahiptir. Onların arasındaki farkı bulmak için, tanınmış ve ayrılmış karakterlerin boylarının ölçülmesi için bir model ortaya çıkarılmaktadır.

Vural ve Atıcı tarafından yapılan çalışmada Osmanlıca yazıların dilimlenmesi üzerinde durulmaktadır. Bu metotta, Osmanlıca’nın bilgisayar yardımı ile tanınması için gereken dilimleme ve özellik çıkarma teknikleri geliştirildi. Dilimleme algoritması ile harfler arasındaki sınırlar ve özellik çıkarımı algoritması ile de harflerin tanınması için gereken öznitelik vektörleri belirlenir [Vural vd., 1994].

Bu yöntem, önişlemden geçirilmiş bir bileşik yapı üzerinde, sağdan sola kontur izleme esasına dayanmaktadır. Kontur izleme sırasında birbirine komşu görüntü öğeleri saat ibresi yönünde taranarak birleşiklik saptanması yapılır. Harfler arasındaki ayrım noktaları kontur izleme sırasındaki yerel minimum ve karakteristik noktaların dikkate alınmasıyla belirlenmektedir.

Sarıcaoğlu, çalışmasında dilimleme işlemi iki türlü yapılmaktadır. Đlki, ağırlıklandırma yöntemini kullanarak, bir kelimedeki harflerin bağlantı noktalarını tespit etmek suretiyle hangi noktaların kopma noktası olacağının belirlenmesi ile kelimeyi harflerine ayırmak işlemidir. Ağırlıklandırmanın esas amacı, ön bir dilimleme sağlayarak bilgi vermek ve sinir ağını eğitmek için kullanılan test desenlerinin bir türü için analog desenler sunmaktır.

Ayrıca test programı diye adlandırılan dilimleme işlemini yapan program, hata geri yayılım eğitim yöntemi ile çalıştırılan çok katlı bir sinir ağı programı ile birlikte çalışır hale getirilir. Böylece test programında yazılan kelime, pencerelenerek, yani

içerisindeki harfler sırasıyla taranıp, tarama süresi boyunca her an sinir ağındaki öğrenilmiş harflerle karşılaştırılmak suretiyle harfin hangi harf olduğu bulunarak test işlemi yapılır. Harfin hangisi olduğu belli bir tanıma oranıyla verilir. Böylece en yüksek tanıma oranı hangi harfte verilmişse o harf seçilir ve ayrılır [Sarıcaoğlu, 1996].

Dilimleme yöntemlerinden birisi de, histogram bilgisi kullanmaktır [Kharma ve Ward, 1999]. Bu yönteme göre önce ikili resmin dikey doğrultuda histogramı çıkarılır. Daha sonra yatay doğrultuda bir eşik seviyesi belirlenir. Bu eşik seviyesi altında kalan vadilerin orta noktasında kesim yapılır. Bu nokta iki karakter arasındaki sınırdır. Şekil 3.28’de histogram yöntemi ile yapılan bir dilimleme örneği gösterilmektedir.

Şekil 3.28. Histogram yöntemi ile dilimleme örneği

3.4. Karakter Tanıma Metotları

Karakter tanıma, giriş örüntülerinin makine tarafından işlenerek anlamlı çıktılar üretilmesidir. Bazı karakter tanıma yöntemleri aşağıda açıklanmaktadır.

Belgede Birleşik ve eğik Türkçe el yazısı tanıma sistemi (sayfa 40-60)