• Sonuç bulunamadı

Birleşik yazılan kelimelerin tanınması

4. GELĐŞTĐRĐLEN UYGULAMA

4.9. Kelimelerin tanınması

4.9.2. Birleşik yazılan kelimelerin tanınması

Bu çalışmada tasarlanan sistemde, birleşik kelimelerin tanınması, dilimleme işlemi ve sözlük kullanımının beraber çalıştırılmasıyla gerçekleştirilir. Sınırlı sayıda kelime içeren sözlük kullanımıyla anlamsız harf gruplarının üretilmesi önlenmiş oldu.

Kelime tanıma işleminde önce kelimenin eğimi düzeltilir. Eğim düzeltildikten sonra kelime görüntüsünün dikey doğrultudaki histogram grafiği çıkartılır. Bu histogram grafiği üzerinde eşik seviyesi belirlenir ve bu eşik seviyesinin altında kalan vadilerin orta noktalarından dikey doğrultuda kesimler yapılarak dilimleme işlemi gerçekleştirilir. Fakat yapılan deneyler sonucunda sadece bir eşik değeri belirlenerek yapılan dilimleme işlemlerinin güvenilir olmadığı anlaşıldı. Çünkü kelimenin şekli kişiden kişiye değiştiği için bir yazardan alınan kelimeyi doğru dilimleyen eşik değerinin, başka bir yazardan alınan kelimeyi doğru dilimleyemediği anlaşıldı. Bu problemi çözmek için, yapılan deneylerle on farklı eşik değeri belirlendi. Böylece on farklı dilimleme işlemi yapılmış oldu. Her bir dilimleme işlemi sonucunda ayrıştırılan karakterler tanıma algoritmalarına gönderilerek kelimeler üretildi. Her aşamada en yüksek benzeme değerine sahip ilk on kelime seçildi. On farklı eşik değerlerinde yapılan dilimleme işlemi sonunda ilk ona giren aday kelimeleri içeren on adet tablo elde edildi. Bu tablolar birleştirilerek en çok benzeme değerine sahip kelime saptandı. Böylece kelime tanıma işlemi tamamlanmış oldu.

Kelime tanıma aşamasında iki tip histogram grafiği kullanıldı. Birincisi, kelime görüntüsünde her bir piksel sütunundaki ilk siyah piksel ile son siyah piksel arasındaki piksel mesafesi baz alınarak üretildi. Đkincisi ise kelime görüntüsündeki her bir piksel sütununda, ilk siyah piksel ile bu sütunun başlangıcı arasındaki piksel mesafesi baz alınarak üretildi. Şekil 4.20’de farklı tiplerdeki histogram grafikleri görülmektedir.

Histogram 1 için ;

Sütun yüksekliği = Görüntüdeki piksel sütunundaki ilk ve son siyah piksel arasındaki piksel mesafesi

Histogram 2 için ;

Sütun yüksekliği = Görüntü yüksekliği – Boşluk yüksekliği

a) b) c) Şekil 4.20. Histogram tipleri. a) Histogram 1 b) Histogram 2 c) Kelimenin çerçevelenmesi. Boşluk yüksekliği ve görüntü yüksekliğini.

Histogram 1 ve Histogram 2 grafiklerinin beraber kullanılması

Sadece bir histogram tipinin kullanıldığı durumlarda, eşik seviyesi altında kalan vadilerin orta noktalarından dikey doğrultuda kesim yapılarak karakterler birbirinden ayrıştırılarak kelime sonucu üretiliyordu. Đki histogram tipinin kullanıldığı durumlarda ise kelime görüntüsünün histogram 2 grafiği üretilir ve belirlenen eşik seviyesinde dilimleme yapılır. Muhtemel karakter genişliğini doğrulamak için (4.5) formülüne göre başka bir eşik değeri belirlenir. Kelimeden ayrıştırılan dilimler ile bu eşik değeri karşılaştırılır. Dilimin genişliği bu eşik değerinden küçük ise bu dilimin bir karakter olduğuna karar verilir. Eğer dilimin genişliği, eşik değerinden büyük ise bu dilimin bir karakter grubu olduğuna karar verilir ve histogram 1 grafiği kullanılarak tekrar dilimleme işlemine tabi tutulur. Dilimler karakter tanıma algoritmasına gönderilerek kelime üretilir ve tanıma işlemi tamamlanır.

Şekil 4.21’de görüldüğü gibi “edirnede” kelimesinin histogram 2 grafiği üretildi ve dilimleme işlemi yapıldı ve üç dilim üretildi. Fakat her bir dilim, sadece bir karakteri ifade etmiyor. Eğer her bir dilimin bir karaktere karşılık geldiği kabul edilseydi yanlış sonuç üretilecekti. Bu problemi çözmek için her bir dilimin genişliği (4.5) formülü ile üretilen eşik değeri ile karşılaştırıldı. Bu eşikten büyük genişliğe sahip dilimlerin bir harf grubunu temsil ettiği kabul edildi. 1. ve 3. dilimler harf grubu olarak kabul edildi ve bu dilimler histogram 1 grafiği üretilerek tekrar dilimleme işlemine tabi tutuldu ve doğru sonuç üretildi.

Bu çalışmada tasarlanan yazı tanıma sisteminin, birleşik yazılan kelimeleri dilimleme işleminde kullandığı farklı eşik değerleri şöyledir:

1) Eşik Değeri = 5 (Histogram 2)

2) Eşik Değeri = 10 (Histogram 1 + Histogram 2) 3) Eşik Değeri = 10 (Histogram 1)

4) Eşik Değeri = Üst Taban Çizgisi (Histogram 2) 5) Eşik Değeri = Üst Taban Çizgisi – 10 (Histogram 2) 6) Eşik Değeri = Üst Taban Çizgisi – 20 (Histogram 2)

7) Eşik Değeri = Üst Taban Çizgisi (Histogram 1 + Histogram 2) 8) Eşik Değeri = Üst Taban Çizgisi –10 (Histogram 1 + Histogram 2) 9) Eşik Değeri = Üst Taban Çizgisi – 20 (Histogram 1 + Histogram 2) 10) Eşik Değeri = Görüntü Yüksekliği – 20 (Histogram 1)

Şekil 4.23. Orijinal görüntü, ilk ona giren kelimeler ve sistemin ürettiği sonuç

Şekil 4.22’de görüldüğü gibi “üzerinde” görüntüsü üzerinde on farklı dilimleme işlemi yapıldı ve her bir aşamada ilk ona giren kelimeler ve benzeme değerleri saptandı. Đşlemler sonunda on adet tablo elde edildi. Şekil 4.23’te görüldüğü gibi bu tabloların birleştirilmesiyle en çok benzeme değerine sahip kelime seçilerek kelime tanıma işlemi tamamlanmış oldu. Şekil 4.24, Şekil 4.25, Şekil 4.26 ve Şekil 4.27’de orjinal metin görüntüleri ve sistemin ürettiği sonuçlar gösterilmektedir.

Şekil 4.25. Sistemin ürettiği sonuç. xxxx tanınamayan kelimelerdir.

Şekil 4.26. Serbest stilde yazılmış metin görüntüsü

Şekil 4.27. Sistemin ürettiği sonuç. xxxx tanınamayan kelimelerdir. karaları oluşturan xxxx ve toprakların fiziksel özellikleri rengi parlaklığı gözenekliği özellikleri yeryüzünde ısınma farklılıklarına neden olur ayrıca xxxx bitki örtüsüyle bulunup bulunmaması sıcaklık dağılışı üzerinde xxxx bu nedenle taş ve topraktan ısınıp xxxx xxxx farklılık gösterir xxxx açık renkli ve gevşek yapıya sahip xxxx ısınma ve soğuma çabuk gerçekleşir

yapay sinir xxxx xxxx xxxx xxxx xxxx

verilerden kuralları bilinmeyen ilişkilerin onlarla çıkarılması ve algoritması xxxx kuralları tam olarak bilinmeyen

xxxx için geliştirilmiş bir bilgi işleme sistemidir karakter tanıma xxxx sık kullanılan bir yöntemdir yapılması xxxx xxxx setinin xxxx sunulması ve bu set ile ağın eğitilmesidir bu işlemi xxxx xxxx örnekleri xxxx ve bundan --karar xxxx örnekleri tanıyabilecek hale gelmiş olur

Benzer Belgeler