• Sonuç bulunamadı

Gramer ve Diller Prof.Dr. Banu Diri

N/A
N/A
Protected

Academic year: 2021

Share "Gramer ve Diller Prof.Dr. Banu Diri"

Copied!
50
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Gramer ve Diller

Prof.Dr. Banu Diri

(2)

Slide 1

1. Her biçimsel dil belirli bir alfabe üzerinde tanımlanır.

2. Alfabe sonlu sayıda simgelerden oluşan bir kümedir.

3. Alfabedeki simgelerin arka arkaya getirilmesi ile dizgiler (string) oluşturulur.

4. Biçimsel dil, bir alfabedeki simgelerden oluşturulan dizgilerin bir kümesidir.

Bu kümeyi E ile gösterirsek, bu alfabe üzerinde tanımlanan her dil E’nin bir alt kümesidir. E deki her dizgi dilin tümcelerini (sentence) oluşturur.

5. Bir alfabe üzerinde tanımlanan biçimsel bir dil, bu alfabedeki simgelerden oluşan dizgileri geçerli ve geçersiz diye ikiye ayırır. Dilde yer alan ve tümceleri oluşturan dizgiler geçerli tersi ise geçersiz’dir.

(3)

Slide 2

6. Biçimsel dil açısından dizgi, tümce ve sözcük terimleri birbirlerinin yerine kullanılabilir. Tümce dilde yer alan dizgi veya sözcükleri anlatmak için kullanılır. Buna göre, bir alfabe ve bu alfabe üzerinde tanımlı bir dil düşünüldüğünde, alfabedeki simgelerden oluşturulan ve dilde yer alan geçerli dizgiler dilin tümcelerini oluşturmaktadır.

7. Dilin hangi tümcelerden oluştuğunu gösteren kurallar bütünü ise dilbilgisi (grammar) olarak adlandırılır.

(4)

Slide 3

Biçimsel dilbilgisi ve dillerin incelenmesinde, değişik harf grupları değişik alanlarda kullanılır.

Harf Grubu Örnekler Kullanım alanları

Latin alfabesinin başındaki büyük harfler

A,B,C,... Sözdizim değişkenleri

Latin alfabesinin başındaki küçük harfler ve rakamlar

a,b,c,...,0,1,2 Uç simgeler

Latin alfabesinin sonundaki büyük harfler

U,V,W,Y,... Sözdizim değişkeni ya da uç simgeler

Latin alfabesinin sonundaki küçük harfler

u,v,w,y,... Uç simge dizgileri (sözcükler)

Yunan alfabesinin başındaki küçük harfler

, , ,... Tümcesel yapılar

(5)

Slide 4

Chomsky Hiyerarşisi

Düzenli Diller (Regular)

Bağlamdan Bağımsız Diller (Context-Free)

Bağlama Bağımlı Diller (Context - Sensitive)

Özyinelemeli Sayılabilir Diller (Recursively Enumerable)

Karmıklık

0 1 2 3

(6)

Slide 5

Sırasıyla;

• Dilbilgisi ve Dilin Biçimsel Tanımı

• Dilbilgisi ve Dillerin Sınıflandırılması tür-0, tür-1, tür-2, tür-3

• Sağ-doğrusal ve Sol-doğrusal Dilbilgisi

• Türetme/Ayrıştırma Ağacı Chomsky Normal Biçimi

Yukarıdan-aşağıya Ayrıştırma (Top-down parsing) Aşağıdan-yukarıya Ayrıştırma (Bottom-up parsing)

(7)

Slide 6

tür-0, tür-1, tür-2, tür-3

Örnekler ile anlatılacaktır

(8)

Slide 7

Dilbilgisi ve Dilin Tanımı

(9)

Slide 8

(10)

Slide 9

Dilbilgisi ve Dillerin Sınıflandırılması

(11)

Slide 10

(12)

Slide 11

(13)

Slide 12

(14)

Slide 13

Programlama dilleri Bağlamdan-Bağımsız dilbilgisidir

(15)

Slide 14

(16)

Slide 15

(17)

Slide 16

(18)

Slide 17

Sağ Doğrusal – Sol Doğrusal Dilbilgisi

(19)

Slide 18

(20)

Slide 19

Türetme Ağacı

(21)

Slide 20

(22)

Slide 21

Türetme ve Ayrıştırma Ağacının Tanımı

(23)

Slide 22

(24)

Slide 23

(25)

Slide 24

(26)

Slide 25

(27)

Slide 26

Aşağıdan Yukarıya Doğru Ayrıştırma

(Bottom-Up Parsing)

(28)

Slide 27

(29)

Slide 28

Yukarıdan Aşağıya Ayrıştırma

(Top-Down Parsing)

(30)

Slide 29

(31)

Slide 30

Yukarıdan-Aşağıya Ayrıştırma (Top-Down Parsing,

Left-to-Right, Depth-First)

(32)

Slide 31

(33)

Slide 32

(34)

Slide 33

(35)

Slide 34

(36)

Slide 35

Noun meal

(37)

Slide 36

Aşağıdan-Yukarı Ayrıştırma (Bottom-Up Parsing)

fl fl fl

fl fl

fl fl

VP S

(38)

Slide 37

S -> Aux NP VP

S -> NP VP

NP -> Det Nominal

NP -> NP PP

A flight from Indianapolis to Houston on TWA

(39)

Slide 38

flight

S -> Aux NP VP S -> NP VP

NP -> Det Nominal NP -> NP PP

A flight from Indianapolis to Houston on TWA

(40)

Slide 39

flight

flight

S -> Aux NP VP S -> NP VP

NP -> Det Nominal NP -> NP PP

A flight from Indianapolis to Houston on TWA

(41)

Slide 40

fl

fl

fl

S -> Aux NP VP S -> NP VP

NP -> Det Nominal NP -> NP PP

A flight from Indianapolis to Houston on TWA

(42)

Slide 41

fl

fl

fl

fl

S -> Aux NP VP S -> NP VP

NP -> Det Nominal NP -> NP PP

A flight from Indianapolis to Houston on TWA

(43)

Slide 42

Örnek “Bir cümle isim veya fiil grubundan oluşur.”, “isim grubu

isim ve/veya sıfat, fiil grubu da isim grubu ve/veya fiil den oluşur”.

Bu gramerde “Küçük çocuk kırmızı top aldı” cümlesinin çözümü

CİG FG : (cümle isim ve fiil grubundan oluşur) İGS İ : (isim grubusıfat+isim)

FGİG F : (fiil grubuisim grubu + fiil) Sküçük|kırmızı

İçocuk|top Faldı

(44)

Slide 43

C

FG

İG F

İG

S İ

küçük çocuk kırmızı top aldı

(45)

Slide 44

Genişletilmiş Geçiş Ağları – GGA

Augmented Network Transition Grammer- ATN

• Biçimsel dillerin, doğal dilleri tam olarak ifade edemediği durumlarda Genişletilmiş Geçiş Ağları tercih edilir.

• GGA, cümlelerin sözdizimsel analizinde kullanılır.

• GGA sonlu makinelere benzeyen durum ve bu durumlar arası geçiş kurallarından oluşmaktadır.

Üç bileşenden oluşur:

• En az bir başlangıç ve son durumu olan sonlu sayıdaki durumlar

kümesi

• Belli bir metindeki mümkün olan harflerden oluşan küme

• Sonlu sayıdaki bir durumdan diğer bir duruma geçişi sağlayan

geçişler kümesi

(46)

Slide 45

 Geçiş ağlarında bir durumdan diğer bir duruma geçmek için gerekli harf okunur ve bu harf geçilecek olan duruma geçmek için gereken harfle karşılaştırılır. Uygun olması durumunda geçilir.

 Geçiş ağlarında doğru bir yol, bir başlangıç durumundan başlayıp, son duruma ulaşan geçişler sağlandığında tamamlanır.

 Geçişlerdeki harflerin birbirine eklenmesiyle oluşan metin, ağın kabul etmesi için verilen metinle aynı ise, bu metin ağ tarafından kabul edilmiş demektir.

(47)

Slide 46

Genişletilmiş Geçiş Ağı örneği

q

1 abb

q

2

q

3

q

4/s

aa

b

 a

Bu ağda tanınabilecek birkaç metin örneği:

abba, abbaaabba, abbaab, b

Fakat abbab, baab yi tanıyamaz.

(48)

Slide 47

 Dilin grameri, durumlara karşı düşen yönlü graflar şeklinde ifade edilir.

 Bağlarda ise, çoğalmakta olan durumlar arasındaki geçişleri tanımlayan etiket sınıfları bulunmaktadır.

 Bu etiketler özel kelimeler, kelime kategorileri veya cümlenin önemli parçalarını tanıyan diğer ağlara yönlendirme gibi değerler almaktadır.

 GGA, dil tanımında belirtilen cümle birimlerini, hiyerarşik yapı içerisinde yukarıdan aşağıya doğru çözümlemeye çalışır.

(49)

Slide 48

Basit bir Türkçe sözdizimi kural kümesinin

GGA yapısı

“Ali camı kırdı” cümlesi morfolojik analiz sonucunda “Ali cam + ı kır + dı”

özne isim

Q

5/s

nesne isim

Q

6 nesne_eki

Q

7/s

yüklem fiil

Q

8 zaman_eki

Q

9/s

cümle

Q

1

Q

2

Q

3/s

Q

4/s

özne nesne yüklem

(50)

Slide 49

 Bir sözdizimi kural kümesinin GGA biçiminde ifade edilmesin yararı, cümle birimlerinin bir kez tanımlandıktan sonra sonsuz kez kullanılıyor olmasıdır.

 Bir sıfat tamlaması bir kez tanımlanıp birçok yerde kullanılabilir.

GGA’da döngüler bulunabilir. Bu özellik ile dilin kabul ettiği cümle yapıları sayısı sonsuza kadar artırabilir.

“yırtık kırmızı büyük top”

S

isim Q

sıfat

Referanslar

Benzer Belgeler

 Twitter: 2 milyar tweet’ten elde edilen 27 milyar token, tekil kelime sayısı 1,2 milyon, öğrenilen kelime vektörleri 25, 50, 100 ve 200 boyutlu.. Enriching word vectors with

Zipf’in bulgularına göre kelimeler kullanım sıklığına göre sıralandıklarında ilk sıradaki kelime, yani en sık kullanılan kelime, ikinci sıradaki kelimenin iki katı

Oğulumuz yazılan kelime de oğul kök olarak bulunur ancak hece düşmesine uğramadığı için yanlış yazılmış kabul edilir... Türkçe’de kökte oluşan bir başka

Türkçe’nin sözcük yapısı, köklere yapım (derivation) ve çekim (inflection) eklerinin sonek (suffix) olarak eklenmesi ile gerçekleştirilir.. Inflection (çekim eki): drive

İşte literatüre daha sonra Enver Paşa yazısı olarak geçen imlâ sistemi, doğrudan doğruya Münif Paşa ile başlayan ve Islah-ı Huruf Cemiyeti’nin öneri ve çalışmalarıyla

160.000.000 Türk tarafından kullanılan Türkçenin alfabe birliğine gidilirken Türkiye Türkçesi alfabesine ilâve olarak tavsiye edilen beş işaretin Türkçenin

Bu çevirinin bi- rinci kısmı, derginin bir önceki sayısında yayımlanmış; ancak bazı yazı tiplerinin bozuk çıkmasından dolayı yeniden yayımlanma gereği duyulmuştur.. **

Temel ünlülerin arka serisinde ([ɑ ɔ o u]) dudak yuvarlaklaşmas, hiç yuvarlaşma olmayan [ɑ]’dan, kapal yuvarlaşma olan [u]’ya doğru derece derece