• Sonuç bulunamadı

TOBB Ekonomi ve Teknoloji Üniversitesi

N/A
N/A
Protected

Academic year: 2021

Share "TOBB Ekonomi ve Teknoloji Üniversitesi"

Copied!
3
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

TOBB Ekonomi ve Teknoloji Üniversitesi

˙IKT457 – Ekonomi ve Finans için Yapay Zeka I, Dördüncü Ödevi

Ö˘gr. Gör.: Prof. Dr. A. Talha YALTA

Açıklama ve uyarılar: Ödev el yazısı ile hazırlanacak ve yanıtlar pdf dosyasına dönü¸stü- rüldükten sonra en geç 7 Aralık tarihinde uzak.etu.edu.tr sistemi üzerinden teslim edilecektir.

E-posta vb farklı yollarla gönderilen ya da geç teslim edilen ödevler dikkate alınmayacaktır.

Sorular

1. K-kat çapraz-geçerleme yöntemine yönelik olarak a¸sa˘gıdaki soruları yanıtlayınız:

(a) K-kat çapraz-geçerleme nasıl uygulanır? ˙Izlenecek adımlar ¸seklinde açıklayınız.

Yanıt: K-kat çapraz-geçerleme yöntemi a¸sa˘gıdaki adımları içerir:

1. Eldeki veri seti birbiriyle örtü¸smeyecek ¸sekilde ve yakla¸sık aynı büyüklükte olan k parçaya bölünür.

2. Parçalardan biri test veri seti olarak tututulur. Kalan k − 1 parça ise birlikte e˘gitim seti olarak kullanılarak tahmin yapılır.

3. Test için ayrılan parça kullanılarak tahmine ait hata oranı hesaplanır.

4. Her bir parça sırayla test seti olacak ¸sekilde yukarıdaki i¸slem yinelenir.

5. Elde edilen k adet test hata oranının ortalaması hesaplanır.

(b) K-kat çapraz-geçerleme yönteminin bir-eksiltmeli çapraz-geçerleme yakla¸sımına göre üstünlükleri ve sakıncaları nelerdir?

Yanıt: Bir-eksiltmeli ÇG yönteminde yanlılık olabilecek en dü¸sük derecededir, ancak varyans yüksektir. K-kat ÇG’de ise yanlılık daha yüksek olmakla birlikte varyans dü¸süktür. K-kat ÇG bu ¸sekilde test seti ile geçerleme seti büyüklükleri arasında bir denge kurarak uygulamada daha iyi sonuçlar üretir. Ayrıca k-kat ÇG’de hesaplama yo˘gunlu˘gu da bir-eksiltmeli ÇG’ye göre (do˘grusal regresyon hariç) daha dü¸süktür.

(c) K-kat çapraz-geçerleme yönteminin geçerleme seti yakla¸sımına göre üstünlükleri ve sakıncaları nelerdir?

Yanıt: Geçerleme seti yönteminde sonuçlar veri setinin nasıl ikiye bölündü˘güne ba˘glıdır. Dolayısıyla sonuçlar yüksek varyans gösterir. Ayrıca geçerleme setinde verilerin önemli bir bölümü kullanılmadı˘gı için hesaplanan hata oranı gerçek de-

˘gerden yüksek olabilir. Bu iki nedenle k-kat ÇG yöntemi, geçerleme seti yakla¸sı- mından daha üstündür.

Sayfa 1 \ 3 Sonraki sayfaya geçiniz. . .

(2)

TOBB - Ekonomi ve Teknoloji Üniversitesi

˙IKT457 – Ekonomi ve Finans için Yapay Zeka I, Dördüncü Ödevi

2. Özyetinim yöntemine yönelik olarak a¸sa˘gıdaki soruları yanıtlayınız:

(a) Yatay kesit verilerinde özyetinim nasıl uygulanır? Adımlar ¸seklinde açıklayınız.

Yanıt: Yatay kesit verilerinde özyetinim yöntemi a¸sa˘gıdaki adımları içerir:

1. Eldeki n büyüklü˘gündeki veri setinden n adet gözlem çekilir. Ancak her seferinde çekilen de˘ger yerine geri koyulur.

2. Yukarıdaki i¸slem çok sayıda yinelenerek topluluk adı verilen Ω adet özyeti- nim ço˘galtması üretilir.

3. Üretilen ço˘galtmalar kullanılarak çok sayıda tahmin hesaplanır.

4. Bu tahminler birle¸stirilerek ilgi duyulan de˘gere ili¸skin yüksek kesinlikli gü- ven aralıkları ve kestirimler elde edilir.

(b) Bir özyetinim ço˘galtmasında n = 4 büyüklü˘gündeki asıl veri setine ait 4. gözlemin özyetinimdeki ilk gözlem olma olasılı˘gı nedir? Açıklayınız.

Yanıt: Özyetinim ço˘galtmaları hesaplanırken gözlemler ba¸staki asıl veri setinden rastsal olarak seçilir. Dolayısıyla belli bir gözlemin özyetinim setindeki ilk gözlem olma olasılı˘gı 1/n = 1/4’tür.

(c) Bir özyetinim ço˘galtmasında ilk gözlem asıl veri setindeki 4. gözlem olarak belirlen- mi¸sse, n = 4 büyüklü˘gündeki asıl veri setine ait 4. gözlemin özyetinimdeki ikinci gözlem olma olasılı˘gı nedir? Açıklayınız.

Yanıt: Özyetinim ço˘galtmaları hesaplanırken her seferinde çekilen de˘ger yerine geri koyulur. Dolayısıyla belli bir gözlem daha önce seçilmi¸sse bile tekrar seçilme olasılı˘gı 1/n = 1/4 olur.

(d) Büyüklü˘gü n = 4 olan veri setindeki 4. gözlemin özyetinim ço˘galtmasında hiç yer almama olasılı˘gı nedir? Açıklayınız.

Yanıt: Belli bir gözlemin özyetinim ço˘galtmasındaki 4. gözlem olmama olasılı˘gı 1 − 1/4’tür. Asıl veri setinden toplam n = 4 kez gözlem seçilece˘gi için çarpım kuralını uygulayarak belli bir gözlemin hiç seçilmeme olasılı˘gını (1 − 1/n)

n

= (1 − 1/4)

4

= 81/256 olarak buluruz.

(e) Büyüklü˘gü n = 4 olan veri setindeki 4. gözlemin özyetinim ço˘galtmasında en az 1 kez yer alma olasılı˘gı nedir? Açıklayınız.

Yanıt: Belli bir gözlemin özyetinim ço˘galtmasında en az 1 kez yer alma olasılı˘gı, hiç yer almama olasılı˘gının tersidir. Bir önceki soruyu temel alırsak n = 4 için bu olasılı˘gı 1 − 81/256 = 175/256 ¸seklinde hesaplayabiliriz.

Sayfa 2 \ 3 Sonraki sayfaya geçiniz. . .

(3)

TOBB - Ekonomi ve Teknoloji Üniversitesi

˙IKT457 – Ekonomi ve Finans için Yapay Zeka I, Dördüncü Ödevi

3. Bu soruyu yanıtlamak için de˘gi¸sken adları a¸sa˘gıda verilen ve büyüklü˘gü n = 400 olan

“Veriseti” adlı R veri çerçevesini temel alınız:

> names(veriseti) [1] "Y" "X"

>

(a) Veri setinden 200 gözlemlik bir rastsal alt örneklem belirleyen “egitim” adlı bir nesne olu¸sturacak R komut(lar)ını yazınız.

Yanıt:

egitim <- sample(400,200)

(b) Önceki soruda belirlenen e˘gitim setine Y = β

1

+ β

2

X ¸seklindeki modeli uygulayacak ve daha sonra geriye kalan test setini kullanarak hata kareleri ortalamasını hesaplaya- cak R komut(lar)ını yazınız.

Yanıt:

lm.fit <- lm(Y~X, subset=egitim)

mean((Y - predict(lm.fit, Veriseti))[-egitim]^2) (Dikkat: “lm.fit” nesnesine farklı ad verilebilir.)

(c) Önceki sorudaki modele ait test hata oranını bir-eksiltmeli çapraz-geçerleme yönte- miyle hesaplayacak R komut(lar)ını yazınız.

Yanıt:

glm.fit <- glm(Y~X, data=Veriseti) cv.err <- cv.glm(Veriseti, glm.fit) cv.err$delta

(Dikkat: “glm.fit” ve “cv.err” nesnelerine farklı ad verilebilir.)

(d) Önceki sorudaki modele ait test hata oranını 10-kat çapraz-geçerleme yöntemiyle he- saplayacak R komut(lar)ını yazınız.

Yanıt:

glm.fit <- glm(Y~X, data=Veriseti)

cv.err <- cv.glm(Veriseti, glm.fit, K=10) cv.err$delta

(Dikkat: “glm.fit” ve “cv.err” nesnelerine farklı ad verilebilir.)

Sayfa 3 \ 3 Ödev sonu.

Referanslar

Benzer Belgeler

Eğitim dili %30 İngilizce olan programlara (Türk Dili ve Edebiyatı, İç Mimarlık ve Çevre Tasarımı ile Görsel İletişim Tasarım hariç tüm bölümler) kayıtlı

Bu çalışmada, sanallaştırma ortamı olarak en çok tercih edilen VMware, işletim sistemi olarak en çok tercih edilen Windows 10 üzerinde zararlı yazılımlar tarafından

[11, 7, 12, 13], çalışmaları trafik akış tahmini için derin yapay sinir ağlarını en basit şekilde çok katmanlı algılayıcılar olarak kullanırken, diğer

PTF-On, yine burada geli¸stirilecek bir Kalman-filtre bazlı enerji öngörü algoritması ile bir güne ait enerji harman profilini tahmin ede- bilmekte ve bu profil üzerinde

Bu çalışmada iki bouytlu ısı denkleminin değişken sınır kazançları ile UOA yöntemine dayanarak indirgenmiş Galerkin modeli elde edilmiş, bu model kullanılarak bir

Bu çalışmada, Bölüm 3’te tanımlanan iki amaç fonksiyonlu iş gücü çizelgeleme ve rotalama problemi için çok amaçlı indirgenmiş değişken komşuluk arama metodu

[9] ile verilen çalışmada ise İHA kullanılacak şekilde kullanım genişletilmiş ve parçacık filtresi metodu yerdeki kullanıcının yerinin kestirimi için

a) Öğrencilere tercih yapmaları için çağrı yapan bir e-posta, uygulama döneminin başlamasından iki ay önce iletilir. Öğrenciler, kendilerine bildirilen en az