• Sonuç bulunamadı

Veri Madenciliği İle Bilgisayar Mühendisliği Öğrencilerinin Bölüme Olan Yatkınlığının Değerlendirilmesi

N/A
N/A
Protected

Academic year: 2022

Share "Veri Madenciliği İle Bilgisayar Mühendisliği Öğrencilerinin Bölüme Olan Yatkınlığının Değerlendirilmesi"

Copied!
7
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

Veri Madenciliği İle Bilgisayar Mühendisliği Öğrencilerinin Bölüme Olan Yatkınlığının Değerlendirilmesi

İbrahim Berkan AYDİLEK, Dilek AYNELİ, Murat UÇAN

Harran Üniversitesi, Bilgisayar Mühendisliği, Şanlıurfa

berkanaydilek@harran.edu.tr, dilekayneli@gmail.com, muratucann@gmail.com

Özet: Bu çalışmanın amacı eğitimsel veri madenciliği kullanılarak bilgisayar mühendisliğinde öğrenim gören öğrencilerin bilgisayar mühendisliğine olan yatkınlıklarının ve sahip olduğu kişisel özelliklerinin yeterliliğini analiz edebilmek ve değerlendirmektir. Araştırma verisi Harran üniversi- tesi bilgisayar mühendisliği bölümünde öğrenim gören 105 öğrenciden elde edilmiştir. Bu veriler öğrencilerden akademik benlik kavramı ölçeğinden yola çıkılarak oluşturulmuş anket uygulaması ile toplanmıştır. Hazırlanmış anket soruları bölüm akademisyenlerinin değerlendirmesine sunulmuş ve puanlandırılmıştır. Ankette 5 ayrı kategoride toplam 20 soru öğrencilere sorulmuş ve cevaplamaları istenmiştir. Anket sonuçları ile oluşturulmuş veri kümesine 5 farklı sınıflandırma yöntemi uygulanmış, sınıflandırma başarısı sonuçlarına göre çalışma için en uygun yöntem belirlenmiştir. Araştırmada elde edilen eğitimsel veri madenciliği sonuçları bilgisayar mühendisliği bölümünde okuyan öğren- cilerin bölüme olan yatkınlığı hakkında değerlendirme imkânı vermiş ve bölüm akademisyenlerinin öğrencilerini daha iyi tanımalarına katkı sağlamıştır. Ayrıca bölümü öğrenim görmek için tercih etmek isteyen gelecekteki öğrenci adaylarına da bölüm ve bilgisayar mühendisliği ile ilgili fikirler sunmuştur.

Anahtar Sözcükler: eğitimsel veri madenciliği, bilgisayar mühendisliği öğrencileri, bölüme yatkınlık

1. Giriş

Veri madenciliği, çok fazla veri içinden veri işleme ile istenilen değerli bilginin elde edilmesidir. Veri tabanlarında veya veri ambarlarında bulunan veriler arasındaki ilişkileri örüntüleri, sapma ve eğilimler gibi bilgilerin ortaya çıkarılması veya bilgilerin keşfi veri madenciliğini oluşturur. “Veri Tabanlarından Bilgi Keşfi” (Knowledge Discov- ery in Databases) uygulamaları ile birlikte faali- yet alanına yönelik karar destek mekanizmaları için gerekli ön bilgileri temin etmek için kullanılır.

Kısaca veri madenciliğinin amacı, toplanmış veya var olan verilerin istatistiksel yöntemlerle incelenip ilgili kurum ve yönetim destek dizge- lerinde kullanılmak üzere değerlendirilmesidir [30]. Veri madenciliğinde büyük veri yığınları içerisinden gelecekle ilgili tahminler yapılmasını sağlayabilecek bağıntılar, bilgisayar programları kullanılarak aranır. Bilginin keşfi yapılırken bilgi tabanından elde edilen verilerin veri temizleme, veri bütünleştirme, veri seçme, veri dönüşümü, örüntü değerlendirme ve son olarak maden- cilik yapılarak elde edilmiş bilginin kullanıcıya sunumunu gerçekleştiren veri keşfi süreç adım- larından oluşmaktadır. Veri madenciliği uygu- lamalarını gerçekleştirmek için yöntem ve algo- ritmaları içeren yazılımlara kullanılır. Buna bağlı olarak, lisanslı SPSS Clementine, Excel, SPSS, SAS, Angoss, KXEN, SQL Server, MATLAB ve açık kaynak kodlu RapidMiner (YALE), WEKA, R, C4.5, Orange, KNIME olmak üzere birçok uygu- lama geliştirilmiştir [6].

Bu araştırmada veri madenciliği teknikleri kul- lanılarak bilgisayar mühendisliğinde okuyan öğrencilerin bölüme olan yatkınlıkları değer- lendirilmiştir. Veri kümesi Harran üniversitesi bilgisayar mühendisliği bölümünde öğrenim gören öğrencilerden oluşturmaktadır. Anket sonuçlarından elde edilen veri kümesi veri keş- fi süreç adımlarından geçirilerek uygulama- da kullanılabilir hale getirilmiştir. Uygulamayı gerçekleştirmek için Weka yazılımı kullanılmış ve sonuçlar değerlendirilmiştir. Çalışmada ki amaç bilgisayar mühendisliğinde okuyan veya ilerde öğrenim görmek isteyen öğrencilerin mesleğin gerektirdiği genel özellikleri göze alınarak bölüme olan yatkınlığının değerlendirilmesidir.

Bilgisayar mühendisliği mesleğinin tanımı ve gerektirdiği özellikler araştırılmış, bu anlamda öğrencilere mesleğin gerektirdiği özellikleri orta- ya koyabilecek anket çalışması uygulanarak elde edilen veriler bölüm akademisyenlerimiz tarafın- dan değerlendirilerek oluşturulmuş veri kümesi üzerinde araştırma yapılmış ve sonuçlar elde edilmiştir.

2. Literatür Taraması

Kayrı M. ve Boysan M. tarafından yapılan biliş- sel yatkınlık ile depresyon düzeyleri ilişkisinin sınıflandırma ve regresyon ağacı analizi ile ince- lenmesi çalışmasında üniversite öğrencilerinden oluşan bir grupta depresyon tanılarındaki artışa kişilerin sınırlılık algısı düzeylerinin ve öz yeterlilik

(2)

değerlendirmelerinin etkisi araştırılmıştır.

Veri kümesi Yüzüncü Yıl üniversitesinden 437 öğrenciye (313 erkek, 124 bayan) yapılan Sınırlılık şemaları envanteri, Genel öz yeterlilik ölçeği ve Beck depresyon envanterine alınan cevaplardan meydana gelmektedir. Veri kümesi SRA tekniği ile analiz edilmiş, bağımlı ve bağımsız değişken- ler arası ilişkiler bir ağaç yapısı şeklinde ifade edilmiştir. SRA yöntemi, bu çalışmada sınırlılık algısının depresyon için bir bilişsel yatkınlık fak- törü olduğunu tespit etmiştir [16]. Kurt Ç. ve Erdem Ayhan O. tarafından yapılan çalışmada başarılı ve başarısız öğrencilerin profilleri belir- lenerek uygun önlem ve çözümler önerilmiştir.

Öğrenci başarısını etkileyebileceği düşünülen öğrencilerin kişisel, sosyal, ekonomik ve barın- ma ile ilgili demografik özelliklerini içeren toplam 38 soruluk bir anket hazırlanmıştır. Sorular seçi- cilik, güçlülük ve güvenlik yönünden değerlendi- rilmesi için eğitim, bilgisayar ve veri madenciliği branşlarında uzman kişilere sunulmuş geçersiz ve gereksiz olduğu saptanan sorular çıkartılarak eksik görülen sorular eklenmiştir. Anket Gazi üniversitesi teknik eğitim fakültesinde toplam 545 katılımcıya uygulanmıştır [18].

Çöllüoğlu Gülen Ö. ve Özdemir S. tarafından yapılan çalışmanın amacı eğitimsel veri maden- ciliği yöntemleri ile üstün yetenekli öğrencilerin ilgili oldukları alanları tahmin etmek ve bu öğren- cilerin bir arada ilgi gösterdikleri alanları belir- lemektir. Araştırmanın çalışma grubunu Anka- ra’da yer alan Yasemin Karakaya bilim ve sanat merkezinde eğitim gören yaşları 12 ve üstü, üstün yetenekli öğrenciler oluşturmaktadır. Bu öğren- cilerden veriler Akademik benlik kavramı ölçeği ile araştırmacılar tarafından geliştirilmiş olan boş zamanları değerlendirme anketi ve ebeveyn veri toplama formu ile elde edilmiştir. Ayrıca öğren- cilerin WISC-R ve temel kabiliyetler testi 7-11 sonuçları da yine kullanılmıştır. Üstün yetenekli öğrencilerin ilgili oldukları alanları tahmin için 10 sınıflandırma algoritması belirlenmiş ve bu al- goritmaların doğruluk sonuçları karşılaştırılarak problem tanımı için en iyi algoritma bulunmuştur.

Söz konusu çalışmanın sonuçları, öğrencilerin destek eğitimi ve bireysel yetenekleri fark ettirme programlarının son aşamalarında hangi alanlara yönlendirilmeleri gerektiğini belirlemek için siste- matik ve bilimsel bir yöntem sunmaktadır [5].

Şen B. ve Emine Uçar E. veri madenciliği yön- temleri ile Karabük üniversitesi bilgisayar mühendisliği bölümü öğrencilerinin başarılarını çeşitli kriterler kullanarak karşılaştırmışlardır.

Çalışma uzaktan eğitimde, örgün eğitime göre başarı oranının düştüğünü göstermektedir [27].

Brijesh Kumar B. ve Saurabh P. bilgisayar uygu-

lamaları dersindeki akademik başarıyı tahmin etmiş ve ayrıca başarı üzerinde etkili faktörleri saptamışlardır [1]. Chih-Fong T ve ark., bilgisa- yar yeterlilik sınavından kalacak öğrencileri tah- min etmişlerdir. Çalışmada hem kümeleme hem sınıflandırma teknikleri kullanılmıştır [28]. Kwang Hyuk I. ve ark., tasarladıkları bir anketi uygula- yarak sınıflandırma ve kümeleme yöntemleri ile üstün yetenekli öğrencilerin yetenek türlerini or- taya çıkarmış ve benzer karakteristikteki öğren- cileri gruplamışlardır [12].

3. Veri Madenciliği

Veri madenciliği, büyük boyutlu verilerin içindeki ilişkileri inceleyerek aralarındaki bağıntıyı bulma- ya çalışan ve veri tabanı sistemleri içerisinde gizli kalmış bilgilerin çekilmesini sağlayan veri değer- lendirme tekniğidir [15]. Ham verinin tek başına veremediği bilgiyi çıkaran, veri analizi aşaması olarak tanımlanmıştır [14]. Büyük veri yığınları arasından gelecekle alakalı tahminde bulun- abilmemizi sağlayabilecek bağıntıların, bilgisa- yar programı kullanarak aranma ve bulunmasına olanak tanır [8]. İstatistik, veritabanı teknolojisi, örüntü tanıma, makine öğrenme ile iç içe yeni bir çalışma alanı oluşturarak geniş veritabanlarında önceden tahmin edilemeyen ilişkilerin ikincil an- alizi olarak ifade edilmiştir [11]. Bir başka kaynak ise veri madenciliğini oldukça tahminci anahtar değişkenlerin binlerce potansiyel değişkenden izole edilmesini sağlama yeteneği olarak tanım- lamıştır [17].

3.1. Sınıflandırma Yöntemleri 3.1.1. Karar Ağaçları

Karar ağaçları sınıflandırma problemlerinde en çok kullanılan algoritma ve yöntemlerden biri- sidir. Bu teknikte sınıflandırma için bir ağaç şek- linde yapı oluşturulur ve daha sonra sınıfı bilin- meyen bir kayıt ağaca uygulanır. Ortaya çıkan dallanma sonucuna göre bu kayıt sınıflandırılır.

Temel olarak iki adımdan oluştuğu söylenebilir;

Birinci adım ağacın oluşturulması, ikinci adım ise yeni bilinmeyen verilerin ağaç yapısına göre sınıfının tespit edilmesidir [26].

Karar ağacı, karar durumlarının düğümler halinde bilgi kazancı değerlerinden yola çıkılarak ifade edildiği bir yapıdır. Düğümlere ilişkin hes- aplanan etropi ve bilgi kazancı değerleri ağaç yapısını oluşturur. Karar ağacı dallarındaki en iyi seçeneğin düğüm bazında belirlenebilme- si için olasılık değerleri kullanılarak hesaplanan

“Beklenen Değerler” arasında karşılaştırma yapılmalıdır [9].

(3)

3.1.2. Naive Bayes Sınıflandırıcı

Naive Bayes sınıflandırıcı bir önerme ile kul- lanılabilen olasılık temelli bir algoritmadır. Bu önerme örüntü tanıma da kullanılacak her bir tanımlayıcı nitelik ya da özelliğin istatistik açıdan bağımsız olması gerekliliğini doğurur. Her ne ka- dar bu önerme Naive Bayes sınıflandırıcısının kullanım alanını azaltsa da, genelde istatistik bağımsızlık koşulu daha esnek kullanıldığında daha karmaşık yapay sinir ağları gibi yöntemler- le karşılaştırabilir sonuçlar göstermektedir [22].

Bayes sınıflandırma tekniği, elde var olan, hali hazırda sınıflanmış verileri kullanarak yeni bir ver- inin mevcut sınıflardan herhangi birine ait olma olasılığını hesaplayan bir yöntemdir [26]. Eşitlik 1’deki denklem yardımıyla temel olasılık değeri hesaplanır. Burada iki sonuç durumlu örneğin bir bozuk paranın yazı ya da tura gelmesi gibi olasılık hesabına göre A veya B’nin olasılığı ifade edilmiştir.

3.1.3. Regresyon Sınıflandırıcı

Regresyon analizi herhangi bir değişkenin bir veya daha fazla başka değişkenlerle arasında olan ilişki durumunun matematiksel fonksiyon halinde ifade edilmesidir. Regresyon, sınıflan- dırma işlemini iki yaklaşım çerçevesi şeklinde gerçekleştirir. İlki bölme yani verileri sınıfa bağlı olarak çeşitli bölgelere ayırır, ikincisi ise tahmin, çıktı değerinin hesaplanması için fonksiyonlar üretir.

Bir bağımlı değişkenin tek bir bağımsız değişken- le açıklandığı regresyona “basit regresyon an- alizi”, bağımlı değişkenin birden fazla bağımsız değişkenle açıklandığı regresyona ise “çoklu regresyon analizi” denir [26]. En küçük kareler yöntemi ile elde edilen basit regresyon denklemi eşitlik 2’deki gibidir.

Birden fazla bilinmeyen x değeri için ise çoklu regresyon denklemi eşitlik 3’deki gibidir. Burada a, doğrusal fonksiyon sabiti, b, doğrusal fonksi- yon eğimi x, bağımsız değişkeni göstermektedir.

4. Bilgisayar Mühendisliği Tanımı

Bilgisayar mühendisliği, bilgisayar bilimlerini te- mel alan yazılım ve donanım bileşenlerini içeren

sistemlerin çözümlenmesi, boyutlandırılması, tasarlanması, gerçeklemesi, sınanması, üretilme- si ve bakımı konusunda teknik çözümler üreten bir mühendislik dalıdır. Bilgisayar mühendisinin amacı insanlığın hizmetine en az kaynakla, en kısa sürede, en dayanıklı ve kullanışlı bilgi sistemi ürünlerini üretmektir [13]. Bilgisayar mühendis- leri, programlama dilleri yazılım tasarımı veya yazılım, donanım kavramlarını bir araya getirerek birlikte uyum içinde çalışabilme eğitimini alırlar.

Yazılımların neyi yapabileceği neyi yapamaya- cağı, yazılımların belirli bir görev üzerinde nasıl etkili bir verim gösterebilecekleri, yazılımların saklanmış bir veriyi nasıl yazıp okuyabilece- klerini, yazılımların nasıl daha akıllı çalışabilece- klerini, insan ve yazılımların birbirleriyle nasıl bir iletişim içerisinde olacakları konuları üzerinde ve elektronik devre tasarımı ile donanım ve yazılım entegrasyonu alanlarında çalışırlar [2].

4.1. Bilgisayar Mühendisliği Mesleğinin Ger- ektirdiği Özellikler

Mesleğinde yeterli iyi bir bilgisayar mühendisi olabilmek için literatürde olması gereken özel- likler üzerine tanımlamalar yapılmıştır.

• Analiz ve sentez yeteneğine sahip

• Problem çözme yeteneğine sahip

• Akademik araştırma yeteneğine sahip

• Sayı ve sembollerle akıl yürütme gücüne sahip

• Bir işi öğelerine ayırıp işlem basamaklarını be- lirleme becerisine sahip

• Mantık yürütme ve tasarım yeteneğine sahip

• Belirli düzeyde hayal gücüne sahip

• Elektronik cihazları etkin kullanabilme ye- teneğine sahip

• Kendini sürekli yenileme gereği duyan

• Dikkatli, sabırlı, meraklı, araştırmacı, grup çalışmasına yatkın olmayı gerektirir [13].

5. Anket

Anket, kişilerden çeşitli konularda, planlı ve stan- dart biçimde bilgi almak için geliştirilmiş olan ve özellikle epidemiyolojik ve sosyolojik araştırma- larda sıklıkla kullanılan bir yöntemdir. Anket for- mu ile elde edilebilecek bilgiler anket uygulanan kişilerin bilgi düzeyi, tutumu ve görüşleri, kişilerin davranış şekilleri ve özellikleri şeklinde açıkla- nabilir [23].

Bu çalışmada bilgisayar mühendisliği mesleğinin gerektirdiği vasıfları geniş bir şekilde kapsayan en temel özelliklerden 5 tanesi ele alınarak sor- ular oluşturulmuş ve ankete katılan bireylerden bu alanlara yönelik bilgiler toplanıp veri kümesi oluşturulmuştur. Ele alınan özellikler kişinin bil- gisayar mühendisliği bölümüne olan ilgisi, Sayı ve sembollerle akıl yürütme gücü, Sabır, Zaman

(4)

yönetimi ve Araştırma yeteneğidir. Bu özellikleri ölçmeye yönelik alt bölümlerden oluşan anket soruları oluşturulmuş ve Harran üniversitesi bil- gisayar mühendisliği bölümündeki öğrencilere uygulanmıştır.

5.1. Bölüme Olan İlgisi

Bilgisayar mühendisliği bölümünde okuyan öğrencilerin bu mesleği tercih etme sebep- leri, mesleği tercih etmedeki istek dereceleri, bilgisayar bilimlerine olan ilgisi gibi durumları göz önüne alarak kişinin bu bölüme olan ilgisi değerlendirilmek istenmiştir. Öğrencinin tercih sırası, idealindeki meslek olup olmaması, bilgi- sayar başında zamanını daha çok neler yaparak geçirdiği gibi durumları analiz ederek bölüme olan ilişkisi değerlendirilmiştir.

5.2. Sayı ve Semboller ile Akıl Yürütme Gücü Bilgisayar mühendisliği mesleğinin gerektirdiği özelliklerden biri olan sayı ve sembollerle akıl yürütme gücü semboller arasında bağ kurma etkinliğidir. Akıl yürütme; bütün etmenleri dik- kate alarak düşünüp akılcı bir sonuca ulaşma sürecidir [29]. Aklı bağımsız olarak ayrılması, birleştirilmesi ve karşılaştırılması yeteneğidir. Akıl yürütmede, öncüllerle sonuç arasında zorunlu bir ilişki vardır. Sonuç öncüllerin etkinliğini taşı- maktadır. Bu şekilde olan özelliğin kişide olması akıl yürütme ve mantığı etkili bir şekilde kullanma kapasitelerini mesleki alanda kullanmaları kişile- rin bölüme olan yatkınlığını artırır. Bu çalışmada sayı ve semboller ile akıl yürütme gücü alanında bulunan soruların kişinin sembollerle ve mantıkla akıl yürütme gücü analiz edilmiştir.

5.3. Sabır

Sabır, zor koşullar altında cesaret ve metane- tini yitirmeme duygusudur. Sabırlı insan uzun süreli gecikmelere ve tahriklere rağmen moralini bozmadan yoluna devam eder [25]. Bilgisayar mühendisliği mesleğinin gerektirdiği özellikle- rden biri olan sabır, kişinin mesleki çalışma al- anında karşılaştığı zorluklar karşısında direncini gösterir. Çalışmamızda anket sorularında sabır alanında kişinin mesleki yolunda karşılaşacağı durumlara karşı tutumu değerlendirilmiştir.

5.4. İyi Bir Araştırmacı

Araştırma, var olan bilgiye kullanılabilir ve kanıt- lanabilir nitelikte yeni bilgiler eklemek amacını güden sistemli bir incelemedir. İyi bir araştır- macı, bağımsız ve esnek düşünce yapısına sa- hip olan, tarafsız, sorgu soran, sosyal olan ve iyi bir iletişim kuran kişidir. Araştırma bir süreç olup, problemlere güvenilir çözümler bulmaktır.

Bunun için, planlı ve sistemli olmak gerekmekte- dir. Araştırma bir gereksinimle başlar. Bu ise, en

genel anlamda, insanları, dolaylı ya da dolaysız olarak rahatsız eden durumların ortadan kaldırıl- ması gereksinimidir [7]. Çalışmamızda bu özelliği analiz etmeye yönelik sorular ile bilgi toplan- mıştır. Bilgisayar mühendisliği mesleğinin ger- ektirdiği özelliklerden biri olan iyi bir araştırmacı olma özelliği kişiye çalışma alanında doğru bilg- iye ulaşma ve araştırma yaparak yenilikçi bir yol çizme gibi birçok alanda fayda sağlamaktadır.

5.5. Zaman Yönetimi

Zaman yönetimi, zamanı mümkün olduğunca etkin ve etkili bir bicimde kullanma ve dene- tleme sistemidir. Zamanı akılcı kullanarak daha verimli sonuçlar elde edilmesini sağlar. Zaman yönetimini yapabilmek planlı ve programlı bir şekilde çalışmaktan geçer. Bilgisayar mühendis- liği mesleğinin gerektirdiği özelliklerden biri olan zaman yönetimi kişiye zamanı iyi değer- lendirmeyi öğretir. Zamanı iyi değerlendirmeyi öğrenmek herkes için stresi azaltacak, yararlı bir beceridir. Zaman yönetiminin bireylerin yaşam kalitesini artırmaya yardımcı olduğunu, stresi azalttığını, dengeli bir yaşam sağladığını, verim- liliği artırdığını ve hedeflere ulaşmayı kolaylaştırır [20]. Çalışmamızda zaman yönetimi için sorular oluşturulup veriler toplanmıştır.

6. Uygulama

Araştırmanın amacı eğitimsel veri madenciliği kullanılarak bilgisayar mühendisliğinde okuyan öğrencilerin bilgisayar mühendisliğine olan yat- kınlıklarının ve sahip olduğu kişisel özelliklerinin yeterliliğini analiz edebilmek ve değerlendirme- ktir. Tahmin etmek için veri madenciliği sınıflan- dırma yaklaşımları uygulanmıştır. Tahmin edilen sınıf değişkeni öğrencinin bilgisayar mühendis- liğine olan yatkınlığı ve sahip olduğu kişisel özelliklerinin yeterliliğidir. Sınıflandırma çeşitli algoritmalar aracılığı ile gerçekleştirilmektedir.

Sınıflandırma için veri kümesi eğitim kümesi ve test kümesi olarak bölümlere ayrılır. Sınıflandırma algoritmaları eğitim kümesi üzerinde eğitilerek sınıflandırma modellerini oluşturur. Sınıflandırma algoritmaları daha sonra oluşturulmuş modeller üzerinde test kümesini sınayarak başarı hesap- lanır. Çalışmada on katlı çapraz doğrulama sını- flama başarısı ölçütüne göre sınıflama başarısı sonuçları elde edilmiş ve değerlendirilmiştir. On- kat çapraz doğrulamada veri kümesi rastgele on eşit parçaya bölünerek her seferinde 1 parça test, geri kalan 9 parça eğitim verisi olarak kul- lanılmakta ve sınıflama yapılmaktadır [3]. Bilgisa- yar mühendisliğinde öğrenim gören öğrencilerin bilgisayar mühendisliğine olan yatkınlıklarının ve sahip olduğu kişisel özelliklerinin yeterliliğini analiz edebilmek için sınıflandırma algoritma-

(5)

larından Weka’da bulanan karar ağaçları, ID3 ve J48, Naive Bayes sınıflandırma algoritması, K-en yakın komşu algoritması (IBk) ve Regresyon an- alizi kullanılmıştır. Sınıflandırma algoritmaların sınıflama başarısı doğrulukları karşılaştırılarak en yüksek doğruluğa sahip algoritma bu çalışmada için en uygun yöntem olarak tespit edilmiştir. Bil- gisayar mühendisliği bölümüne yatkınlığı bilin- meyen öğrenciler için anket sonuçları üzerinden uygun yöntem yardımıyla, bölümüne olan yatkın- lıkları tespit edilebilecektir.

6.1. Verilerin Toplanması ve Veri Analizi Çalışmada veriler anket uygulaması ile toplan- mıştır. Veriler Harran üniversitesi bilgisayar mühendisliği bölümünde öğrenim gören ve anke- ti dolduran 105 öğrenciden elde edilmiştir. Anket bölümün öğretim elemanlarının değerlendirmes- ine sunulmuş ve puanlandırılmıştır. Ankette 5 ayrı kategoride toplam 20 soru öğrencilere sorulmuş ve cevaplamaları istenmiştir. Anket sonuçları ile oluşturulmuş veri kümesine 5 farklı sınıflandır- ma yöntemi uygulanmış, sınıflandırma başarısı sonuçlarına göre çalışma için en uygun yöntem belirlenmiştir. Veri kümesi Harran üniversitesi bil- gisayar mühendisliği bölümünde öğrenim gören 105 öğrenciden elde edilmiştir. Bu veriler öğren- cilerden akademik benlik kavramı ölçeğinden yola çıkılarak oluşturulmuş anket uygulaması ile toplanmıştır.

Akademik benlik kavramı ölçeği öğrencilerin ye- tenek ve ilgilerini daha iyi tanıyarak, okul ve ders seçimine yardımcı olmaktadır. Öğrencinin ilgi alanına göre analiz yapmaktadır. Ortaokul sevi- yesindeki öğrencilere uygulanmaktadır [19]. Bu çalışmada Akademik benlik kavramı ölçeğinden yola çıkılmış fakat bilgisayar mühendisliği lisans düzeyinde öğrenim gören öğrencilerin bölüme olan ilgisi ve yatkınlığının analiz edebilmek amacıyla lisans öğrencilerine uygun anket soru- ları oluşturulmuştur.

Bilgisayar mühendisliğinde okuyan öğrencilerin bilgisayar mühendisliğine olan yatkınlıklarının ve sahip olduğu kişisel özelliklerinin yeterliliğini analiz edebilmek için Weka (Waikato Environ- ment for Knowledge Analysis) veri madenciliği yazılımı kullanılmıştır. Weka, veri madenciliği al- goritmalarını içeren, Java programlama dili ile geliştirilmiş açık kaynak kodlu bir yazılımdır [6].

Çalışmada bilgisayar mühendisliği mesleğinin gerektirdiği en temel özelliklerden 5 tanesi ele alınarak katılımcılardan, bu alanlara yönelik bil- gi toplanıp veri kümesi oluşturulmuştur. Topla- nan veriler, öğrencilerin vermiş olduğu cevaplar bölüm akademisyenlerinin değerlendirmesine sunulmuş ve puanlandırılmıştır. Ele alınan özel-

likler kişinin bölüme olan ilgisi, Sayı ve sem- bollerle akıl yürütme gücü, Sabır, Zaman yöne- timi ve Araştırma yeteneğidir. Elde edilen veriler Weka programına aktarılmaya uygun formata çevrilmiştir. Sınıflandırma algoritmalarında kul- lanılmak üzere Tablo 1’deki gibi oluşturulan

“.csv” uzantılı veri dosyaları Weka programına aktarılmıştır. Programa aktarılan veriler sınıflan- dırma algoritmaları olan karar ağaçları (ID3 ve J48), Naive Bayes algoritması, Regresyon analizi ve K-en yakın komşu (IBk), algoritmaları uygu- lanmış, sınıflandırma başarısı sonuçlarına göre çalışma için en uygun yöntem belirlenmiştir.

7. Sonuç ve Öneriler

Tablo 2’de öğrencilerden elde edilmiş veriler üze- rinde uygulanan sınıflandırma algoritmalarının başarı oranları verilmiştir. Tablodaki değerler ne kadar yüksek olursa ilgili algoritmanın daha iyi ve başarılı olduğu gösterilmektedir. Doğruluk değeri doğru sınıflanmış sınıf sayısının tahmin edilen tüm sınıf sayısına olan oranını göstermek- tedir. Kesinlik, doğru pozitif örnek sayısının, tah- min edilmiş tüm pozitif örnek sayısına oranıdır.

Anma, doğru sınıflandırılmış pozitif örnek sayısının doğru pozitif ve yanlış negatif toplam örnek sayısına oranıdır. F-ölçütü, kesinlik ve du- yarlılığın harmonik ortalamasıdır. [4]. ROC Alanı ise duyarlılık ve özgüllük değeri kullanarak tanı koymanın getirdiği sakıncaları ortadan kaldır- mak için geliştirilmiş, istatistik karar teorisine dayanan bir değerlendirme yöntemidir [21]. ROC eğrisi altında kalan alan testin başarılı öğrenciler ile az başarılı olan öğrencileri ayırmadaki doğru- luk oranını belirler. [10].

Tablo 2. Sınıflama Başarı Oranları Tablo 1. Özellikler

(6)

Eğitimsel veri madenciliği alanında yapılan bu çalışmada makine öğrenmesinin sınıflandırma teknikleri ile bilgisayar mühendisliği öğrencil- erinin bölüme olan yatkınlığını tahmin eden bir model geliştirilmiştir. Elde edilen sonuçlar, Id3 karar ağacı algoritmasının eğitimsel veri maden- ciliği sınıflandırma modeli için başarılı bir algorit- ma olduğunu göstermektedir.

Id3 karar ağacı diğer sınıflama algoritmaları- na göre Tablo 2’deki performans kıyaslama- larının hepsinde daha başarılı olmuştur. Weka programından elde edilen Id3 algoritmasının karışıklık matris sonucu Tablo 3’de görüldüğü gibidir.

Tablo 3. Id3 Algoritması Karışıklık Matrisi Karar ağaçları üzerinde çalışılan veri kümesinde sınıflama yapmak için kurallar oluşturur. Karar ağacı yapısındaki kuralların değerlendirilmesi- nin sonuçlarına göre; bilgisayar mühendisliğinde öğrenim gören öğrencilerin zaman yönetimi, öğrencinin araştırmacı olma özelliği ve bölüme olan ilgisi, bölüme olan yatkınlığını yüksek oran- da etkilemektedir. Zaman yönetimi kötü olan öğrencilerin bölüme olan ilgisi az, sayı ve sem- bollerle akıl yürütme gücü çok az ve orta sevi- yede bir araştırma özelliğine sahip ise bölüme yatkın olmadıkları sonucuna varılabilir. Ayrıca zaman yönetimi iyi olan öğrencilerin, sayı ve sembollerle akıl yürütme gücü iyi, iyi bir araştır- macı olma özelliğine sahip ve az sabırlı olanların bölüme yatkın oldukları çıkarımı yapılmaktadır.

Id3 algoritmasının oluşturduğu karar ağacın- da sabırlı olmanın öğrencinin bölüme olan yat- kınlığını yüksek oranda etkilemediği sonucuna varılmıştır.

Bilgisayar mühendisliğinde okuyan öğrencile- rin bölüme ilgisi çok az olan öğrencilerin anal- iz edilen diğer özelliklerinin iyi olması durumda bölüme yatkınlık sağladıkları ancak hem bölüme ilgisi olmayan hem de analiz edilen diğer özel- liklerin kötü olması durumunda öğrencinin bölüme yatkın olmadığı sonucuna varılmıştır.

Söz konusu çalışmada bilgisayar mühendisliği bölümünde okuyan öğrencilerin mesleğin ger- ektirdiği özelliklerden seçilen alanlarda yatkınlığı

analiz edilmiş, öğrencilerin bölüme olan yatkın- lığına ve özelliklerine göre bölüm akademisy- enlerine eğitim planı hedeflerinin gerçekleştir- ilmesine ve ders içeriklerinin var olan genel öğrenci profiline uygun olarak hazırlanabilmes- ine katkı sağlaması amaçlanmıştır.

Yapılan çalışmada hazırlanan anket çalışması üzerinde anket güvenilirlik testinin yapılmamış olması çalışmanın eksikliğidir. Araştırmalarda, aynı süreçlerin izlenmesi ile tutarlı sonuçların elde edilebilmesi amaçlanır. Elde edilen sonuçları daha tutarlı bir hale getirebilmek için anket çalışması üzerinde gelecekte yapılan çalışmalar için anket güvenirlik analizi uygulanması öner- ilmektedir. Güvenirlik analizi anket ile ölçülmek istenen ortak değeri, eşit olarak paylaşmayan değişkenlerin belirlenmesi ve bu değişkenlerin analiz dışı bırakılarak, ölçeğin iç tutarlılığı arttırıl- masını sağlar [24].

Sadece Harran üniversitesi bilgisayar mühendis- liği öğrencileri üzerinde yapılan bu çalışma, sonraki çalışmalarda üniversite ve bölüm ayrımı yapmaksızın daha genel olarak tüm üniversite ve tüm bölümlere uygulanarak daha aday öğrenci durumunda olan kişilere üniversite bölüm terci- hlerinde yol gösterici, yardımcı bir rehber olarak kullanılabilmesi önerilmektedir.

8.Kaynaklar

[1] Baradwaj B.K, Pal S., “Mining educational data to analyze students’ performance”, ArX- ivpreprint arXiv:1201.3417, (2012).

[2] Bilgisayar mühendisliği, (17.12.2014), http://

tr.wikipedia.org/wiki/Bilgisayar_mühendisliği.

[3] Breiman L., Friedman, J.H., Olshen, R.A

& Stone, C.J., “Classification and regression trees”. Monterey,CA: Wadsworth & Boks / Cole Advanced Boks & Software, (1984).

[4] Coşkun C., Baykal, A., “Veri Madenciliğinde Sınıflandırma Algoritmalarının Bir Örnek Üze- rinde Karşılaştırılması”, Akademik Bilişim’11, Malatya, (2011).

[5] Çöllüoğlu GÜLEN Ö., Özdemir, S., “Analysis of Gifted Students’ Interest Areas Using Data Mining Techniques”, Journal of Gifted Education Research, 1(3), 213-226, (2013).

[6] Dener M., Dörterler, M., Orman A., “Açık Kay- nak Kodlu Veri Madenciliği Programları,Weka’da Örnek Uygulama”, Akademik Bilişim’09 ,Şanlıur- fa, (2009).

(7)

[7] Doğan M., “Araştırma Teknikleri ve Bilimsel İletişimin Temelleri”, (05.01.2015), http://www.

aku.edu.tr/dosyayonetimi/arastirmateknikleri.

pdf.

[8] Doğan Ş., ve Türkoğlu,İ., “Hypothyroidi and Hyperthyroidi Detection from Thyroid Hormone Parameters by Using Decision Trees”, Doğu Anadolu

Bölgesi Araştırmaları Dergisi, Cilt 5, No 2, 163- 169, (2007).

[9] Gökgöz F., “Risk ve Belirsizlik Altında Karar Alma–Karar Analizleri, Karar Ağaçları- Oyun Te- orisi“, (19.12.2014), http://acikders.ankara.edu.

tr/KararAnalizi.pdf

[10] Grove W.M., “Mathematical aspects of diag- nosis “, Library of Congress Cataloging-In-Pub- lication Data, 50-75, (2006).

[11] Hand D.J., “Data Mining: Statistics and More?”, The American Statistician, 52:112-118, (1998).

[12] Im K.H., Kim T.H., Bae S.M., Park S.C, “Con- ceptual modeling with neural network for gifted- ness identification and education”, In Advances in Natural Computation(pp. 530-538). Springer Berlin Heidelberg, (2005).

[13] İstanbul Kültür Üniversitesi bilgisayar mühendisliği bölüm tanıtımı, (15.12.2014), http://www.iku.edu.tr/upp/1693/files/Comput- er%20Engineering/BilgisayarMuhBolumTaniti- mi_18_09_2014.pdf

[14] Jacobs P., “Data Mining: What General Managers Need to Know” ,Harvard Manage- ment Update, Cilt 4, No 10, 8, (1999).

[15] Kalıkov A., “Veri Madenciliği ve Bir E-Ticaret Uygulaması”, Yüksek Lisans Tezi, Gazi Üniversi- tesi, Fen Bilimleri Enstitüsü, (2006).

[16] Kayri M., Boysan M., “ assesment of relation between cognitive vulnerability and depression’s level by using classification and regression tree analysis”, Hacettepe üniversitesi Eğitim Fakülte- si Dergisi, (2008).

[17] Kitler R. ve Wang W., “The Emerging Role of Data Mining”, Solid State Technology, 42: 11-45, (1998).

[18] Kurt Ç., Erdem O.A., “Öğrenci Başarısını Et- kileyen Faktörlerin Veri Madenciliği Yöntemleri-

yle İncelenmesi”, Politeknik Dergisi Journal of Polytechnic, (2012).

[19] Kuzgun Y., “Akademik Benlik Kavramı Ölçeği El Kitabı”, Nobel Yayıncılık Eğitim , (1996).

[20] Mackenzie R. A., “Time Management: From Principles to Practice”, Training and

Development Journal, 2, 47-53 , (1978).

[21] Metz C.E., “Receiver operating characteris- tic analysis: a tool for the quantitative evaluation of observer performance and imaging systems”, J Am Coll Radiol, 3,413- 422,( 2006).

[22] Naive Bayes Sınıflandırıcı, (17.12.2014), http://tr.wikipedia.org/NaiveBayes.

[23] Oğur R., Tekbaş Ö.F., ”Anket Nasıl Hazır- lanır? “,STED,12:9:336-340, (2003).

[24] Özdemir T, “Güvenirlik Analizi” ,(20.01.2015), http://akademikdestek.net/kutuphane/güvenir- likanalizi.

[25] Sabır, (05.01.2015), http://tr.wikipedia.org/

Sabır.

[26] Silahtaroğlu, G., “Veri Madenciliği Kavram ve Algoritmaları”, İstanbul, Papatya Yayıncılık Eğitim , (2013).

[27] Şen B., Uçar E., “Evaluating the achieve- ments of computer engineering departmen of distance education students with data mining methods”, Procedia Technology, 1, 262-267, (2012).

[28] Tsai C.F., Tsai C.T., Hung C.S. ve Hwang P.S., “Data mining techniques for identifying students at risk of failing a computer proficiency test required for graduation”, Australasian Jour- nal of Educational Technology, 27(3), 481-498, (2011).

[29] Umay A., Kaf Y., “ Matematikte Kusurlu Akıl Yürütme Üzerine Bir Çalışma”, Hacettepe Üniversitesi Eğitim Fakültesi Dergisi,28: 188- 195, (2005).

[30] Usgurlu Ü.,”Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı”, (12.12.2014), http://mail.

baskent.edu.tr/~20394676/0302/bil483/HW2.

pdf.

Referanslar

Benzer Belgeler

Bu işleme veri madenciliği yerine önceleri veri taraması (data dredging), veri yakalanması (data fishing) gibi isimler verilmiştir.?. Veri Madenciliğinin Tarihçesi

5 Peynir, Makarna, Şeker,Bira.. Destek ve güven ölçütleri için eşik değerleri belirlenir.  b) Beş müşterinin alışveriş yaptığı ürünlerin kümesi {şeker, çay,

 Bilginin Dünya üzerinde dağıtık ve çok büyük boyutlarda bulunmasından dolayı bilgiyi bulmak ve erişmek daha önemli hale gelmeye başladı..  Çok büyük bir alanda

 Aynı veri madenciliği sonuçları elde edilecek şekilde veri miktarını azaltma.. Veriyi

 Büyük veri kümesini daha küçük bir alt küme ile temsil etme.  Alt küme

 Modelin doğruluğu, doğru sınıflandırılmış sınama kümesi örneklerinin toplam sınama kümesi örneklerine oranı olarak belirlenir.  Sınama kümesi

Balıkesir Üniversitesi MMF Endüstri Mühendisliği Bölümü Veri Madenciliği Dersi... Karar Ağaçlarında

Gözlem değerlerini (0,1) aralığına çekmek için min-max normalleştirmesi kullanılacaktır..  Min-max normalleştirmesi sonucu dönüştürülen değerler aşağıdadır..