TEKSTİL VE HAZIR GİYİM SEKTÖRÜNDE
VERİ MADENCİLİĞİ
Şehpal ÖZDEMİR, 43
Füsun DOBA KADEM44
ÖZET
Veri, bilgiyi elde etmeye yönelik olan işlenmemiş ham kayıtlardır. Kaynağı bilinen bu kayıtlar ilişkilendirilmemiştir, düzenlenmemiştir. Başka bir deyişle anlamlandırılmamıştır. Veri üretme, veri toplama ve veri kullanımındaki artış, verileri kısa sürede kullanışlı ve anlaşılabilir bilgiye çevirme ihtiyacını da beraberinde getirmiştir. Bu aşamada; fazla sayıda ve birbiriyle mantık ilişkisi içinde olan veriyi, gelecekle ilgili tahmin yapabilmek için, bilgisayar programlarıyla inceleme ve anlamlı bağıntılar çıkarma işine Veri Madenciliği denmektedir.
Veritabanlarından bilginin elde edilmesi; Veri temizleme-veri bütünleştirme-veri seçme- veri dönüştürme- veri madenciliği- örüntü değerlendirme- bilginin sunumu şeklinde sıralanabilir: Veri madenciliği sürecinin çeşitli aşamalarında kullanılabilen birçok yöntem ve algoritma geliştirilmiştir. Söz konusu modeller; Sınıflandırma, kümeleme, Birliktelik kuralı olarak gruplandırılmaktadır.
Bu çalışmada veri madenciliği sisteminin tekstil ve hazır giyim endüstrisinde uygulanabilirliği ve araştırma alanları ele alınmıştır. Literatürdeki en yaygın uygulanan sınıflandırma metotları ve en sık başvurulan kümeleme teknikleri ile ilgili çalışmalar incelenmiş ve yorumlanmıştır.
Anahtar Kelimeler:
Veri madenciliği, tekstil, sınıflandırma yöntemi, kümeleme yöntemi.Abstract
DATA MINING IN TEXTILE AND APPAREL INDUSTRY
Data is a raw material that is intended to obtain information. The source of the data is known, but not linked, not edited. In other words, it is not explained. Increase in data generation, data collection and data utilization bring the need to turn this data into useful and understandable information in a short time. At this stage, data mining is described that using the data which is
in a large number and in a logic relationship with each other, to investigate meaningful relations in order to make predictions about the future with computer programs.
The workflow of obtaining the information from the databases is listed as follows: data cleaning, data integration, data selection, data transformation, data mining, pattern evaluation, presentation of information. Many methods and algorithms have been developed that can be used in data mining. These models can be grouped in three ways: Classification, clustering and association rule.
In this review, applicability of data mining system and application areas in textile and apparel industry are discussed. Examples of the most commonly applied classification methods and the most commonly applied clustering techniques are evaluated.
Key Words:
Data mining, textile, classification method, clustering method.1.
Giriş
1.1. Bilgi, Bilgi Yönetim Süreci ve Veri Madenciliği
Veri; bilgiye ulaşmada başlangıç noktası, bilgi içeriğine ilişkin onu oluşturan en küçük parça; enformasyonun oluşumunda yapıtaşıdır. Bilgi, elektronik veya geleneksel ortamlara kaydedilmiş, saklanmış anlamlı ve iletilebilir veriler topluluğu olarak tanımlanmaktadır. Bilgi Yönetimi, kayıtlı ya da kayıtsız organizasyon verilerini ve kişisel bilgi ve tecrübeye dayalı birikimleri, toplayıp, düzenleyip, kayıt altına alıp yararlı bilgi haline getirerek tekrarlanan işlemlerin tamamının teknolojik araçlarla yapılmasını sağlamak ve bunun sonucunda pozitif iş neticeleri elde etmek amacıyla yapılan bir dizi teknolojik ve kültürel işlemlerdir [1].
Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılması işlemi denilebilmektedir. Veri analizi yaparak her mal için bir sonraki ayın satış tahminleri çıkarılabilir; müşteriler satın aldıkları mallara bağlı olarak gruplanabilir; yeni bir ürün için potansiyel müşteriler belirlenebilir; müşterilerin zaman içindeki hareketleri incelenerek onların davranışları ile ilgili tahminler yapılabilir. Binlerce malın ve müşterinin olabileceği düşünülürse bu analiz gözle ve elle yapılamayacak, bu durumda analizin otomatik olarak yapılması gerekecektir.
Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir [2].
Bilginin belli bir seviyeye gelmeden önce geçirdiği bazı süreçler vardır. Bu süreçler bilgi yönetiminin ana unsurlarını oluşturmaktadır. Akpınar ’a göre veri tabanlarından bilgi keşfi sürecinde yer alan adımlar şöyledir;
- Veri Seçimi: Veri kümesinin birleştirilerek, sorguya uygun örneklem kümesinin elde edildiği adımdır.
- Veri Temizleme ve Önişleme: Seçilen örneklemde yer alan hatalı örneklerin çıkarıldığı ve eksik nitelik değerlerinin değiştirildiği aşamadır. Bu aşama keşfedilen bilginin kalitesini arttırır. - Veri İndirgeme: Seçilen örneklemden ilgisiz niteliklerin atıldığı ve tekrarlı tutanakların ayıklandığı adımdır. Bu aşama seçilen veri madenciliği sorgusunun çalışma zamanını iyileştirir. - Veri Madenciliği: Verilen bir veri madenciliği sorgusunun (sınıflandırma, kümeleme, birliktelik analizi vb.) işletilmesidir.
- Değerlendirme: Keşfedilen bilginin geçerlilik, yenilik, yararlılık ve basitlik gibi ölçütlere göre değerlendirilmesi aşamasıdır [3].
1.2.Veri Madenciliğinde Kullanılan Teknikler
Veri madenciliğinin, birçok disiplinle çakışma noktaları vardır [4].
Şekil 1. Veri Madenciliğinde Kullanılan Teknikler[4]
1.3.Veri Madenciliğinde Kullanılan Modeller
Veri madenciliği konusu kullanıldıkları alanlara göre değişik modellere ayrılmaktadır. Bu yöntemler uygulamada değişik amaçlar için kullanılırken birçok teknik ve algoritmalardan yararlanılmaktadır.
Veri madenciliğinde kullanılan modeller, tahmin edici (Predictive) ve tanımlayıcı (Descriptive) olmak üzere iki ana başlık altında incelenmektedir.
Tahmin edici modellerde, sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri
Tanımlayıcı modellerde ise karar vermeye rehberlik etmede kullanılabilecek mevcut verilerdeki örüntülerin tanımlanması sağlanmaktadır [5].
Şekil 2. Veri Madenciliğinde Kullanılan Modeller [5]
1.4.Tekstil ve Hazır Giyim Sektöründe Veri Madenciliği Uygulama Örnekleri
Aşağıdaki tabloda tekstil ve hazır giyim sektöründeki veri madenciliği uygulamalarından bazıları incelenmiş ve yorumlanmıştır.
Tablo 1. Veri Madenciliğinin Tekstil ve Hazır Giyim Sektörü Uygulama Örnekleri
*** Kullanılan Veri Madenciliği Modeli Uygulama Özeti
Zari f Ta pkan T., Özmen T. (2018) Sınıflandırma metodu
Bu çalışmada elde edilen kurallar, kaliteli iplik üretimi için işletmeye yol gösterici özellikte olmuştur. Farklı iplik türlerine ait kalite testlerinin işletme mühendisinin tecrübelerine dayalı olarak belirlenmesi yerine Taguchi deneysel tasarım
yöntemi ile daha az sayıda test
gerçekleştirilebilmiştir. Bu da işletmenin hem maddi kaybını hem de testler için ayrılan zamanı azaltmıştır. Öztür k A. ve ark adaşları ( 2011) Kümeleme Metodu-Hiyerarşik Yöntemler (AHS)
Bu çalışmanın ana amacı, analitik hiyerarşi sürecini kullanarak bir tekstil firmasının tedarikçi seçim
problemini çözmektir.Oluşturulan model, firmanın
çalıştığı tedarikçilerin değerlendirmesinde ve farklı ürün çeşitleri sunan tedarikçilerin seçimine ilişkin kararlarında etkin ve temel bir rol oynamıştır.
Başkaya Z., Akar C. (2005) Kümeleme Metodu-Hiyerarşik Yöntemler (AHS)
Bu çalışmada, subjektif değerlendirmelerin de süreç içinde dikkate alındığı karar verme yöntemlerinden olan Analitik Hiyerarşi Süreci kullanılarak, bir tekstil işletmesinin ham kumaş, boyalı kumaş ve perdelik kumaş alternatifleri arasından hangisini üretmesi gerektiğine karar verilmeye çalışılmıştır. . Çalışma sonuçları işletme için en uygun üretim alternatifinin perdelik kumaş üretimi olduğunu göstermiştir. Is trat V, Lali ć N (201 7) Birliktelik Kuralları
Araştırmanın amacı, alıcıların davranışlarındaki kalıpları bulmak ve tekstil sanayi veri tabanından yapılan işlemleri analiz ederek karar modelini geliştirmektir. Güneydoğu Avrupa bölgesinin tekstil endüstrisinden 2000 işlem içeren bir veri kümesi kullanılarak, satışla ilgili yaklaşımın yararlı olduğu sonucuna varılmıştır. Yıldı rım P.ve ark adaşları (2017) Birliktelik Kuralları (FP-Growth algoritması)
Çalışmanın amacı, ilişki kuralı madenciliğinde genişletilmiş bir FP-Growth algoritması kullanarak iplik parametreleri (tüylülük, iplik çapı vb.) ve kumaş özellikleri (boncuklanma, kırışma ve bükülme dayanımı) arasındaki ilişkileri ortaya çıkarmaktır.
ary V.,
Kümeleme Metodu
Çalışmada iplik fabrikasında üretim süreci parametreleri ve iplik kalitesi parametreleri test edilmiştir. Daha sonra, kümeleme ve yapay sinir ağı (YSA) içeren veri madenciliği yöntemleri kullanılarak iplik kalitesi tahmin edilmiştir. Önerilen yöntemden elde edilen sonuçlar, YSA temelli geleneksel yöntemlerle karşılaştırılmıştır. Sonuçlar, veri madenciliği tekniğinin performansının YSA'dan daha doğru olduğunu göstermiştir.
Yıldı rım P. ve ar kada şları (2018) Sınıflandırma metodu- Destek Vektör Makineleri
Bu çalışma tekstil endüstrisinde bir sınıflandırma tekniğinin bir kümelenme tekniğinden daha işlevsel olduğunu açıkça göstermektedir. En yaygın uygulanan sınıflandırma yöntemlerinin yapay sinir ağları ve destek vektörü makineleri olduğunu ve genellikle tekstil uygulamalarında yüksek doğruluk oranları sağladığını ortaya çıkarmaktadır.
Sağlam H adık İ. E. (2015) Kümeleme Metodu- K-means algoritması
Bu çalışma, veri madenciliği metodolojisi kullanarak bir perakende firmasının mağazalarını personel
maliyeti benzerliklerine göre gruplandırmayı
amaçlamaktadır. Sonuç olarak, uygulanan algoritma sonucunda şirketin mağazaları 10 kümeye ayrılmıştır. Bu bilgi, kişisel maliyet hakkında edinilen bilgiler açısından yeni bir mağaza açarken şirket için bir çerçeve sağlayabilmektedir.
Çift likl i C., ve ark ada şla rı (2010) Sınıflandırma metodu-Karar Ağaçları
Bu araştırma, veri madenciliği yoluyla üretim sürecinin iyileştirilmesini incelemektedir. Halı imalatında sadece makine arızalarını tespit etmekle kalmamış, aynı zamanda bir C4.5 karar ağacı modeli önermektedir. Sonuç olarak, üretim süreci yeniden geliştirilmiştir. Timo r M., ve ar kada şları (2011) Birliktelik Kuralları
Bu çalışmada hazır giyim perakende sektöründe faaliyet gösteren bir firmanın alışveriş kayıtları ile alışverişi gerçekleştiren müşteri verileri ele alınmıştır. Analizde öncelikle "Birliktelik Kuralları Analizi" ile müşterilerin alışveriş alışkanlıkları belirlenmeye çalışılmış, daha sonra "Kümeleme Analizi" ile müşteriler, demografik özellikleri
dikkate alınarak bölümlendirilmiştir. Yapılan
analizler sonucunda gömlek alan müşterilerin %34.094'ünün Kravat ya da Papyon da satın aldığı ve bu kişilerin, toplam müşterilerin % 17.618'ini oluşturduğu görülmektedir.
*** İlgili Referans Çalışmalar 2. Sonuç
Tüm dünyada olduğu gibi ülkemizde de veri madenciliğine verilen önem ve gösterilen ilgi her geçen yıl artmaktadır. Veri madenciliğinin kullanım alanları genişleyerek yayılmaktadır. Bu çalışmada Türkiye’de tekstil ve hazır giyim sektöründe yapılan veri madenciliği uygulamalarından bazıları incelenmiştir. Ancak incelenen çalışmalar da göstermektedir ki kurum ve kuruluşların çoğu müşteri/kullanıcı analizlerine yönelmiştir. Veri madenciliğinin kullanıldığı alanların çeşitlendirilmesi büyük faydalar sağlayacaktır.
1. Ezerçe A. (2008). Müşteri İlişkileri Yönetimi ve Veri Madenciliği: Tekstil Sektöründe
Bir Uygulama, Yüksek Lisans Tezi, İstanbul Üniversitesi, İstanbul.
2. Alataş B., Akın E. (2004). Veri Madenciliğinde Yeni Yaklaşımlar. Yöneylem Araştırması/Endüstri Mühendisliği - Xxıv Ulusal Kongresi, 15-18 Haziran 2004, Gaziantep-Adana.
3. Akpınar H. (2009). Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği, İ.Ü.İşletme Fakültesi Dergisi, C:29, S: I'/Nisan 2000, S: 1-22.
4. Sıramkaya E. (2005). Veri Madenciliğinde Bulanık Mantık Uygulaması, Yüksek Lisans Tezi, Selçuk Üniversitesi, Konya.
5. Özmen T. (2017). Bir İplik Üretim Tesisinde Nitelik Seçimi Ve Sınıflandırma İle İplik
Kalitesinin Belirlenmesi, Yüksek Lisans Tezi, Erciyes Üniversitesi, Kayseri.
6. Zarif Tapkan T., Özmen T. (2018). Bir İplik Üretim Tesisinde Nitelik Seçimi Ve
Sınıflandırma İle İplik Kalitesinin Belirlenmesi Pamukkale Üniv. Müh. Bilim Derg,
24(4), 713-719.
7. Öztürk A., Erdoğmuş Ş., Arıkan V.S. (2011). . Analitik Hiyerarşi Süreci (AHS)
Kullanılarak Tedarikçilerin Değerlendirilmesi: Bir Tekstil Firmasında Uygulama.
Dokuz Eylül Üniversitesi İktisadi Ve İdari Bilimler Fakültesi Dergisi, Cilt:26, Sayı:1, Yıl:2011, Ss.93-112.
8. Başkaya Z., Akar C. (2005). Üretim Alternatifi Seçiminde Analitik Hiyerarşi Süreci:
Tekstil İşletmesi Örneği. Sosyal Bilimler Dergisi 2005/1 273-286.
9. Istrat V, Lalić N. Association Rules As A Decision Making Model İn The Textile
Industry. FIBRES & TEXTILES in EASTERN EUROPE 2017; 25, 4(124): 8-14.
10. 10 Yıldırım P., Derya Birant D., Alpyıldız T. (2017). Discovering The Relationships
Between Yarn And Fabric Properties Using Association Rule Mining. Turk J Elec Eng
& Comp Sci, 25: 4788-4804.
11. Mozafary V., Payvandy P. (2014). Application Of Data Mining
12. Technique İn Predicting Worsted Spun Yarn Quality, The Journal Of The Textile Institute, 105:1, 100-108.
13. Yıldırım P., Birant D., Alpyıldız T. (2018). Data Mining And Machine Learning İn
Textile İndustry. WIRES Data Mining Knowl. Discov. 8:E1228.
14. Sağlam Hadık İ. E. (2015). An Integrated Methodology With Data Mining Techniques
15. Çiftlikli C., Kahya Özyirmidokuz E. (2010). Implementing A Data Mining Solution For
Enhancing Carpet Manufacturing Productivity, Knowledge-Based Systems 23 (2010)
783–788.
16. Timor M., Ezerçe A., Gürsoy U. T. (2011). Müşteri Profili Ve Alışveriş Davranışlarını
Belirlemede Kümeleme Ve Birliktelik Kuralları Analizi: Perakende Sektöründe Bir Uygulama. Yönetim Yıl: 22 Sayı 68 Şubat 2011 128-147.