İÇİNDEKİLER
İçindekiler
Önsöz 7
1. BÖLÜM: VERİ MADENCİLİĞİNE GİRİŞ 13
1.1. Veri Madenciliği ve Karar Destek Sistemi 15
1.2. Veri Madenciliğinde Verinin Büyüklüğü 16
1.3. Veri Madenciliğinin Önemi ve İlişkili Olduğu Alanlar 17
1.4. Veri Madenciliğinin Kullanım Alanları 18
1.5. Veri Madenciliği ile İstatistik Arasındaki İlişki 22
1.6. Veri Madenciliğinde Sıklıkla Karşılaşılan Sorular 25
2. BÖLÜM: VERİ MADENCİLİĞİ VE VERİ TABANI TEKNOLOJİSİ TARİHÇESİ VE İLİŞKİSİ 27
2.1. Tarihçe 27
2.2. Veri Madenciliği ve Bilgi Keşif Süreci 28
2.3. Veri Tabanı Teknolojisinin Süreci 29
2.4. Veri Madenciliği Yazılımlarından Bazıları 30
3. BÖLÜM: VERİ MADENCİLİĞİNİN TEMEL GEREKSİNİMLERİ, BİLEŞENLERİ VE VERİ DEPOLARI 37
3.1. Veri Ambarları ve Tarihçesi 39
3.2. Veri Akışı ve Bileşenleri 44
3.3. Veri Ambarları ve Çevrimiçi Analitik İşleme (OLAP – On Line Analytical Processing) 47
3.4. Çok Boyutlu Çevrimiçi Analitik İşleme (MOLAP) 52
3.5. İlişkisel Çevrimiçi Analitik İşleme (ROLAP) 53
4. BÖLÜM: VERİ MADENCİLİĞİ AŞAMALARI 55
4.1. Problemin veya Projenin Tanımlanması 57
4.2. Verilerin Anlaşılması ve Hazırlanması 58
4.2.1. Verilerin Toplanması 58
4.2.2. Verilerin Temizlenmesi 58
4.2.3. Verilerin Bütünleştirilmesi 59
4.2.4. Verilerin Dönüştürülmesi 59
4.2.5. Verilerin İndirgenmesi 59
4.3. Modelin Kurulması 59
4.4. Modelin Değerlendirmesi 62
4.5. Model Sonuçlarının Karar Verici Tarafından Kullanılması 63
4.6. Modelin İzlenmesi 63
5. BÖLÜM: VERİ MADENCİLİĞİ MODELLERİ 65
5.1. Tahmin Edici Amaçlı Modeller 65
5.1.1. Bayes Sınıflandırma Algoritması 67
5.1.2. Genetik Algoritmalar 67
5.1.3. Çoklu Doğrusal Regresyon Analizi 68
5.1.4. Yapay Sinir Ağları 68
5.1.5. Karar Ağaçları 70
5.1.5.1. Karar Ağaçlarında Dallanma ve Budama Kriterleri 71
5.1.5.2. Karar Ağacı Algoritmaları 74
5.2. Kümeleme Amaçlı Modeller 77
5.2.1. Kümeleme Yöntemleri 79
5.2.2. Kümelemede Kullanılan Uzaklıkların Hesaplanması 80
5.2.3. K–Ortalamalar Kümeleme Metodu 83
5.2.4. İki Aşamalı Kümeleme 83
5.2.5. Kohonen Ağları 84
5.3. Birliktelik Kuralları 85
6. BÖLÜM: IBM SPSS MODELER VERİ MADENCİLİĞİ METODOLOJİSİ 87
6.1. IBM SPSS Modeler’de Görsel Programlama Arayüzü 87
6.2. IBM SPSS Modeler Programına Veri Kaynaklarının Bağlantıları 91
6.3. IBM SPSS Modeler Programı ile Veri Hazırlama 115
6.4. Verideki İlişkilerin Araştırılması 137
6.5. IBM SPSS Modeler Programında Kullanılan Modelleme Yöntemlerine İlişkin Örnek Uygulamalar 143
6.5.1. Sınıflayıcı (Öngörüsel) Modellemelere İlişkin Örnek Uygulamalar 143
6.5.1.1. Yapay Sinir Ağı (Neural Network) Uygulama Çalışması 143
6.5.1.2. C5.0 Algoritma Uygulaması 151
6.5.1.3. CRT Algoritması Uygulaması 158
6.5.2. Kümeleyici Yöntemlere İlişkin Örnek Uygulamalar 163
6.5.2.1. K–Means Kümeleme Yöntemine İlişkin Uygulama 163
6.5.2.2. Kohonen Kümeleme Yöntemine İlişkin Uygulama 168
6.5.2.3. İki Aşamalı Kümeleme Uygulaması 175
6.5.3. Birliktelik Kurallarına İlişkin Uygulama 182
6.5.4. APRIORI Algoritmasına İlişkin Uygulama 183
6.5.5. Sınıflayıcı, Kümeleyici ve Birliktelik Kurallarına İlişkin Örnek Uygulama 188
6.5.6. Kümeleyici Modeller, Birliktelik Kuralları ve Sınıflayıcı Modellere İlişkin Örnek Uygulama 205
7. BÖLÜM: WEKA İLE VERİ MADENCİLİĞİ 223
7.1. Weka ile Veri Madenciliği ve Algoritmaları 223
7.2. Weka ile Veri Dosyası Çağırımı 225
7.3. WEKA ile Veri tabanı Bağlantıları 226
7.3.1. WEKA Programından Excel Dosyalarının Okutulması 230
7.4. Weka Veri Madenciliği Arayüzü 234
7.4.1. Explorer Uygulaması 235
7.4.1.1. Verilerin Hazırlanması 236
7.4.1.2. Sınıflayıcı Algoritmaları 237
7.4.1.3. Kümeleyici Algoritmaları 240
7.4.1.4. Birliktelik Kuralları Algoritmaları 243
7.4.1.5. Öznitelik Seçimi 245
7.4.1.6. Görselleştirme 245
7.4.2. “Experimenter” Uygulaması 247
7.4.3. “Knowledge Flow” Uygulaması 248
7.4.4. Simple CLI (Komut Satırı) 249
7.5. WEKA Örnek Uygulama Çalışması–1 250
7.6. WEKA Örnek Uygulama Çalışması–2 263
7.7. WEKA Örnek Uygulama Çalışması–3 268
8. BÖLÜM: STATISTICA DATA MINER, MICROSOFT DATA MINING ADD–INS–EXCEL, RAPIDMINER, WEKA VE IBM SPSS MODELER VERİ MADENCİLİĞİ PROGRAMLARI İLE UYGULAMA 275
8.1. Microsoft Data Mining Add–ins Excel Uygulaması 276
8.2. Rapid–I RapidMiner Uygulaması 281
8.3. Statsoft Statistica Veri Madenciliği Uygulaması 285
8.4. WEKA Uygulaması 288
8.5. IBM SPSS Modeler Uygulaması 292
9. BÖLÜM: VERİ MADENCİLİĞİNİN GENEL DEĞERLENDİRİLMESİ 297
Kaynakça 299 |