Veri Madenciliği - Luhmann
Eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir.
Bilginin analiz edilmesi ve çıkan sonuçların uzman gözüyle yorumlanmasıyla geçmiş verilerden gelecek tahminleri yapma işlemleri gerçekleştirilir.
Tıbbi bir araştırma sonucunda elde edilen verilerin yorumlanıp analiz edilmesiyle bilgiye ulaşılabilmektedir. Büyük bir perakendecinin, fatura bilgilerinden müşteri eğilimlerini belirleyip ona göre pazarlama taktikleri üretebilmesi, rakiplerinin önüne geçmesini sağlayacaktır.
Veri madenciliği eldeki yararsız veriden anlamlı ve kullanışlı bilgi çıkarmaya yarayacak tüm işlemleri formülle analiz etmeye ve uygulamaya yönelik çalışmaların bütününü içerir. Veri madenciliği aslında bilgi keşfi sürecinin bir parçası şeklinde kabul görülmektedir.
1-) Veri Temizleme (Gürültülü ve Tutarsız Verileri Çıkarma İşlemi)
2-) Veri Bütünleştirme (Birçok Veri Kaynağını Birleştirme İşlemi)
3-) Veri Seçme (Yapılacak Olan Analiz İle İlgili Verileri Belirleme İşlemi )
4-) Veri Dönüşümü (Verinin, Veri Madenciliği Tekniği İle Kullanılabilecek Hale Dönüşümü İşlemi)
5-) Veri Madenciliği (Veri Örüntülerini Yakalayabilmek İçin Akıllı Metotları Uygulama İşlemi)
6-) Örüntü Değerlendirme (Bazı Ölçümlere Göre Elde Edilmiş Bilgiyi Temsil Eden İlginç Örüntüleri Tanımlama İşlemi)
7-) Bilgi Sunumu (Madenciliği Yapılmış Olan Elde Edilmiş Bilginin Kullanıcıya Sunumunu Gerçekleştirme İşlemi)
Temel olarak veri madenciliği, veri setleri arasındaki desenlerin ya da düzenin, verinin analizi ve yazılım tekniklerinin kullanılması ile ilgilidir. Veriler arasındaki ilişkiyi, kuralları ve özellikleri belirlemekten bilgisayar sorumludur. Amaç, daha önceden fark edilmemiş veri desenlerini tespit edebilmektir.