Strigus Web Analiz Motoru

Web kullanım madenciliği süreci iki yaklaşıma göre hareket etmektedir. Birinci yaklaşım, bir veri madenciliği tekniği uygulamadan, öncelikle ilişkisel tabloların içerisine web sunucunun kullanım verisinin planını yapmaktır. İkinci yaklaşım ise, özel veri temizleme teknikleri kullanarak doğrudan günlük veri kayıtlarını kullanmaktır. Tipik veri madenciliği tekniklerini uygulamadan önce veri temizleme işlemleri, veri kalitesini arttırmak için çok önemli bir rol oynamaktadır. Web kullanım madenciliğinin üst seviyedeki işlemlerin uygulama adımları ön işlem, örüntü keşfi ve örüntü analizi olmak üzere 3 kısımda incelenmektedir. Ön işlem: Web sunucu üzerinde kayıtları tutulan kullanıcı erişim kütükleri, karmaşık, düzensiz ve herhangi bir anlam ifade etmeyen metinler şeklinde bulunmaktadır. Bu erişim kütük dosyalarındaki veriler içerisinden, analiz değeri olmayan ilişkisiz alanların arındırılması, ayıklanması ve belirli bir düzene getirilerek veri tabanına aktarılması gibi işlemler karmaşık ve çok zor olan bir ön işlem sürecidir. Bu süreçte önemli olan veri kaynağından alınan verilerin işlenirken değerlerin ve bilgilerin orijinalliğini koruması, anlamlı ve doğru sonuçların üretilebilmesi için başarılı veri tablolarının oluşturulmasıdır. Web kullanım madenciliğinin karmaşık ve zor olan bu ilk aşamasında, verilerin düzenlenmesi kaydı tutulan erişim kütüklerinin içeriğine göre farklılık göstermektedir. Örüntü keşfi: Örüntü keşfi aşamasında, düzenli ama anlamsız olan verilerden, veri madenciliği yöntemlerini kullanarak istenilen faydalı ve gerekli bilgilerin ortaya çıkarılmasını gerçekleştirilmektedir. Şekil 2’de görüldüğü gibi web kullanım madenciliği örüntü keşfi aşaması için kullanılan birçok yöntem bulunmaktadır. Bu yöntemlerden, istatistiksel analiz, birliktelik kuralları, kümeleme, sınıflandırma, sıralı örüntüler ve bağımlı modelleme gibi yöntemler yaygın olarak kullanılmaktadır. Literatürde, bu yöntemlerin anlatıldığı ve yapılan çalışmalarda kullanıldığı birçok akademik çalışma bulunmaktadır. Örüntü Analizi: Son aşama olan örüntü analizi sürecinde, örüntü keşfi aşamasında elde edilmiş ilginç olmayan kuralların, istatistikî bilgilerin ya da örüntülerin filtrelenmesidir. Yaygın olarak kullanılan bilgi sorgulama mekanizmaları SQL, MySQL gibi veritabanı uygulamaları ile On-Line Analytical Processing (OLAP) uygulamaları bu aşamada gerçekleştirilmektedir....

devam