Yolsuzluklarla Mücadelede Veri Madenciliği
Hasan BAĞCI
İç Denetçi
Dışişleri Bakanlığı
Giriş
Bilgi ve teknolojinin yoğun olarak kullanıldığı çağımızda bilgisayarların ve sayısal teknolojilerin gelişmesiyle birlikte akıl almaz derecede veri birikimi meydana gelmiş, otomatikleştirilmiş sistemler vasıtasıyla mevcut veri yığınları arasından anlamlı ilişkilerin, kalıpların ve eğilimlerin ortaya çıkartılması ihtiyacı doğmuş, gelecek adına sağlıklı tahminlerin yapılması önem kazanmıştır. İşte bu tür ihtiyaçların doğduğu noktada, istatistiksel analiz ve modellemeler ile yapay zeka “artificial intelligence” tekniklerini kullanan veri madenciliği “data mining” uygulamaları devreye girmiştir. Bilimsel veritabanlarının ve ağ sistemlerinin geliştirilmesiyle birlikte bankacılık, finans, ekonomi, sağlık, adli suçlar, güvenlik ve savunma gibi pek çok alanda veri madenciliği teknikleri geliştirilmeye başlanmış, tahmin analizleri, modellemeler ve yapay zekâ teknikleri alanlarında ciddi ilerleme kaydedilmiştir.
Yolsuzluk olayları nedeniyle kurumlar büyük kayıp ve zararlara uğramakta, toplumun kurumlara duyduğu itibar ve güven ciddi şekilde sarsılmaktadır. Yolsuzluklarla mücadele, geniş bir alanda eldeki araçların etkili kullanımını esas alan istatistik ve yapay zekâ tekniklerinin yoğun bir şekilde kullanıldığı bilgi yoğunluklu karmaşık bir süreçtir. Yolsuzluk ve yolsuzlukla ilgili aktiviteler hakkındaki deliller, muazzam miktardaki veriler arasında parçalar halinde gizlenmiş bulunduğundan, veri madenciliği teknikleri yolsuzlukları önlemede etkili bir mücadele vermeyi sağlamakta, yolsuzluk yapanların delilleriyle birlikte yargıya teslim edilmesini kolaylaştırmaktadır. Ayrıca veri madenciliği tekniklerinin kullanılmasıyla, büyük boyuttaki veriler üzerinde hızlı kontroller yapılarak kurumlardaki veritabanının %100 oranında denetlenmesi, denetimlerde daha fazla etkinlik ve verim artışının sağlanması mümkün olmaktadır.
Veri madenciliğinin ortaya çıkışı
Bilgisayar sistemlerinin gelişmeye devam ettiği, güçlü bilgisayarların kullanıldığı, işlemci hızlarının ve disk kapasitelerinin arttığı, bilgi ve teknolojinin yoğun olarak kullanılmaya başladığı çalışma hayatında, bilgisayarlar büyük miktardaki verileri saklayabilmekte ve kısa sürede pek çok işlemi yapabilmektedir. Bilgisayarların gelişmesine paralel olarak sayısal teknolojiler gelişip geniş bir alanda kullanılmaya başlanmış, bu sayede verilerin sayısal olarak toplanıp saklanması imkânı doğmuştur. Ayrıca bilgisayar ağlarındaki gelişme sayesinde başka bilgisayarlardaki bilgilere rahatça ulaşılabilme imkânı doğmuş, teknolojik gelişmelerin veri birikimini akıl almaz seviyelere ulaştırmasıyla çok kısa sürede binlerce yılda biriken bilgiden daha fazla bilgi birikimi meydana gelmiştir.
Daha önceki dönemlerde özel veya kamu kuruluşlarının sunmuş olduğu hizmetlerde basit fonksiyonlar icra eden cihazlar kullanılmakta ve bu cihazların büyük bir kısmı basit bir hesap makinesi fonksiyonu görmekteydi. Ancak teknolojik gelişmeyle birlikte bilgisayarlar ve bilgisayar fonksiyonu icra eden cihazlar hizmet sunumunun gerçekleştiği noktalardaki terminallere entegre edilerek, sunulan hizmetlere ilişkin detaylı bilgilerin elde edilmesi sağlanmış, elde edilen bilgiler sayesinde kişi ve kuruluşların zaman içindeki hareketlerine ve kişisel bilgilerine ulaşmak mümkün olmuştur.
Kurumlara ait veritabanlarında milyonlarca kişiye ait bilginin depolandığı, bu kişilerin kurumlara ait değişik türdeki hizmetlerden faydalandığı düşünülünce, biriken verilerle birtakım analizlerin otomatikleştirilmiş sistemler vasıtasıyla yapılmasının gerekliliği ortaya çıkmıştır.
Kuruluşların daha iyi hizmet sunabilmek ve kaynaklarını optimum seviyede kullanabilmek için; veri yığınları arasından anlamlı ilişkilerin, kalıpların ve eğilimlerin araştırılıp ortaya çıkartılması ihtiyacı doğmuş, mevcut verilerden ileriye yönelik tahminlerin yapılmasını imkan sağlayan tekniklerin geliştirilmesi gerekmiştir. İşte bu tür ihtiyaçların doğduğu noktada veri madenciliği uygulamaları devreye girmektedir.
Veri Madenciliği Nedir?
Genel anlamda veri madenciliği; veri yığınları arasından istatistik ve matematik teknikleri kullanılarak verilerdeki gizli örüntüleri çözmeye yarayan, fark edilmesi güç ilişkileri açığa çıkaran, ileriye yönelik tahminler yapılmasını sağlayan ve bu alanda kurallar üreten veri tabanı teknolojisi ve tekniklerinin uygulamasını ifade etmektedir. İlk defa veri madenciliğinin kullanılmaya başladığı, ayrıca veri madenciliği alanında en gelişmiş teknik ve teknolojilerin kullanıldığı ABD’de, kamu kurumları tarafından raporlar hazırlanmakta ve veri madenciliği hakkında çok geniş tanımlamalar yapılmaktadır. ABD’deki kamu kuruluşlarının veri madenciliği hakkında yapmış olduğu tanımlardan bazılarına aşağıda yer verilmiştir.[1]
- The Government Accountability Office (GAO) tarafından 2004 Mayıs ayında yayınlanan “Veri Madenciliği” başlıklı raporda veri madenciliği şu şekilde tanımlamıştır: İstatistiksel analiz ve modellemelere ait teknik ve teknolojilerin yardımıyla, çok geniş bir alanda kullanılan veri tabanındaki bilgilerden, veriler içerisine gizlenmiş kalıpları, güç algılanabilecek ilişkileri ve kuralları fark edip gelecek adına tahminlerde bulunmamıza imkân veren uygulamalardır.
- The Congressional Research Service (CRS) 2007 Ocak ayında yayınladığı “Veri Madenciliği ve Ülke Güvenliği” başlıklı raporuyla veri madenciliğini şu şekilde tanımlamıştır: Genel bir terim olarak gözden geçirme anlamında kullanılan veri madenciliği, çok gelişmiş ve karmaşık veri analizi araçlarını kullanarak geniş veri setleri içerisinden önceden bilinmeyen olgu ve olayları keşfetmeyi, mantıklı kalıp ve ilişkileri elde etmeyi ifade etmektedir. Raporda veri madenciliği keşif yaklaşımıyla ele alınmakta, veriler içindeki ilişkilerin ve belli kalıpların teşhis edilmesi, algoritmanın gözden geçirilmesi üzerinde durulmaktadır. Bu metodun analitik araçlardan en ayırt edici özelliği “doğrulama esaslı yaklaşımı” ele alması, yani kullanıcıların hipotezlerini test edebilmeleri için önce varsayım geliştirip sonrada mevcut verilerin kullanılmasına olanak sağlamasıdır.
- The DHS Office of the Inspector General (DHS OIG) 2006 Ağustos ayı teftiş raporunda DHS, veri madenciliği faaliyetleri hakkında basitçe şu tanımlamayı yapmıştır: Bilgilerin keşfedilme süreci, tahmin modellemeleri ve analizlerdir. Geleneksel bir ifadeyle veri madenciliği, yapılandırılmış veri tabanları içinde yer alan tarihsel olaylar içindeki ilişki ve kalıpların keşfedilmesini kapsamaktadır.
Veri madenciliği ile ilgili olarak CRS Ocak 2007 raporundaki tanımlama diğer kurumlar tarafından yapılan tanımlamaları da kapsamaktadır.
Veri madenciliği ülkelerdeki güvenlikle ilgili pek çok karar merciinin başlıca özelliği haline gelmiştir. Veri madenciliği yolsuzlukların denetimi, risklerin değerlendirmesi, ürünlerin perakende olarak satışı gibi alanlarda, geniş veri tabanları arasından veri analiz araçlarını kullanılarak daha önceden bilinmeyen mantıklı ilişki ve kalıpların bulunup ortaya çıkarılması amacıyla kullanılmaktadır. Ülke güvenliği bağlamında, para transferi ve iletişim gibi terörist aktivitelerin tanımlanmasında veri madenciliği tekniklerinden yararlanılmakta, telekomünikasyon, seyahat, nakliye, kargo ve göçmenlik bürolarına ait kayıtlar arasından terörist faaliyetlere ilişkin bireysel izlerin tanımlanmasında veri madenciliği teknikleri kullanılmaktadır.
Veri madenciliği uygulamaları kamu ve özel girişim sektörlerinde artarak devam etmektedir. Bankacılık, sigortacılık, otomotiv, kimya, perakendecilik gibi sektörlerde maliyetleri düşürmek, satışları artırmak ve araştırma-geliştirme çalışmalarını daha etkin kılmak için veri madenciliği uygulamalarından faydalanılmaktadır.
Veri madenciliği tekniklerinden kimler faydalanıyor?
Pek çok kuruluş geniş miktardaki veriler arasından anlamlı ilişkiler elde edebilmek için veri madenciliği yazılımlarına başlamışlardır. Suç aktivitelerinin yerini saptamak, yolsuzlukları ortaya çıkarmak, müşteri hizmetlerini geliştirmek, israf ve kötü kullanımı önlemek gibi değişik amaçlara yönelik yazılım çalışmaları geliştirilmektedir.
Kamu sektöründe, ilk önceleri veri madenciliği uygulamalarına yolsuzluk ve israfın kontrolü amacıyla başlanmış, fakat ölçme ve değerlendirmeyle ilgili performans programlarının geliştirilmeye başlanmasıyla veri madenciliği farklı boyutlara ulaşmıştır. Bununla birlikte ülke güvenliğine ilişkin alanlarda, veri madenciliği uygulamaları açısından analiz edilecek verilerin miktar ve konusu önemli derecede genişlemiştir. Ülke güvenliğine ilişkin olarak ABD’de, çok devletli anti terörizm bilgi değişim programları (Multi-State Anti-Terrorism Information Exchange), otomatik hedeflendirme sistemleri (Automated Targeting System), terörizm bilgilendirme ve uyarı sistemleri, bilgisayar destekli yolcu ön izleme sistemi ve uçuş güvenliği sistemi gibi pek çok alanda veri madenciliği uygulamalarından faydalanılmaktadır. Ayrıca toplanan bilgiler ve analiz edilmiş projeler Ülke Güvenlik Ajansına (National Security Agency – NSA) ulaştırılmaktadır.
Bilimsel veritabanlarının ve ağ sistemlerinin geliştirilmesiyle birlikte bankacılık, finans, ekonomi, sağlık, adli suçlar, güvenlik ve savunma gibi pek çok alanda veri madenciliği teknikleri geliştirilmeye başlanmış, tahmin analizleri, değişim analizleri, sınıflandırma, genel kavram/sınıf tanımlaması alanlarında ciddi ilerleme kaydedilmiştir.
Günümüzde hem kamu kurumları hem de özel kuruluşlar veri madenciliği tekniklerine doğru yönelmektedir. Örneğin ABD’deki Ülke Güvenliği Birimi (The Homeland Security Department) sınırdaki insanları izlemek ve yasa dışı göç olaylarını kontrol etmek için ticari firmalardan müşteri bilgilerini satın almakta, ABD’nin askeri kuruluşu Pentagon ise askere alınmayla ilgili olarak askerlik çağına gelmiş gençler hakkında bilgi derlemek için özel şirketlere para ödemektedir. Bununda ötesinde federal istihbarat servisleri ticari piyasada oluşan muazzam miktardaki müşteri bilgilerini derinlemesine araştırmak ve ülke güvenliğini sağlanmak için özel şirketlerde biriken müşteri bilgilerini satın almaktadır.
Kamu kurumları tarafından toplanması oldukça zor olan, ancak özel şirketlerin gündelik faaliyetleri sonucu biriken, satın alma alışkanlıkları ve mali kayıtlar hakkındaki veriler istihbarat servisleri tarafından toplanmaktadır. 11 Eylül saldırısından itibaren ABD Hükümeti özel sektördeki kişisel verileri satın almak ve veri madenciliğine yönelik yazılım programları geliştirmek için ciddi miktarda harcama yapmakta, kamu bütçelerine bu tür harcamalar için her yıl artan miktarda ödenek ayırmaktadır.[2]
Veri madenciliğinin denetime katkısı nedir?
Veri madenciliği tekniklerinin kullanılmasıyla, bilgisayarlardaki mevcut programlar (Excel v.b.) vasıtasıyla yapılması mümkün olmayan büyük boyuttaki veriler üzerinde hızlı kontrollerin yapılması, kurumlardaki veritabanının %100 oranında denetlenmesi, daha kapsamlı ve daha çok veri ile denetimlerin yapılması mümkün hale gelmiştir.
Veri madenciliği ile denetimlerde verimlilik artışı sağlanmakta, denetim yöntemleri standart hale gelmekte, tekrarlayan işlemler otomatik hale getirilerek denetlenmekte, insan gücü ve zamandan tasarruf sağlanmakta, daha etkin ve verimli denetimlerin yapılması mümkün olmaktadır.
Yolsuzlukları önlemede veri madenciliği
Yolsuzluk, kontrolü ve önlenmesi zor olan önemli bir problemdir. Yolsuzlukların ortaya çıkarılması kolay olmamakta, yolsuzluk olaylarının her birinin titiz, kapsamlı ve hızlı algoritmalar yardımıyla doğru bir şekilde tanımlanması gerekmekte, ayrıca her yolsuzluk olayına ilişkin ayrı bir sınıflandırma gerekmektedir. Çalışma hayatında görülen yolsuzluk suçları – daha nazikçe bir ifadeyle ekonomik suç – beyaz yakalıların işleyebileceği türden suçlardır. Gayet iyi bilinmektedir ki özel veya kamuya ait pek çok kuruluşun özellikle mali konularla ilgili yolsuzluklarla başı derttedir. Yolsuzluklar neticesinde dünya genelinde her yıl milyarlarca dolarlık kayıplar yaşanmaktadır.
Pek çok işlemin elektronik ortamda ve kablolar vasıtasıyla gerçekleştirildiği günümüzde, yolsuzlukların klasik yöntemlerle önlenmesi imkânsız hale gelmiştir. Yolsuzluk olgusu sürekli değişen ve duruma göre uyarlanabilen bir suç çeşidi olduğu için, yolsuzluğu ortaya çıkarabilecek ve önleyebilecek kabiliyette tasarlanmış veri analiz metotları kullanılmalıdır. Pek çok kurum ve kuruluş değişik alanlardaki yolsuzluk suçlarının tespitinde, uygulanabilir ve mükemmel çözümler üreten metotların geliştirilmesine çalışmaktadır. Bu bağlamda veri madenciliği, veritabanındaki bilginin keşfedilmesi “knowledge discovery in databases”, istatistik ve öğrenme makinesi “machine learning and statistics” gibi alanlarda değişik metotlar geliştirilmektedir.
Teknolojik ilerleme ve gelişen sistemler yardımıyla her türden iş ilişkileri ve aktiviteler hakkında muazzam bir veri birikimi oluşmuş, veri ambarları ve ortak hafıza sistemlerinin (corporate memory systems) kurulmaya başlamasıyla, hem tarihi hem de güncel ticari verilere ulaşmak mümkün olmuştur. Yolsuzluk ve yolsuzlukla ilgili aktiviteler hakkındaki deliller, muazzam miktardaki veriler arasında parçalar halinde gizlenmiş bulunmaktadır. Veri analiz teknikleri yolsuzlukları önlemede etkili bir mücadele vermeyi sağlayacak, kayıpları önleyecek ve yolsuzluk yapanların delilleriyle birlikte yargıya teslim edilmesini kolaylaştırabilecektir.
Yolsuzluklarla mücadele aşağıda belirtilen aktiviteleri tam olarak kapsamalıdır.
- Erken uyarı ve alarm,
- Yolsuzluğa ait değişik tipteki bulgu ve kalıpların ihbarı,
- Kullanıcı ve aktivite profilleri,
- Yolsuzlukları araştırma, önleme ve sakındırma,
- Yanlış alarmların minimize edilmesi ve müşteri memnuniyetsizliğinden kaçınılması,
- Kayıpların değerlendirilmesi, risk analizleri,
- Gözetim ve izleme,
- Güvenlik (bilgisayarların, verilerin, ağ sisteminin ve fiziki araçların güvenliği),
- Veri ve kayıt yönetimi, elektronik ortamdan ve diğer kaynaklardan delillerin toplanması,
- Yönetim bilgi sistemleri ve operasyon sistemleri için linkler (muhasebe ve faturalama gibi),
- Kontrol faaliyetleri (kovuşturma, personel eğitimi, etik programları, direkt telefonlar, partnerlerle işbirliği ve icracı kurumlar).
- Raporlar, özetler, veri görüntülemeleri,
Sistem yönetimine ilişkin olarak yolsuzluklarla mücadele görevinin zorluk derecesini işaret eden bazı kritik konular.
- Muazzam miktardaki ve kompleks yapıdaki verinin varlığı,
- İş aktivitelerinin, yolsuzluğu gerçekleştirenlerin ve kullanıcıların davranışlarındaki sürekli değişim,
- Yolsuzluğu ortaya çıkarmada kullandığımız mevcut tekniklerin sürekli değişen yolsuzluk teknikleri karşısında hiçbir şekilde bypass edilememesi,
- Yolsuzlukları hızlı ve doğru bir şekilde önleme ihtiyacının iş akışını gereksiz yere kesintiye uğratıp aksatmaması,
- Riskler veya yanlış alarmlar,
- Özel hayatın gizliliği gibi sosyal yaşamı ilgilendiren konular.
Yolsuzluk Denetiminde Kullanılan Veri Analiz Teknikleri Nelerdir?
Ticari işlemlerin kablolar vasıtasıyla gerçekleştirildiği günümüzde yolsuzluk önemli bir fenomen haline gelmiştir. Veri madenciliği bağlamında yolsuzluklarla mücadele; geniş bir alanda eldeki araçların etkili kullanımını esas alan istatistik ve yapay zekâ tekniklerinin yoğun bir şekilde kullanıldığı bilgi yoğunluklu karmaşık bir süreçtir.
Yolsuzluğu önlemede ticari mahiyette pek çok araç geliştirilmiş ve değişik türde farklı teknikler kullanılmaya başlanmıştır. Ancak yolsuzluk türlerinin tamamıyla mücadele etmemize yarayan entegre edilmiş bir araç bulunmamaktadır. Yolsuzlukların ortaya çıkarılmasında iki tür teknik kullanılmakta olup, bunlar istatistiksel teknikler ve yapay zekâ teknikleridir.
a) İstatistiksel veri analiz teknikleri
Yolsuzluklarla mücadelede kullanılan istatistiksel veri analiz tekniklerinden önemli olanları şunlardır.
- Yolsuzlukları ortaya çıkarmak için veri önişlemci teknikleri, onaylama teknikleri, hata düzeltme teknikleri, eksik veya yanlış verileri doldurma teknikleri,
- Hesaplamalar için değişik türden ortalama alma, sıklık derecesi, performans metre, olasılık dağılımı v.b. istatistikî parametreler (Örneğin ortalama yöntemiyle telefon aramalarının ortalama süreleri, aylık veya günlük aranan numara sayısı, ödemesi geciken ortalama fatura sayısı),
- Değişik iş aktivitelerinde model veya ihtimal dağılımları belirleme, değişik parametre dönemlerinde veya olasılık dağılımlarında iş aktiviteleri belirleme teknikleri,
- Kullanıcı profillerini hesaplama (kullanıcıların sınıflandırılması ve değişik kategorilerdeki düzenlemeler) ve bu profillerin istatistiksel karakterlerini belirleme (parametre dönemleri, ihtimal dağılımları v.b) teknikleri,
- Zamana bağlı verilerde zaman serileri analizleri,
- Veri kalıpları ve veri grupları arasındaki birlikleri bulmak için kümelendirme ve sınıflandırma teknikleri,
- Algoritma birleştirmeleri yöntemiyle, önceden bilinen model ve profillerle karşılaştırma yaparak, işlemcilerdeki veya kullanıcılardaki davranış sapmalarını ortaya çıkarma teknikleri,
- Risk değerlendirme teknikleri,
- Mevcut işlem veya kullanımlardan gelecek tahminleri yapma teknikleri.
Bunlara ilaveten iş yaşamındaki verilerin ve faaliyetlerin yapısını hızlı bir şekilde anlamamıza yarayacak ve personel gözetiminde yardımcı olacak destek araçları da mevcuttur. Bu araçlar; önceden hazırlanmış sorgular, rapor özetleri, değişik formlardaki verilerin görselleştirilmesi, erken uyarı göstergelerine ait filtre yazılımları, alarm durumu v.b. araçlar şeklinde sıralanabilir. Genellikle bu teknikler bireysel uzmanlık ve aktif katılım gerektirmektedir. Ayrıca, bu teknikler bir tür tekrarlanan yol içinde kullanılmakta, şüpheli işlemin ilk tanımlandığı yeri, kurbanları, şüphelileri ve diğer yöntemleri öğrenme amaçlı olarak daha ileri düzeyde soruşturma yapmak ve delil toplamak amacıyla kullanılmaktadır.[3]
b) Yapay zekâ teknikleri
Yolsuzluklarla mücadele bilgi yoğunluklu bir aktivitedir. Bundan dolayı, yapay zekâ tekniklerinden bilgi tabanlı tekniklerin uygulanması en doğal yöntemdir. Yolsuzluklarla mücadelede kullanılan yapay zekâ tekniklerinden önemli olanları şunlardır.
- Veri madenciliği alanında kullanılan sınıflandırma, kümelendirme, verileri parçalara ayırma, veriler içindeki birlikleri ve kuralları otomatik olarak bulma, ilginç kalıpları bildirme gibi konuları kapsayan teknikler,
- Yolsuzlukları ortaya çıkarmada şifreleri çözmeye yönelik olarak hazırlanmış sistemler,
- Belli kuralar manzumesi içindeki yolsuzlukları denetlemek için hazırlanan uzmanlaşmış şifreleme sistemleri,
- Tahmin analizlerini kullanarak ilişki kalıplarını tanımlama, sınıflandırma, kümeleme, özetleme, optimizasyon, şüpheli davranışları otomatik olarak (denetim olmaksızın) ayırt etme ve verilen girdileri birleştirip ilişkileri tanımlama teknikleri,
- Belli vasıftaki yolsuzlukları otomatik olarak tanımlayan öğrenen makineler tekniği,
- Çeşitli kaynaklardan gelen bilgilerin tümünü birden aynı anda işleme tabi tutarak, belli tipteki şüpheli ilişkileri model kalıplarından öğrenebilen ve bunları daha sonra denetlemek için kullanan yapay sinir ağları (neural network),
Bunlara ilaveten yolsuzlukları denetlemek için geliştirilmiş Bayesian ağları (Bayesian Networks), karar ağaçları (deciasion trees), kendi kendine organize olan ağlar (self organazing maps) ve dizi birleştirme gibi diğer teknikler de kullanılmaktadır.[4]
Veri madenciliği alanındaki sınırlamalar ve sorunlar
Veri madenciliği mevcut elde edilebilir araçlar içerisinde önemli bir ilerleme iken, uygulamada bazı sınırlamalar mevcuttur. Veri madenciliği bazı ilişki ve kalıpların ortaya çıkarılmasını yardım ederken, kullanıcılara bu ilişki ve kalıpların değerini veya önemini belirlememesi sınırlayıcı etki olarak görülmektedir. Bu türden belirlemeleri kullanıcıların kendisi yapmak zorundadır. Diğer bir sınırlama ise veri madenciliği davranışlar arası ilişkiyi ve/veya değişkenliği tanımlayabilirken, ilişkilerin sebeplerini tam olarak tanımlayamaz. Başarılı bir veri madenciliği için analiz yapabilecek ve çıktıları yorumlayabilecek teknik kabiliyet ve analitik uzmanlık gerekmektedir.
Veri madenciliği yazılımlarını yapan kuruluşlarla ve veritabanının sahibi ve kullanıcısı olan kuruluşların farklı kuruluşlar olması durumunda, veri madenciliğinin birlikte işlerliği sorunu ortaya çıkmaktadır. Veri madenciliği alanında karşılaşılan ve üzerinde en çok tartışılan konu ise, verilerin biriktiriliş amacından farklı bir biçimde kullanılıyor olmasıdır. Veri kaynaklarının verilerin oluşturulma amacından farklı bir şekilde kullanılması, özel hayatın gizliliği (mahremiyet) ilkesinin çiğnendiği iddialarını gündeme getirmektedir.[5]
Veri gözetimi “data surveillance” veya veri madenciliği olarak adlandırılan bu aktivitelerden beklenen sonuçların alınabilmesi için gözetim faaliyeti ile özel hayatın gizliliği prensibi arasındaki dengenin iyi ayarlanması gerekmektedir.
Veri madenciliği ile veriler arasındaki saklı kalıpların ve güç algılanan ilişkilerin ortaya çıkarılması, geleceğe yönelik tahminlerin daha sağlıklı yapılması veri madenciliği alanındaki sınırlamaların ve sorunların minimum seviyeye indirilmesiyle mümkün olacaktır.[6]
Sonuç
Bilgisayar sistemlerinin gelişmeye devam ettiği, güçlü bilgisayarların kullanıldığı, işlemci hızlarının ve disk kapasitelerinin arttığı, bilgi ve teknolojinin yoğun olarak kullanılmaya başladığı çalışma hayatında, bilgisayarlar büyük miktardaki verileri saklayabilmekte ve kısa sürede pek çok işlemi yapabilmektedir. Kuruluşların daha iyi hizmet sunabilmek ve kaynaklarını optimum seviyede kullanabilmek için; veri tabanlarındaki veri yığınları arasından anlamlı ilişkilerin, kalıpların ve eğilimlerin araştırılıp ortaya çıkartılması, kurumsal ihtiyaçlara yönelik tahminlerin yapılması önem kazanmıştır. Bunun yanında daha kapsamlı ve daha çok veri ile denetimler yapılarak kurumlardaki veritabanının %100 oranında denetlenmesi, yolsuzluklardan kaynaklanan kurumsal kayıp ve zararların minimum seviyeye indirilmesi gerekmektedir. Kuruluşların gerek yolsuzluklarla mücadelede, gerekse daha iyi hizmet sunabilmek ve kaynaklarını optimum seviyede kullanabilmek için; ellerindeki veri yığınlarını optimum düzeyde değerlendirmeleri, veri madenciliği alanında geliştirilen teknik ve teknolojilerden azami derecede faydalanmaları gerekmektedir.
Kaynaklar:
[1] 2007 Data Mining Report-DHS Privacy Office Response to House Report 109-699 – 2007 Report to Congress on the Impact of Data Mining Technologies on Privacy and Civil Liberties – Respectfully submitted – Hugo Teufel III – Chief Privacy Officer – U.S. Department of Homeland Security – Washington, DC – July 6, 2007
[2] Bryda, Grzegorz. “Using Data Mining for Fraud Detection: New Methods for Crime Control and Public Safety” Paper presented at the annual meeting of the The Law and Society Association, TBA, Berlin, Germany, Jul 24, 2007 http://www.allacademic.com/one/www/www/index.php?
[3] The Hidden Truth -Data analysis can be a strategic weapon in your company’s management and control of fraud – By Girish Keshav Palshikar http://www.intelligententerprise.com/020528/509feat3_1.jhtml;jsessionid
[4] The Hidden Truth -Data analysis can be a strategic weapon in your company’s management and control of fraud – a.g.e
[5] Opencrs -Congressional Research Reports fort he People -Data Mining and Homeland Security: An Overview- 03.04.2008 http://opencrs.com/document/RL31798/
[6] Bryda, Grzegorz. “Using Data Mining for Fraud Detection: New Methods for Crime Control and Public Safety” Paper presented at the annual meeting of the The Law and Society Association, TBA, Berlin, Germany, Jul 24, 2007 http://www.allacademic.com/one/www/www/index.php?