KAYIP VERİ ANALİZİNDE SIKLIKLA KULLANILAN ETKİN YÖNTEMLERİN DEĞERLENDİRİLMESİ

Arzu Baygül, Yüksek Lisans Tezi, 2007


Kayıp veri analizi araştırmacıların çok sık karşılaştıkları kayıp değer sorununa çözüm getirmeyi amaçlayan yaklaşımları içerir. Bu yaklaşımlar Silme (Liste/Durum Düzeyli, Çiftler Düzeyinde) ve Atama (Regresyon, Hot/Cold Deck, Beklenti Maksimizasyonu, Son Gözlemi İleri Taşıma, Çoklu Atama) olmak üzere farklı yöntemlerden oluşur.

Bu çalışmadaki amaç kayıp veri analizi yöntemlerini inceleyerek, üretilen sanal veri setinde oluşturulan kayıplar üzerinde bu yöntemleri uygulamak ve elde edilen sonuçları gerçek sonuçlar çerçevesinde irdeleyerek en verimli yaklaşımlara ilişkin bilgi edinmektir.

Uygulamamızda bu yöntemlerin anlamlı bir farklılık göstermediği görülmüş, ancak farklı veri setleri, farklı oranda kayıplar, önce ve sonra değerleri arasındaki anlamlılığın sınıra yakın olması gibi çeşitli durumlarda yine aynı kayıp veri analizi yaklaşımlarının farklılık gösterebileceği anlaşılmıştır.

Sonuç olarak kayıp veri analizi yöntemleri gerek silme, gerekse atama yaklaşımları olsun veri setine uygun bir şekilde kullabıldığında anlamlı sonuçlar vermekte ve özellikle tıp gibi veri toplamanın zahmetli olduğu alanlarda araştırmacılar için çok büyük bir sorun olan kayıp değer sorununa bilimsel çözümler sunmaktadır.

Anahtar Kelimeler: Kayıp Veri Analizi, Son Gözlemi İleri Taşıma, Silme Yöntemleri, Regresyon Ataması, Atama Yöntemleri