BOX-COX YÖNTEMİ İLE NORMALLİK TRANSFORMASYONUNUN SEÇİLMESİ

Arzu ÇALIŞGAN, Hayriye Ertem VEHİD, Özden CALAY

13. Ulusal Biyoistatistik Kongresi, 2011


Varyans analizi, regresyon analizi gibi parametrik testler normallik varsayımına dayanmaktadır. Bir çalışmada elde edilen verilerin tümü (özellikle de küçük örneklem düzeylerinde) parametrik testlerin uygulanması amacıyla normale uygunluk koşuluna ihtiyaç duymaktadırlar. Böyle durumlarda verilere logaritmik, ters, karekök, arcsin gibi transformasyonlar uygulanarak normal dağılıma en yakın seriler (hatta normal dağılan) oluşturulur. Box-Cox transformasyonu George E.P. Box ve David Cox tarafından ilk defa ortaya atılmış olan λ parametreli üstel bir dönüşümdür, normal dağılmayan nicel verilere, optimum λ değeri belirlenip Box-Cox transformasyonu uygulandığında verilerin normal dağılıma yakınsadığını göstermek amaçlanmıştır.

Eldeki verilere farklı λ parametreli (λ=0, 0,5 , 1 , 2, 3 gibi) Box-Cox transformasyonu uygulanarak elde edilen veri setlerindeki çarpıklık ve basıklık ölçütleri normallik çerçevesinde yargılandığı takdirde verileri normal dağılır hale getirmek için uygulanması gereken optimum transformasyonun hangi λ parametresi olduğu gözlenebilmektedir.

Örneğin bir veri seti için λ =0,5 parametreli transformasyon karekök dönüşümüne yakınsadığı için orijinal veri setine karekök dönüşümü uygulanarak elde edilen bu veri setinin çarpıklık ve basıklık ölçütlerinin λ=0,5 parametreli Box-Cox transformasyonu ile karşılaştırıldı. Bu benzetim çalışmasına göre normal dağılım göstermeyen veriler üzerinde teker teker farklı transformasyonları denemek yerine sadece λ parametreleri farklılık gösteren Box-Cox transformasyonu uygulayarak normale en çok yaklaşan λ parametresini bularak o transformasyonu seçmek çalışmalarda pratiklik sağlayacaktır.