Publication: Çok Değişkenli Veri Analizi İçin Robust Metotların İncelenmesi
Abstract
ÖZET Bu çalışmada çok değişkenli veriler için önerilen klasik ve robust parametre tahmin metotları üzerine araştırma ve uygulamalar yapılmıştır. Klasik metotların, veri setlerinde aykırı gözlemler olması durumunda istenilmeyen sonuçlar vermesi üzerine robust metotlar önerildiği bilinmektedir. Robust metotlar, veri setinde aykırı gözlem veya gözlem grupları olması durumunda klasik metotlara göre daha elverişli ve kullanışlı sonuçlar vermekte ve aynı zamanda bu aykırı gözlemlerin tespitinde de önemli rol oynamaktadır. Bu çalışmada integrallenmiş karesel hata kriteri veya L_2 uzaklığının robust parametre tahmin problemlerine bir çözüm olarak önerildiği ve parametre tahmin metodu olarak başvurulduğu çalışmalar incelenmiştir. Alternatif olarak bu tahmin edici üzerinde, normal dağılımlı çok değişkenli karma modellerde kısmi karışım tahmininde daha uygun sonuçlar elde etmek için değişiklik tanımlanmıştır. Bu tahmin edicilerin diğer robust tahmin metotları ile parametre tahmininde, karma dağılım modeli ile temsil edilen veriler için kümeleme ve sınıflama analizinde karşılaştırılma çalışmaları yapılmıştır.
ABSTRACT In this study, classical and robust paremeter estimation methods for multivarate data are investigated. It is known that robust methods are proposed when classical methods give undesirable results in the presence of outliers in data sets. Robust methods provide more favorable and useful results compared to the classical methods in the presence of outlier or outlier groups in the dataset and also play an important role in detection of outliers. In this study, we investigated the integrated square error criterion or L_2 distance which suggested as solution to the robust parameter estimation problems and applied as a parameter estimation method. Alternatively, a modification to this estimator are introduced to obtain more convenient results on partial mixture estimation for multivariate mixture of normal distributions. Comparison studies with the other robust methods is performed in parameter estimation, classification and cluster analysis for the data sets which represented by mixture distribution model.
ABSTRACT In this study, classical and robust paremeter estimation methods for multivarate data are investigated. It is known that robust methods are proposed when classical methods give undesirable results in the presence of outliers in data sets. Robust methods provide more favorable and useful results compared to the classical methods in the presence of outlier or outlier groups in the dataset and also play an important role in detection of outliers. In this study, we investigated the integrated square error criterion or L_2 distance which suggested as solution to the robust parameter estimation problems and applied as a parameter estimation method. Alternatively, a modification to this estimator are introduced to obtain more convenient results on partial mixture estimation for multivariate mixture of normal distributions. Comparison studies with the other robust methods is performed in parameter estimation, classification and cluster analysis for the data sets which represented by mixture distribution model.
Description
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
137
