Bilgilendirme: Kurulum ve veri kapsamındaki çalışmalar devam etmektedir. Göstereceğiniz anlayış için teşekkür ederiz.

Publication:
Kayıp Veri Analiz Yöntemlerinin Karşılaştırılması

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Research Projects

Organizational Units

Journal Issue

Abstract

İstatistiksel çalışmalarda kayıp veri ile çok sık karşılaşılmaktadır. Kayıp verinin çokluğu örneklem sayısını düşürdüğünden istatistiksel çalışmaları etkiler, testin gücünü azaltır. Kayıp veri çeşitli nedenlerle ortaya çıkabilir. Kayıp veri durumu çalışmayı yürüten kişiden, veri toplanan kişinin bilerek cevap vermemesinden, eksik bilgilendirmeden, verilerin gözlenememesinden, soruların anlaşılamamasından, birimlerin çalışmadan ayrılmasından, kişinin çalışma süresi içinde hayatını kaybetmesi gibi sebeplerden ortaya çıkabilir. Literatürde farklı kayıp veri türleri mevcuttur. Bunlar içinde en sık kullanılan kayıp veri türleri tamamen rastgele kayıp (missing completely at random-MCAR), rastgele kayıp (missing at random-MAR) ve rastgele olmayan kayıp (missing not at random-MNAR) dır. Kayıp veri durumunda genelde kullanılan yöntem kayıp verileri uygun kayıp veri analizi yöntemleriyle tahmin etmek ve tamalanmış veri setini istatistiksel yöntemlerle analiz etmektir. Literatürde çeşitli kayıp veri analizi yöntemleri vardır. Bu yöntemler iki ana başlık altında toplanır. Bunlar; kayıp değer içeren gözlemlerin silinmesini içeren yöntemler ve kayıp değerler yerine uygun değer atayan yöntemlerdir. Kayıp değerli gözlemleri silme yöntemine liste bazında silme (listwise deletion) olarak da adlandırılan eksiksiz veri analizi (complete case analysis) ve çiftler bazında silme (pairwise deletion) yöntemleridir. Kayıp değer yerine değer atayan yöntemler ise ortalama değer atama (mean imputation), regresyon değer atama (regression imputation), EM algoritması (EM algorithm) ve çoklu değer atama (multiple imputation) yöntemleridir. Bu çalışmada kayıp veri setleri için kayıp veri tahmin yöntemleri kullanılarak, elde edilen sonuçlar karşılaştırıldı. Anahtar Sözcükler: Kayıp Veri; Kayıp Veri Analizi; Çoklu Değer Atama;Rastgele Kayıp.
In statistical studies it is encountered with missing data very often. As the multiplicity of missing data reduces the samples in general,the statistical studies are affected and the power of test goes down. Missing data comes out for a variety of reasons such as from researcher,misinformation of people of this study volunteerly,not able to observe data,misunderstanding of questions,inefficient studies of units,passing away of the researcher during the studies. In literature there are different variety of missing data types. Among them the most common used ones are missing at random, missing completely at random and missing not at random. The general method in the event of missing data;guessing the missing data with the correct missing data analysis method and analyse the completed data set by using statistical methods. In literature there are variety of missing data analysis methods. We can collect them under two headings. One of them is the deleting of observations which include missing values and the other one is initializing correct values instead of missing values. The method of deleting missing valuable observations is named listwise deletion or complete case analysis and the other method is pairwase deletion. The methods initializing correct values instead of missing values are mean imputation,regression imputation, EM algorithm and multiple imputation. In this study by carrying out missing data sets and missing data prediction methods, the results after getting these studies were compared. Key Words: Missing Value; Missing Value Analysis; Multiple Imputation; Missing At Random.

Description

Tez (yüksek lisans) -- Ondokuz Mayıs Üniversitesi, 2015
Libra Kayıt No: 116018

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

71

Endorsement

Review

Supplemented By

Referenced By