Methods for imputation of missing values and their influence on the results of segmentation research
Artykuł w czasopiśmie
MNiSW
14
Lista B
Status: | |
Warianty tytułu: |
Metody uzupełniania braków danych i ich wpływ na wyniki badań segmentacyjnych
|
Autorzy: | Gąsior Marcin, Skowron Łukasz |
Rok wydania: | 2016 |
Wersja dokumentu: | Drukowana |
Język: | angielski |
Numer czasopisma: | 54 |
Wolumen/Tom: | 4 |
Strony: | 61 - 71 |
Efekt badań statutowych | NIE |
Materiał konferencyjny: | NIE |
Publikacja OA: | TAK |
Licencja: | |
Sposób udostępnienia: | Otwarte repozytorium |
Wersja tekstu: | Ostateczna wersja opublikowana |
Czas opublikowania: | W momencie opublikowania |
Abstrakty: | polski | angielski |
The lack of answers is a common problem in all types of research, especially in the field of social science. Hence a number of solutions were developed, including the analysis of complete cases or imputations that supplement the missing value with the value calculated acording to difrent algorithms. This papers evaluates the influence of the adopted methods for the supplementation of missing answers regarding the result of segmentation conducted with the use of cluster analysis. in order to achievev this we use da set of datafrom an actual consumerresearch in wich the cases with missing values were deleted or supplemented with the use of various methods. Cluster analyses were then performed on those sets of data, both with the assumption of ordinal and ratio level of measurement, and then the grouping quality, as expressed by different indicators, ,was evaluated. Thi research proved the advantage of imputation over the analysis of complete cases, it also proved the validity of using more comlex approaches than the simple supplementation with an avarage or median value. | |
Brako odpowiedzi są częstym problemem we wszelkiego rodzaju badaniach, zwłaszcza z obszaru nauk społecznych. W konsekwencji opracowane zostało wiele sposobów rozwiązania tego problemu, uwzględniających między innymi analizę przypadków kompletnych czy imputacje - polegające na przypisaniu w miejsce braku wartości wyznaczonej przy wykorzystaniu różnych algorytmów. W niniejszym artykule dokonano oceny wpływu przyjętej metody zastępowania braków odpowiedzi na wyniki badań segmentacyjnych, prowadzonych przy wykorzystaniu analizy skupień. W tym celu wykorzystano zbiór danych z rzeczywistego badania konsumenckiego, w którym braki odpowiedzi zostały usunięte bądź zastąpione przy wykorzystaniu różnych, możliwych podejść. Na tak przygotowanych zestawieniach przypadków przeprowadzono analizy skupień, zarówno przy założeniu porządkowego jak i przedziałowego poziomu pomiaru, następnie zaś porównano jakość grupowania wyrażoną wybranymi wskaźnikami. Tak przeprowadzone badanie wskazało przewagę imputacji nad analizą przypadków kompletnych. dowiodło także zasadności stosowania podejść bardziej złożonych niż zastępowanie braków średnią lub medianą. |