On a Combination of Clustering Methods and Isolation Fores
Fragment książki (Rozdział monografii pokonferencyjnej)
MNiSW
20
Poziom I
Status: | |
Autorzy: | Koziara Michał, Karczmarek Paweł |
Dyscypliny: | |
Aby zobaczyć szczegóły należy się zalogować. | |
Wersja dokumentu: | Drukowana | Elektroniczna |
Język: | angielski |
Strony: | 114 - 126 |
Web of Science® Times Cited: | 2 |
Scopus® Cytowania: | 2 |
Bazy: | Web of Science | Scopus | Springer |
Efekt badań statutowych | NIE |
Finansowanie: | Fundusz Dyscypliny |
Materiał konferencyjny: | TAK |
Nazwa konferencji: | 21st International Conference on Artificial Intelligence and Soft Computing |
Skrócona nazwa konferencji: | ICAISC 2022 |
URL serii konferencji: | LINK |
Termin konferencji: | 19 lipca 2022 do 23 lipca 2022 |
Miasto konferencji: | Zakopane |
Państwo konferencji: | POLSKA |
Publikacja OA: | NIE |
Abstrakty: | angielski |
This study provides a comparison of the efficiency of anomaly detection in data using Isolation Forest (IF) combined with k-Means and Fuzzy C-Means algorithms. It also presents how to determine the anomaly score from the clustering results using the triangular and Gaussian membership functions. The number of clusters, the significance of the anomaly score obtained from the clustering process, and the degree of fuzziness of the clusters are additionally taken into account when testing the efficiency of anomaly detection. Moreover, we demonstrate that in most of the examined datasets, preceding IF with clustering algorithms allows obtaining significantly better results. Furthermore, combining IF with Fuzzy C-Means produces better results than combining it with k-Means. The results discussed in this paper allow one to decide which clustering method to use when combining it with IF to detect anomalies in the data. In addition, a comprehensive analysis presented in the paper sheds the light on the procedure of a choice of the parameters of the algorithms to get possibly the best results. |