Enhanced Tree-Based Anomaly Detection
Fragment książki (Materiały konferencyjne)
MNiSW
140
konferencja
Status: | |
Autorzy: | Karczmarek Paweł, Gałka Łukasz, Dolecki Michał, Pedrycz Witold, Czerwiński Dariusz, Kiersztyn Adam, Stęgierski Rafał |
Dyscypliny: | |
Aby zobaczyć szczegóły należy się zalogować. | |
Wersja dokumentu: | Drukowana | Elektroniczna |
Język: | angielski |
Strony: | 1 - 7 |
Web of Science® Times Cited: | 0 |
Scopus® Cytowania: | 0 |
Bazy: | Web of Science | Scopus |
Efekt badań statutowych | NIE |
Finansowanie: | This research is funded by the National Science Centre, Poland under CHIST-ERA programme (Grant no. 2018/28/Z/ST6/00563). |
Materiał konferencyjny: | TAK |
Nazwa konferencji: | IEEE World Congress on Computational Intelligence 2022 ; IEEE International Conference on Fuzzy Systems (FUZZ-IEEE) 2022 |
Skrócona nazwa konferencji: | IEEE WCCI 2022 ; FUZZ-IEEE 2022 |
URL serii konferencji: | LINK |
Termin konferencji: | 18 lipca 2022 do 23 lipca 2022 |
Miasto konferencji: | Padwa |
Państwo konferencji: | WŁOCHY |
Publikacja OA: | NIE |
Abstrakty: | angielski |
Anomaly detection in data sets is one of the most important challenges for modern analysts and data administra- tors. It is usually based on algorithms that use raw data. In this study, we analyze the possibilities of improving the well- known Isolation Forest algorithm based on binary search trees for data preprocessing using the grouping of both attributes first, and then records within attribute groups. Attribute clustering is based on hierarchical grouping, while record grouping uses K- Means and Fuzzy C-Means. To describe the relationships between records, data membership functions are also used, built on the basis of record distances from centroids. This approach gives a new look at the possibilities of the Isolation Forest method and leads to a significant improvement in the results for selected public databases. |