Informacja o cookies

Zgadzam się Nasza strona zapisuje niewielkie pliki tekstowe, nazywane ciasteczkami (ang. cookies) na Twoim urządzeniu w celu lepszego dostosowania treści oraz dla celów statystycznych. Możesz wyłączyć możliwość ich zapisu, zmieniając ustawienia Twojej przeglądarki. Korzystanie z naszej strony bez zmiany ustawień oznacza zgodę na przechowywanie cookies w Twoim urządzeniu.

Publikacje Pracowników Politechniki Lubelskiej

MNiSW
5
spoza listy
Status:
Warianty tytułu:
The comparative analysis of modern ETL tools
Autorzy: Falchuk Ivan, Mayuk Vitalii, Muryjas Piotr
Dyscypliny:
Aby zobaczyć szczegóły należy się zalogować.
Rok wydania: 2021
Wersja dokumentu: Drukowana | Elektroniczna
Język: polski
Wolumen/Tom: 19
Strony: 126 - 131
Bazy: BazTech
Efekt badań statutowych NIE
Materiał konferencyjny: NIE
Publikacja OA: TAK
Licencja:
Sposób udostępnienia: Witryna wydawcy
Wersja tekstu: Ostateczna wersja opublikowana
Czas opublikowania: W momencie opublikowania
Data opublikowania w OA: 30 czerwca 2021
Abstrakty: angielski | polski
Each data warehouse requires loading properly processed transactional d ata. The process that performs this task is known as extract-transform-load (ETL). The efficiency of its imple mentation affects how quickly the user will have the access to the current analytical data. The paper presents the results of research e fficiency of ETL performance of its stage with the use of Azure Synapse (AS) and Azure Data Factory (ADF). The r esearch included selection, sorting and aggregating data, joining tables, and loading data into target tables. To evaluate the effi ciency of these operations, the criterion of their execution time has been used. The obtained results indicate that the ADF tool provides a much higher time efficiency of loading transactional data into the data warehouse comparing to AS.
Każda hurtownia danych wymaga ładowania odpowiednio przetworzonych danych transakcyjnych. Procesy realizujące to zadanie określane są jako ekstrakcja-transformacja- ładowanie (ETL). Od efektywności ich wykonania zależy jak szybko użytkownik będzie miał dostęp do bieżących danych analitycznych. W artykule przedstawiono istotę procesu ETL oraz wyniki badań efektywności realizacji jego etapów z użyciem Azure Synapse (AS) oraz Azure Data Factory (ADF) . Badania obejmowały selekcję , sortowanie i agregację danych, złącze nie tabel oraz zapis danych do tabel docelowych . Do oceny efektywności tych operacji zastosowano kryterium czasu ich wykonania. Uzyskane wyniki wskazują, iż narzędzie ADF zapewnia znacznie wyższą efektywność czasową ładowania danych transakcyjnych do hurtowni danych w porównaniu do AS .