Abstract:
Niniejsza praca dotyczy porównania metod śledzenia i zapisywania zmian zachodzących w danych (SCD Typu 2) w wymiarach hurtowni danych przy użyciu dedykowanego narzędzia SQL Server Integration Services. Spróbowano udowodnić, że wbudowane komponenty w tym narzędziu nie zawsze są efektywne. W pracy skupiono się przede wszystkim na najczęściej używanych typach, czyli SCD 2 poruszając problematykę w kontekście ich wydajności w kilku scenariuszach obejmujących różne ilości danych przechowywanych na dysku SSD. Do badań wykorzystano narzędzia Microsoft takie jak: SQL Server Integration Services oraz SQL Server 2019 jako platformę testową, które są na licencji EULA w Polsko - Japońskiej Akadami Technik Komputerowych. Pierwszym krokiem jest więc przedstawienie sposobu porównania komponentów SCD, opisanie technik, gotowych komponentów, operacji, mechanizmów oraz pozostałych podejść technicznych, które umożliwiają zapisywanie danych historycznych. Kolejnym krokiem jest zaproponowanie takiego rozwiązania w narzędziach, które będzie bardziej optymalne w użyciu przez projektanta ETL. Inspiracją do przeprowadzenia badań jest podejście Gingera Granta, który przedstawił je w artykule „SSIS Tuning – What Size is my row, your DIY Buffer Sizing Guide”. Ostatnim elementem tej pracy jest przeanalizowanie oraz oszacowanie wyników wybranych aspektów, w których zostaną przedstawione praktyczne zastosowania poprawiające wydajność pod względem najkorzystniejszych wyników.