Streszczenie:
Niniejsza praca ma na celu sprawdzenie prawdziwości tezy, wedle której wykorzystanie
próbkowania w bazach danych pozwala na uzyskanie wystarczająco dokładnych wyników
zapytań w krótszym czasie. W pierwszej kolejności przybliżono tematykę statystyki oraz baz
danych oraz określono dostępne metody statystyczne. Po wyborze PostgreSQL jako
najlepszego systemu do przeprowadzenia badań, przystąpiono do przedstawienia środowiska
technicznego oraz do określenia sposobu obliczeń. Następnie opisano sposób realizacji badań,
w których użyto maszyny wirtualnej Ubuntu Server oraz skryptów automatyzujących
wykonywanie zapytań, napisanych w języku Python. W dalszej kolejności przedstawiono
wyniki poszczególnych eksperymentów, które umieszczono w arkuszach kalkulacyjnych
programu Microsoft Excel. Znajdowały się w nich formuły pozwalające na wyliczenie
zdefiniowanej wcześniej dokładności. Po przedstawieniu wyników dokonano ich szczegółowej
analizy i wysunięto wnioski. Pozwoliło to na udowodnienie postawionej tezy, jednak wyłącznie
po uwzględnieniu określonych warunków i nie dla wszystkich rodzajów zapytań.