Repozytorium PJATK

Web scraping - metody i wyzwania

Repozytorium Centrum Otwartej Nauki

Pokaż uproszczony rekord

dc.contributor.author Talar, Jan Maria
dc.date.accessioned 2023-03-22T11:35:07Z
dc.date.available 2023-03-22T11:35:07Z
dc.date.issued 2023-03-22
dc.identifier.issn 2022/M/AM/42
dc.identifier.uri https://repin.pjwstk.edu.pl/xmlui/handle/186319/2651
dc.description.abstract Praca omawia historię sieci Internet w tym pierwsze kroki w postaci ARPANET oraz upowszechnienie sieci regionalnych aż po nowoczesną sieć światową - po czym omawia technologie na których się opiera w tym protokoły DNS, HTTP oraz TCP/IP. Następnie wyjaśniona jest istota web scrapingu i robotów sieciowych. W kolejnym rozdziale przedstawione są najczęstsze problemy, nad którymi należy się pochylić przy projektowaniu web scraperow oraz praktyczne rozwiązania ułatwiające omijanie zabezpieczeń antyscrapingowych, po czym wymienione są najczęściej wykorzystywane metody w web scrapingu oraz przykładowe implementacje lub kroki służące stworzeniu modeli klasyfikacji treści. W rozdziale analitycznym opisane i porównane zostały trzy narzędzia wspierające web scraping - Selenium, Puppeteer oraz Playwright. pl_PL
dc.language.iso other pl_PL
dc.relation.ispartofseries ;Nr 7247
dc.subject metody pl_PL
dc.subject roboty sieciowe pl_PL
dc.subject Selenium pl_PL
dc.subject Puppeteer pl_PL
dc.subject Playwright pl_PL
dc.subject web scraping pl_PL
dc.subject wyzwania pl_PL
dc.title Web scraping - metody i wyzwania pl_PL
dc.type Thesis pl_PL


Pliki tej pozycji

Plik Rozmiar Format Przeglądanie

Nie ma plików powiązanych z tą pozycją.

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

Szukaj


Szukanie zaawansowane

Przeglądaj

Moje konto