Streszczenie:
Zjawisko spamu internetowego stanowi istotną trudność dla użytkowników internetu. W jego
wykrywaniu mogłyby znaleźć zastosowanie wielowarstwowe sieci neuronowe. W poniższej pracy,
na początek omówione jest zjawisko spamu oraz sposób działania sztucznych sieci neuronowych.
Potem opisany jest proces stworzenia sieci neuronowej. Do treningu sieci neuronowej został użyty
zbiór danych WEBSPAM-UK2007, wybrane do uczenia cechy dokumentów HTML uwzględniają
liczby tagów HTML, cechy nagłówka HTML, stopień zagnieżdżeń tagów, wielkości liter, częstości
występowania oraz poprawność językową. Przedstawione zostały wyniki działania tak stworzonego
klasyfikatora.