Streszczenie:
Cele naukowe pracy obejmuj , a zbadanie wybranych metod transferu wiedzy w problemie
rozwiązywania gier tekstowych przy pomocy uczenia przez wzmacnianie. Gry tekstowe są
złożonym środowiskiem o przestrzeni akcji i stanów określonej przez język naturalny. W
pracy wykorzystano oprogramowanie badawcze TextWorld [10] (Microsoft) do stworzenia
zbioru gier tekstowych, a następnie sprawdzono efektywność klasycznego transferu wag
oraz zmodyfikowanej wersji Kickstartingu [42], dostosowanej do Q-learning [47].
Przedstawione metody wymagały treningu dwóch typów agentów: uczniów i nauczycieli.
Nauczyciel, trenowany na zbiorze prostych gier, nadzoruje ucznia w nauce gier trudnych.
Agenci oparci są o architekturę sieci neuronowej DRRN [22]. Zbadano cztery schematy metody
transferu wiedzy, w tym dwie oryginalne. Wyniki eksperymentalne zostały poddane
analizie; zarysowano również plan dalszych badań.