"Głębokie uczenie poprzez wzmacnianie rozwija się niezwykle dynamicznie. Dziedzinę tę charakteryzuje niewyczerpany potencjał rozwiązywania niełatwych problemów. Zajmuje się tym co najmniej kilka grup badawczych, koncentrujących się na wdrażaniu głębokiego uczenia przez wzmacnianie w różnorodnych branżach. Niestety, opisy najnowszych osiągnięć są niełatwe do zrozumienia i zbyt abstrakcyjne, by można było jeużyć w poręcznych implementacjach, a przecież poprawne działanie aplikacji jest uwarunkowane gruntownym zrozumieniem problemu poprzez projektanta. To zaktualizowane i rozszerzone wydanie bestsellerowego przewodnika po najnowszych narzędziach i metodach związanych z uczeniem poprzez wzmacnianie. Zawiera wprowadzenie do teorii uczenia przez wzmacnianie oraz wyjaśnia użyteczne sposoby kodowania samouczących się agentów w celu rozwiązywania praktycznych zadań. W tym wydaniu dodano sześć nowych rozdziałów poświęconych takim osiągnięciom technologii jak dyskretna optymalizacja, metody wieloagentowe, środowisko Microsoft TextWorld czy innowacyjne
techniki eksploracji. Opisano jeszcze inne zagadnienia, pomiędzy innymi głębokie sieci Q, gradienty
polityk, sterowanie ciągłe i wysoce skalowalne metody bezgradientowe.
Poszczególne kwestie zostały zilustrowane kodem wraz z opisem szczegółów implementacji. W książce między innymi: związki pomiędzy uczeniem poprzez wzmacnianie a głębokim uczeniem zróżnicowane metody uczenia przez wzmacnianie, w tym entropia krzyżowa, sieć DQN, a także algorytmy: aktor-krytyk, TRPO, PPO, DDPG, D4PG i inne poręczne zastosowanie dyskretnej optymalizacji w celu rozwiązania problemu kostki Rubika trenowanie agentów przy użyciu oprogramowania AlphaGo Zero chatboty oparte na nienaturalnej inteligencji nowoczesne techniki eksploracyjne, w tym metody destylacji sieci Witaj, świecie prawdziwej sztucznej inteligencji!
Maxim Lapan jest niezależnym badaczem z wieloletnim doświadczeniem zawodowym w dziedzinie programowania i architektury systemów. Gruntownie poznał takie zagadnienia jak obszerne zbiory informacji, uczenie maszynowe i rozproszone systemy obliczeniowe o wysokiej efektywności.
aktualnie zajmuje się użyciami uczenia głębokiego, w tym głębokim przetwarzaniem języka naturalnego i głębokim uczeniem poprzez wzmacnianie."