Méthode Policy-gradient
science
algorithme qui apprend une politique en s'intéressant directement à celle-ci
Liens externes
Lien Wikipedia : https://fr.wikipedia.org/wiki/Méthode_policy-gradient
Lien Wikidata : https://www.wikidata.org/wiki/Q113840014