Apprentissage par renforcement : de la modélisation des processus neuraux aux applications robotiques by Medhi Khamassi
LIA chemin des Meinajariès, AvignonApprentissage par renforcement : de la modélisation des processus neuraux aux applications robotiques by Medhi Khamassi (l'Institut des Systèmes Intelligents et de Robotique (UPMC)) L'activité phasique des neurones dopaminergiques est considérée depuis une quinzaine d'années comme le substrat neural de signaux d'erreur de prédiction de la récompense (RPE). Ces signaux se sont avérés très proches […]
Apprentissage par renforcement (direct et inverse) pour les systèmes interactifs by Olivier Pietquin
LIA chemin des Meinajariès, AvignonApprentissage par renforcement (direct et inverse) pour les systèmes interactifs by Olivier Pietquin (SequeL team, University Lille 1, LIFL CNRS UMR 8022, INRIA Lille) L'apprentissage par renforcement est une catégorie d'apprentissage automatique qui se différencie des autres par le fait qu'elle a pour objectif l'optimisation d'une séquence de décisions, prenant en compte l'aspect temporel et […]