Примеры применения обучения с подкреплением

Интернет-Форум "Все про нейронные сети"
Нейросетевые технологии
Аватара пользователя
admin
Администратор
Сообщения: 1839
Зарегистрирован: 27 июл 2018, 18:43
Откуда: apsheronsk.bozo.ru
Контактная информация:

Примеры применения обучения с подкреплением

Сообщение admin » 02 фев 2023, 10:35

Шахматный движок AlphaZero
программисту на заметку:
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru

Аватара пользователя
admin
Администратор
Сообщения: 1839
Зарегистрирован: 27 июл 2018, 18:43
Откуда: apsheronsk.bozo.ru
Контактная информация:

Re: Примеры применения обучения с подкреплением

Сообщение admin » 09 фев 2023, 10:52

REINFORCE policy gradient
algorithm (Williams, 1992)
программисту на заметку:
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru


Вернуться в «Нейросети»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя