Примеры применения обучения с подкреплением
- admin
- Администратор
- Сообщения: 1869
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Примеры применения обучения с подкреплением
Шахматный движок AlphaZero
программисту на заметку:
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
- admin
- Администратор
- Сообщения: 1869
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Re: Примеры применения обучения с подкреплением
REINFORCE policy gradient
algorithm (Williams, 1992)
algorithm (Williams, 1992)
программисту на заметку:
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя