Примеры применения обучения с подкреплением
- admin
- Администратор
- Сообщения: 2139
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Примеры применения обучения с подкреплением
Шахматный движок AlphaZero
программисту на заметку:
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
- admin
- Администратор
- Сообщения: 2139
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Re: Примеры применения обучения с подкреплением
REINFORCE policy gradient
algorithm (Williams, 1992)
algorithm (Williams, 1992)
программисту на заметку:
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
- admin
- Администратор
- Сообщения: 2139
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Re: Примеры применения обучения с подкреплением
Хороший код на Kaggle
https://www.kaggle.com/code/alincijov/btc-q-learning Q learning BitCoin
https://www.kaggle.com/code/alincijov/btc-q-learning Q learning BitCoin
программисту на заметку:
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
За программу без багов и недоделок ты получаешь деньги единожды, а программа с багами и недоделками кормит тебя всю жизнь.
anekdot.ru
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость