Примеры применения обучения с подкреплением
- admin
- Администратор
- Сообщения: 2219
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Примеры применения обучения с подкреплением
Шахматный движок AlphaZero
Курица может несколько минуть бежать с отрубленной головой.
Программист без головы может целый день спрашивать решение задачи у ChatGPT..
anekdot.ru
Программист без головы может целый день спрашивать решение задачи у ChatGPT..
anekdot.ru
- admin
- Администратор
- Сообщения: 2219
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Re: Примеры применения обучения с подкреплением
REINFORCE policy gradient
algorithm (Williams, 1992)
algorithm (Williams, 1992)
Курица может несколько минуть бежать с отрубленной головой.
Программист без головы может целый день спрашивать решение задачи у ChatGPT..
anekdot.ru
Программист без головы может целый день спрашивать решение задачи у ChatGPT..
anekdot.ru
- admin
- Администратор
- Сообщения: 2219
- Зарегистрирован: 27 июл 2018, 18:43
- Откуда: apsheronsk.bozo.ru
- Контактная информация:
Re: Примеры применения обучения с подкреплением
Хороший код на Kaggle
https://www.kaggle.com/code/alincijov/btc-q-learning Q learning BitCoin
https://www.kaggle.com/code/alincijov/btc-q-learning Q learning BitCoin
Курица может несколько минуть бежать с отрубленной головой.
Программист без головы может целый день спрашивать решение задачи у ChatGPT..
anekdot.ru
Программист без головы может целый день спрашивать решение задачи у ChatGPT..
anekdot.ru
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей