Примеры применения обучения с подкреплением

Интернет-Форум "Все про нейронные сети"
Нейросетевые технологии
Аватара пользователя
admin
Администратор
Сообщения: 2219
Зарегистрирован: 27 июл 2018, 18:43
Откуда: apsheronsk.bozo.ru
Контактная информация:

Примеры применения обучения с подкреплением

Сообщение admin » 02 фев 2023, 10:35

Шахматный движок AlphaZero
Курица может несколько минуть бежать с отрубленной головой.
Программист без головы может целый день спрашивать решение задачи у ChatGPT..

anekdot.ru

Аватара пользователя
admin
Администратор
Сообщения: 2219
Зарегистрирован: 27 июл 2018, 18:43
Откуда: apsheronsk.bozo.ru
Контактная информация:

Re: Примеры применения обучения с подкреплением

Сообщение admin » 09 фев 2023, 10:52

REINFORCE policy gradient
algorithm (Williams, 1992)
Курица может несколько минуть бежать с отрубленной головой.
Программист без головы может целый день спрашивать решение задачи у ChatGPT..

anekdot.ru

Аватара пользователя
admin
Администратор
Сообщения: 2219
Зарегистрирован: 27 июл 2018, 18:43
Откуда: apsheronsk.bozo.ru
Контактная информация:

Re: Примеры применения обучения с подкреплением

Сообщение admin » 14 авг 2024, 20:22

Хороший код на Kaggle
https://www.kaggle.com/code/alincijov/btc-q-learning Q learning BitCoin
Курица может несколько минуть бежать с отрубленной головой.
Программист без головы может целый день спрашивать решение задачи у ChatGPT..

anekdot.ru


Вернуться в «Нейросети»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость