更多互联网新鲜资讯、工作奇淫技巧关注原创【飞鱼在浪屿】(日更新)
ReAgent:应用强化学习平台
ReAgent是一个用于Facebook上开发和使用的应用增强学习(RL)的开源端到端平台。ReAgent是用Python构建的,并使用PyTorch进行建模和培训,并使用TorchScript进行模型服务。该平台包含用于训练流行的深度RL算法的工作流,包括数据预处理,功能转换,分布式训练,反事实策略评估和优化服务。有关ReAgent的更多详细信息,请参见此处的白皮书:https://reagent.ai/
源代码可在此处获得:
https://github.com/facebookresearch/ReAgent
该平台曾被命名为“ Horizon”,但最近采用了“ ReAgent”这个名称,以强调其在决策和推理方面的功能。
支持的算法
- Discrete-Action
- Parametric-Action
- Double DQN,Dueling DQN,Dueling Double DQN
- Distributional RL: C51, QR-DQN
- Twin Delayed DDPG (TD3)
- Soft Actor-Critic(SAC)
安装
ReAgent可以通过安装。Docker或手动。有关如何安装ReAgent的详细说明,请参见:
https://github.com/facebookresearch/ReAgent/blob/master/docs/installation.rst
用法
ReAgent服务平台(RASP)教程涵盖了服务和培训模型,可在以下位置找到:ReAgent服务平台(RASP):
https://github.com/facebookresearch/ReAgent/blob/master/docs/usage.rst
有关如何使用ReAgent的详细说明,请参见:
https://github.com/facebookresearch/ReAgent/blob/master/docs/rasp_tutorial.rst