醋醋百科网

Good Luck To You!

Facebook的强化学习开源框架_facebook 开源框架

更多互联网新鲜资讯、工作奇淫技巧关注原创【飞鱼在浪屿】(日更新)


ReAgent:应用强化学习平台

ReAgent是一个用于Facebook上开发和使用的应用增强学习(RL)的开源端到端平台。ReAgent是用Python构建的,并使用PyTorch进行建模和培训,并使用TorchScript进行模型服务。该平台包含用于训练流行的深度RL算法的工作流,包括数据预处理,功能转换,分布式训练,反事实策略评估和优化服务。有关ReAgent的更多详细信息,请参见此处的白皮书:https://reagent.ai/

源代码可在此处获得:

https://github.com/facebookresearch/ReAgent

该平台曾被命名为“ Horizon”,但最近采用了“ ReAgent”这个名称,以强调其在决策和推理方面的功能。


支持的算法

  • Discrete-Action
  • Parametric-Action
  • Double DQN,Dueling DQNDueling Double DQN
  • Distributional RL: C51, QR-DQN
  • Twin Delayed DDPG (TD3)
  • Soft Actor-Critic(SAC)

安装

ReAgent可以通过安装。Docker或手动。有关如何安装ReAgent的详细说明,请参见:

https://github.com/facebookresearch/ReAgent/blob/master/docs/installation.rst


用法

ReAgent服务平台(RASP)教程涵盖了服务和培训模型,可在以下位置找到:ReAgent服务平台(RASP):

https://github.com/facebookresearch/ReAgent/blob/master/docs/usage.rst

有关如何使用ReAgent的详细说明,请参见:

https://github.com/facebookresearch/ReAgent/blob/master/docs/rasp_tutorial.rst

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言