更多互联网新鲜资讯、工作奇淫技巧关注原创【飞鱼在浪屿】（日更新）

ReAgent：应用强化学习平台

ReAgent是一个用于Facebook上开发和使用的应用增强学习（RL）的开源端到端平台。ReAgent是用Python构建的，并使用PyTorch进行建模和培训，并使用TorchScript进行模型服务。该平台包含用于训练流行的深度RL算法的工作流，包括数据预处理，功能转换，分布式训练，反事实策略评估和优化服务。有关ReAgent的更多详细信息，请参见此处的白皮书：https://reagent.ai/

源代码可在此处获得：

https://github.com/facebookresearch/ReAgent

该平台曾被命名为“ Horizon”，但最近采用了“ ReAgent”这个名称，以强调其在决策和推理方面的功能。

支持的算法

Discrete-Action
Parametric-Action
Double DQN，Dueling DQN，Dueling Double DQN
Distributional RL: C51， QR-DQN
Twin Delayed DDPG （TD3）
Soft Actor-Critic（SAC）

安装

ReAgent可以通过安装。Docker或手动。有关如何安装ReAgent的详细说明，请参见：

https://github.com/facebookresearch/ReAgent/blob/master/docs/installation.rst

用法

ReAgent服务平台（RASP）教程涵盖了服务和培训模型，可在以下位置找到：ReAgent服务平台（RASP）：

https://github.com/facebookresearch/ReAgent/blob/master/docs/usage.rst

有关如何使用ReAgent的详细说明，请参见：

https://github.com/facebookresearch/ReAgent/blob/master/docs/rasp_tutorial.rst

醋醋百科网

Good Luck To You!

Facebook的强化学习开源框架_facebook 开源框架

ReAgent：应用强化学习平台

支持的算法

安装

用法