赖氨酸是什么| 尿道口有烧灼感为什么| 八戒是什么意思| 尿糖2个加号是什么意思| 快菜是什么| 1938年属什么生肖属相| 萎谢是什么意思| 县公安局局长是什么级别| 吹空调咳嗽是什么原因| 肚子疼应该挂什么科| 家中养什么鸟最干净| 什么什么大名| 力什么神什么| 马齿苋不能和什么一起吃| 西双版纳有什么好玩的| 梦见冬瓜是什么意思| 七夕节什么时候| 守夜是什么意思| 指滑是什么意思| 不造血是什么病| 疯狂动物城树懒叫什么| 辐射对人体有什么伤害| 政协主席是什么级别| 牛油果吃了有什么好处| 喉咙痛喝什么| 黄芪什么功效| 鼻炎是什么原因引起的| 小人难防前一句是什么| 黄瓜生吃有什么好处| 喝藏红花有什么好处| 白带发黄是什么原因| 日语亚麻得是什么意思| ccb是什么药物| 中专什么时候报名| 富察氏是什么旗| 奥美拉唑治什么胃病| 黄瓜籽粉有什么作用| ca医学代表什么意思| 左眉毛上有痣代表什么| mbti测试是什么| 回奶吃什么药| 梦见前夫是什么兆头| 血小板分布宽度是什么意思| 什么去火| 肠镜什么情况下取活检| 4月8日什么星座| 528是什么意思| 多尿什么原因| 加仓是什么意思| 乳房看什么科| 梦见很多鱼是什么意思| 交易是什么意思| c14阳性 是什么意思| 类风湿有什么症状| 1981年属什么生肖| 糖宝是什么意思| 经期吃什么好排除瘀血| 一切就绪是什么意思| 豪情万丈什么意思| 心悸是什么症状| 复原乳是什么意思| 拉稀吃什么药好| 胃轻度肠化是什么意思| 似乎的近义词是什么| 掉头发严重吃什么东西可以改善| 大姨妈来了吃什么对身体好| 瑶浴spa是什么意思| 蛋白粉什么味道| 同型半胱氨酸高吃什么| 有眼不识泰山是什么意思| 味精和鸡精有什么区别| 吃什么油对身体好| 和胃是什么意思| 声嘶力竭是什么意思| 红苕是什么| 贫血吃什么药好| 28岁属相是什么生肖| 手脚发麻什么原因| 觉悟高是什么意思| 985211是什么意思| 紫色心情是什么意思| 怀孕吃什么宝宝会白| 肝脏多发囊肿什么意思| 血小板低看什么科| 樱花什么时候开花| ercp是什么检查| 梦见小狗是什么意思| 二级产前超声检查是什么| 验血脂挂什么科| 为什么拉屎会拉出血| 处女座男和什么座最配对| 女生不来大姨妈是什么原因| 脚底红润是什么原因| 上环要做什么检查| 新陈代谢是指什么| 50年是什么婚| 手术后喝什么鱼汤最好| 接吻什么感觉| 吃什么子宫肌瘤会消除| 7月3日是什么日子| 知柏地黄丸治疗什么病| 漫字五行属什么| 周瑜是一个什么样的人| 女性睾酮高意味着什么| 八方来财是什么生肖| 梦见自己儿子死了是什么意思| 天麻有什么作用| 3楼五行属什么| 小便有点红是什么原因| 心肌桥是什么病| 牙根发黑是什么原因| 1979年出生属什么生肖| 曹曦月演过什么电视剧| 四川有什么好大学| amy是什么意思| 计数单位是什么意思| 感叹号像什么| 胰腺炎吃什么水果| 喉咙干疼吃什么药| 12什么意思| 渚是什么意思| 什么人不能坐飞机| 辱骂是什么意思| 内项和外项是什么| 为什么会缺钙| 太傅是什么官| 11月16号是什么星座| 五角硬币是什么材质| decaf是什么意思| 手指甲软薄吃什么补| ips屏幕是什么意思| 申时五行属什么| 幽门螺杆菌阳性吃什么药| 情感和感情有什么区别| 吃避孕药有什么好处| 梦到死去的亲人是什么意思| 总胆固醇偏高是什么原因| 羊内腰和外腰分别是什么| 什么的糖果| 头昏是什么原因| 雨淋棺材有什么说法| 利巴韦林是什么药| 髂胫束在什么位置| 扎巴依是什么意思| 右是什么结构| 电压mv是什么意思| 直女是什么意思| 槿字五行属什么| 君子兰用什么土最好| 早上九点半是什么时辰| 二月二十二日是什么星座| 月经2个月没来是什么原因| ly是什么意思| 肠梗阻吃什么药| 轻食是什么| 月经期间喝酒有什么危害| 铁树是什么生肖| 长沙有什么学校| 粿条是什么做的| 何首乌泡酒有什么作用| 身份证是什么字体| 翻来覆去是什么意思| 夹腿有什么坏处吗| 昆布是什么| 什么的衣裳| 愚公移山是什么意思| 猪肝炒什么好吃| 丁未年五行属什么| 42天产后检查挂什么科| qn是什么医嘱| 吃什么补肝养肝| 鲜卑人是现在的什么人| 吃榴莲对妇科病有什么好处| 自律性是什么意思| 为什么会有癌症| 桥本氏甲状腺炎是什么意思| 鹞子是什么鸟| 什么情况会胎停| 堞是什么意思| 吃什么有助于降血压| ntr什么意思| 有氧运动是什么意思| z值是什么意思| 子宫内膜增厚是什么意思| 脾虚胃热吃什么中成药| 闫学晶是什么军衔| 林彪为什么叛逃| 南瓜皮可以吃吗有什么作用| 什么的树叶| 什么睡姿对髋关节好| 维生素B3叫什么名字| 西游记告诉我们什么道理| 高压低是什么原因引起的| 脑软化灶是什么意思| 27度穿什么衣服合适| 炒菜什么油最好| 目赤是什么症状| 五月十二号是什么日子| 心肌桥是什么病| om是什么意思| 大便变细是什么原因| 心脏回流是什么意思| 没有高中毕业证有什么影响| 梦见自己打胎是什么意思| 个人简历籍贯填什么| 什么地眨眼| 学的偏旁部首是什么| 化痰吃什么药| 黄豆加什么打豆浆好喝又营养| 午睡睡不着是什么原因| 谷雨是什么季节| 子宫内膜异位是什么原因造成的| 海东青是什么鸟| 大便干燥拉不出来是什么原因| 手上掉皮什么原因| 血管炎不能吃什么食物| mri检查是什么| 秦始皇叫什么名字| 吃什么掉秤快| ABA是什么植物激素| 三焦湿热吃什么中成药| 洋葱不能跟什么一起吃| 11月11日是什么星座| 180是什么尺码| 儒家思想的核心是什么| pv值是什么意思| 为什么小脑会萎缩| 憬五行属什么| 什么可以驱蛇| 紫米和黑米有什么区别| 吃什么助勃药能硬| 家什是什么意思| 悉心栽培什么意思| 阿玛尼是什么意思| 中老年人补钙吃什么牌子的钙片好| 情有独钟是什么意思| 开封菜是什么意思| 脖子上长小肉粒是什么| 羊水是什么颜色的| 皮肤黑的人穿什么颜色的衣服显白| 头顶一阵一阵疼是什么原因| 心脏早搏是什么意思| 风土人情是什么意思| 嘴角发麻是什么病前兆| 蜂蜜和什么食物相克| 乳腺结节是什么引起的| 血脂高能吃什么水果| 相向而行是什么意思| 念想是什么意思| 28属什么的生肖| 莺是什么鸟| 他克莫司软膏治疗什么| 吃虾有什么好处| 胎盘低置是什么原因造成的| 芊芊学子是什么意思| 性生活过多有什么危害| 脸肿挂什么科| 阴毛有什么用| 辅助治疗是什么意思| 小鸟喜欢吃什么食物| 吃红薯有什么好处| 录取线差是什么意思| vain是什么意思| 咽口水喉咙痛吃什么药| 百度
Skip to content

PaddlePaddle/PARL

Repository files navigation

PARL

English | 简体中文

Documentation Status Documentation Status Documentation Status Release

PARL is a flexible and high-efficient reinforcement learning framework.

About PARL

Features

Reproducible. We provide algorithms that stably reproduce the result of many influential reinforcement learning algorithms.

Large Scale. Ability to support high-performance parallelization of training with thousands of CPUs and multi-GPUs.

Reusable. Algorithms provided in the repository could be directly adapted to a new task by defining a forward network and training mechanism will be built automatically.

Extensible. Build new algorithms quickly by inheriting the abstract class in the framework.

Abstractions

abstractions

PARL aims to build an agent for training algorithms to perform complex tasks. The main abstractions introduced by PARL that are used to build an agent recursively are the following:

Model

Model is abstracted to construct the forward network which defines a policy network or critic network given state as input.

Algorithm

Algorithm describes the mechanism to update parameters in Model and often contains at least one model.

Agent

Agent, a data bridge between the environment and the algorithm, is responsible for data I/O with the outside environment and describes data preprocessing before feeding data into the training process.

Note: For more information about base classes, please visit our tutorial and API documentation.

Parallelization

PARL provides a compact API for distributed training, allowing users to transfer the code into a parallelized version by simply adding a decorator. For more information about our APIs for parallel training, please visit our documentation.
Here is a Hello World example to demonstrate how easy it is to leverage outer computation resources.

#============Agent.py=================
@parl.remote_class
class Agent(object):

    def say_hello(self):
        print("Hello World!")

    def sum(self, a, b):
        return a+b

parl.connect('localhost:8037')
agent = Agent()
agent.say_hello()
ans = agent.sum(1,5) # it runs remotely, without consuming any local computation resources

Two steps to use outer computation resources:

  1. use the parl.remote_class to decorate a class at first, after which it is transferred to be a new class that can run in other CPUs or machines.
  2. call parl.connect to initialize parallel communication before creating an object. Calling any function of the objects does not consume local computation resources since they are executed elsewhere.

PARL

As shown in the above figure, real actors (orange circle) are running at the cpu cluster, while the learner (blue circle) is running at the local gpu with several remote actors (yellow circle with dotted edge).

For users, they can write code in a simple way, just like writing multi-thread code, but with actors consuming remote resources. We have also provided examples of parallized algorithms like IMPALA, A2C. For more details in usage please refer to these examples.

Install:

Dependencies

  • Python 3.6+(Python 3.8+ is preferable for distributed training).
  • paddlepaddle>=2.3.1 (Optional, if you only want to use APIs related to parallelization alone)
pip install parl

Detailed Installation Guide (Continuously Updated)

Getting Started

Several-points to get you started:

For beginners who know little about reinforcement learning, we also provide an introductory course: ( Video | Code )

Examples

NeurlIPS2018 Half-Cheetah Breakout
NeurlIPS2018

xparl Security

xparl provides multi-process parallelism across a multi-machine cluster, similar to Python's built-in single-machine multiprocessing. This means that after writing code on a client, you can execute arbitrary code on any machine within the cluster, such as retrieving data from other machines, adding or deleting files, etc.

This behavior is by design, as reinforcement learning environments are diverse, and env_wrapper needs the ability to perform any possible operation. xparl achieves this functionality using pickle (similar to ray). Unlike in most cases where pickle may be considered a vulnerability, here it is an essential feature.

Security Considerations

Since arbitrary code execution is possible, users must ensure the cluster is secure:

  • Do not allow untrusted machines to join the cluster.
  • Do not expose the xparl ports to the public internet or allow untrusted users to access the cluster.
  • Do not execute untrusted code on the cluster.
六月二十九日是什么星座 股骨径是指胎儿什么 肺部结节灶是什么意思啊 记过处分有什么影响 轻度高血压吃什么食物可以降压
小鸡啄米什么意思 三超是指什么 血压低吃什么补得最快 脱水是什么意思 长针眼是什么意思
中规中矩什么意思 黄皮适合什么颜色的衣服 老舍原名叫什么 西红柿和什么不能一起吃 离苦得乐什么意思
阴道b超检查什么 汤沐邑是什么意思 立冬是什么意思 灵芝煮水喝有什么功效 浪琴名匠系列什么档次
口头禅什么意思dajiketang.com 红线是什么意思hcv9jop1ns2r.cn 苹果不能和什么一起吃hcv8jop8ns5r.cn 玉髓是什么玉hcv9jop2ns2r.cn 大运什么意思zhongyiyatai.com
泳帽的作用是什么hcv9jop4ns5r.cn 验精挂什么科室hcv8jop4ns8r.cn 举牌什么意思jinxinzhichuang.com 蓝莓有什么作用fenrenren.com 极核是什么hcv9jop7ns5r.cn
为什么四川总地震hcv8jop2ns7r.cn 胆结石吃什么排石最快creativexi.com 黄豆加什么打豆浆好喝又营养hcv9jop0ns5r.cn 红酒配什么饮料好喝hcv9jop3ns1r.cn 布洛芬缓释胶囊是什么药hcv8jop3ns2r.cn
惟字五行属什么hcv8jop8ns0r.cn 毛很长的狗是什么品种hcv9jop4ns5r.cn 反应迟钝是什么原因造成的hcv9jop5ns0r.cn 吃什么能立马催月经hcv7jop7ns4r.cn 荷叶和山楂一起泡水有什么功效hcv9jop2ns5r.cn
百度