pytorch-LunarLander OpenAI Gym中针对LunarLander-v2环境的不同Deep RL算法的PyTorch实现 我们实施了3种不同的RL算法来解决LunarLander-v2环境: 模仿学习 加强 优势-演员-批评(A2C) 注意:模仿学习是在Keras中实现的,另外两种算法是在PyTorch中实现的 指示: 安装所有依赖项 克隆仓库 运行以下命令: 3.1)python imitation.py 3.2)python reinforce.py 3.3)python a2c.py
2021-10-26 18:58:14 14KB Python
1
GPT-2 PyTorch实施 目录 介绍 该项目是OpenAI GPT-2模型的PyTorch实现。 它提供模型训练,句子生成和量度可视化。 它被认为是可以理解和优化的。 我们设计的代码易于理解。 另外,我们使用来提高性能。 依存关系 正则表达式 tqdm 火炬 麻木 matplotlib 用法 怎么训练? 在训练GPT-2模型之前,应准备语料库数据集。 我们建议使用构建自己的语料库。 相反,训练模块需要带有词汇表文件的标记化训练和评估数据集。 准备数据集后,可以使用以下方法训练GPT-2: $ python -m gpt2 train --train_corpus build/corpus.train.txt \ --eval_corpus build/corpus.test.txt \
1
从数据中学习动力系统 神经网络动力学,用于基于模型的深度强化学习,且无模型精调
1
#4.4_OpenAI_Gym_using_Tensorflow_(强化学习_Reinforcement_Learning_教学
2021-09-01 21:00:20 29.84MB 学习资源
#4.4_OpenAI_ES_大规模强化学习_Reinforcement_learning_(机器学习_进化算法_Evoluti
2021-09-01 21:00:20 37.88MB 学习资源
相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。 主类继承了的 。 如果使用参数'single-agent = True'实例化,则其行为类似于来自的常规 。 负责使用 API检索信息并在交通信号灯上。 该存储库的目标: 提供一个简单的界面,以与使用SUMO的交通信号控制强化学习一起使用 支持Multiagent RL 与gym.Env和流行的RL库(例如和 易于定制:状态和奖励定义易于修改 安装 安装最新版本的SUMO: sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量(默认的sumo安装路径为/ usr / share / sumo) ec
2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms
1
OpenWebText 该项目是概述的GPT-2 WebText数据集的克隆。 该项目仍然是在制品。 非常感谢让我使用他的下载代码。 他的OpenWebText版本写得很好,所以请查看! 依存关系 Pipenv,Python 3, 要安装python依赖项,请执行以下操作: pipenv install 依赖关系: 在Ubuntu上: sudo apt-get install libxml2-dev libxslt-dev 在OS X上: brew install libxml2 libxslt 用法 从reddit获取URL列表: pipenv run python get_urls.py 从网址下载数据: pipenv run python download.py 结果文件将以data/格式{domain}-{sha256 hash of url}.txt存放。 享
2021-08-24 10:43:18 14KB Python
1
静脉-健身房 Veins-Gym将Veins模拟导出为Open AI Gyms。 这使得强化学习算法的应用能够解决VANET域中的问题,特别是诸如Tensorflow或PyTorch之类的流行框架。 执照 该项目根据GNU通用公共许可证2.0的条款获得许可。
2021-08-18 12:29:36 16KB simulator reinforcement-learning openai-gym sumo
1
焦炉火中的DALL-E 在实现/复制 (OpenAI的文本到图像转换器)。 它还将包含用于对世代进行排名。 , 和正在开发 ! 如果您想了解DALL-E在TPU上的培训,请帮助他们。 在复制此内容之前,我们可以适应“或“ 状态 设法在仅2000张风景图像的数据集上训练了一个小的6层DALL-E! (2048个视觉标记) 安装 $ pip install dalle-pytorch 用法 火车VAE import torch from dalle_pytorch import DiscreteVAE vae = DiscreteVAE ( image_size = 256 ,
1
OpenAI的Spinning UP(https://spinningup.openai.com/en/latest/spinningup/keypapers.html)对于入门深度强化学习是很好的资料,其中推荐了105篇非常经典的论文,这对于想要从事深度强化学习研究的初学者来说极具参考意义。 本人花了一点时间把所有论文下载并按照网页上的分类整理了下来。
2021-08-10 09:11:10 285.08MB 深度学习 强化学习 spinninup openai
1