搜索【openai】的结果

pytorch-LunarLander:OpenAI Gym中针对LunarLander-v2环境的不同Deep RL算法的PyTorch实现-源码

pytorch-LunarLander OpenAI Gym中针对LunarLander-v2环境的不同Deep RL算法的PyTorch实现我们实施了3种不同的RL算法来解决LunarLander-v2环境：模仿学习加强优势-演员-批评（A2C）注意：模仿学习是在Keras中实现的，另外两种算法是在PyTorch中实现的指示：安装所有依赖项克隆仓库运行以下命令： 3.1）python imitation.py 3.2）python reinforce.py 3.3）python a2c.py

2021-10-26 18:58:14 14KB Python

1

GPT2:OpenAI GPT-2的PyTorch实施-源码

GPT-2 PyTorch实施目录介绍该项目是OpenAI GPT-2模型的PyTorch实现。它提供模型训练，句子生成和量度可视化。它被认为是可以理解和优化的。我们设计的代码易于理解。另外，我们使用来提高性能。依存关系正则表达式 tqdm 火炬麻木 matplotlib 用法怎么训练？在训练GPT-2模型之前，应准备语料库数据集。我们建议使用构建自己的语料库。相反，训练模块需要带有词汇表文件的标记化训练和评估数据集。准备数据集后，可以使用以下方法训练GPT-2： $ python -m gpt2 train --train_corpus build/corpus.train.txt \ --eval_corpus build/corpus.test.txt \

2021-10-20 16:50:37 153KB nlp natural-language-processing pytorch transformer

1

MPC:神经网络动力学，用于基于模型的深度强化学习，且无模型精调-源码

从数据中学习动力系统神经网络动力学，用于基于模型的深度强化学习，且无模型精调

2021-09-25 10:05:10 2.24MB reinforcement-learning openai-gym model-predictive-control Python

1

4.4 OpenAI Gym using Tensorflow (强化学习 Reinforcement Learning 教学)

#4.4_OpenAI_Gym_using_Tensorflow_(强化学习_Reinforcement_Learning_教学

2021-09-01 21:00:20 29.84MB 学习资源

4.4 OpenAI ES 大规模强化学习 Reinforcement learning (机器学习进化算法 Evolutionary Algorithm 教程教学 tutorial)

#4.4_OpenAI_ES_大规模强化学习_Reinforcement_learning_(机器学习_进化算法_Evoluti

2021-09-01 21:00:20 37.88MB 学习资源

sumo-rl:一个简单的界面，用于通过SUMO实例化强化学习环境，以进行交通信号控制。与OpenAI的Gym Env和RLlib的MultiAgentEnv兼容-源码

相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。主类继承了的。如果使用参数'single-agent = True'实例化，则其行为类似于来自的常规。负责使用 API检索信息并在交通信号灯上。该存储库的目标：提供一个简单的界面，以与使用SUMO的交通信号控制强化学习一起使用支持Multiagent RL 与gym.Env和流行的RL库（例如和易于定制：状态和奖励定义易于修改安装安装最新版本的SUMO： sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量（默认的sumo安装路径为/ usr / share / sumo） ec

2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms

1

openwebtext:OpenAI的GPT-2 WebText数据集的开放克隆。仍在制品-源码

OpenWebText 该项目是概述的GPT-2 WebText数据集的克隆。该项目仍然是在制品。非常感谢让我使用他的下载代码。他的OpenWebText版本写得很好，所以请查看！依存关系 Pipenv，Python 3，要安装python依赖项，请执行以下操作： pipenv install 依赖关系：在Ubuntu上： sudo apt-get install libxml2-dev libxslt-dev 在OS X上： brew install libxml2 libxslt 用法从reddit获取URL列表： pipenv run python get_urls.py 从网址下载数据： pipenv run python download.py 结果文件将以data/格式{domain}-{sha256 hash of url}.txt存放。享

2021-08-24 10:43:18 14KB Python

1

veins-gym:基于强化学习的VANET模拟-源码

静脉-健身房 Veins-Gym将Veins模拟导出为Open AI Gyms。这使得强化学习算法的应用能够解决VANET域中的问题，特别是诸如Tensorflow或PyTorch之类的流行框架。执照该项目根据GNU通用公共许可证2.0的条款获得许可。

2021-08-18 12:29:36 16KB simulator reinforcement-learning openai-gym sumo

1

DALLE-pytorch：在Pytorch中将OpenAI的DALL-E（OpenAI的文本复制到图像转换器）的实现复制-源码

焦炉火中的DALL-E 在实现/复制（OpenAI的文本到图像转换器）。它还将包含用于对世代进行排名。，和正在开发！如果您想了解DALL-E在TPU上的培训，请帮助他们。在复制此内容之前，我们可以适应“或“ 状态设法在仅2000张风景图像的数据集上训练了一个小的6层DALL-E！（2048个视觉标记）安装 $ pip install dalle-pytorch 用法火车VAE import torch from dalle_pytorch import DiscreteVAE vae = DiscreteVAE ( image_size = 256 ,

2021-08-16 15:09:36 606KB deep-learning transformers artificial-intelligence multi-modal

1

OpenAI Key Papers

OpenAI的Spinning UP（https://spinningup.openai.com/en/latest/spinningup/keypapers.html）对于入门深度强化学习是很好的资料，其中推荐了105篇非常经典的论文，这对于想要从事深度强化学习研究的初学者来说极具参考意义。本人花了一点时间把所有论文下载并按照网页上的分类整理了下来。

2021-08-10 09:11:10 285.08MB 深度学习 强化学习 spinninup openai

1

个人信息

热门下载

最新下载

其他资源