只为小站
首页
域名查询
文件下载
登录
AI-奥林匹克
·相扑比赛高分强化学习智能体实现代码
AI-奥林匹克
·相扑比赛基于规则的智能体和基于强化学习的智能体解决方案,该方案训练出的智能体能进入对战排行榜前十。基于代码实现的规则,能进入排行榜前三。 1 手动提取特征(manual feature extraction) 2 重新封装环境 3 训练表现
2022-10-16 22:08:12
7.81MB
强化学习
AI-奥林匹克
相扑比赛
PPO
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
智能微电网中利用粒子群算法实现多目标优化(有完整数据可运行).zip
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
基于MATLAB的水果图像识别
EEupdate_5.35.12.0 win10下修改intel网卡mac
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
IBM CPLEX 12.10 学术版 mac操作系统安装包
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
得到品控手册7.0.pdf
mingw-w64-install.exe
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
多目标优化算法(四)NSGA3的代码(MATLAB)
最新下载
具有递归神经网络的文本生成:使用基于特征的RNN进行文本生成。 我们使用安德烈·卡帕蒂(Andrej Karpathy)的莎士比亚著作数据集。从该数据中获得一个字符序列(“莎士比亚”),训练模型以预测序列中的下一个字符。 通过重复调用模型可以生成更长的文本序列
Low Poly FPS Pack_3.2.rar
TI运放稳定性分析连载(11-19)
履带车辆非线性悬挂系统的ADAMS仿真.pdf
老外最新版的avilib的h文件和cpp文件
WMS用户操作手册
CUID-IC卡专用v2.3.5.rar
人员名单按姓氏笔画为序-汉字字典表
6RD_035_187B_TR7247_SW0317_20190625.zip
易拉罐形状和尺寸的最优设计模型
其他资源
单片机和LCD1602实现的简易计算器
北京交通大学-数字图像处理试卷+ 答案+复习资料.rar
基于LabVIEW的计算器、音乐播放器及2048小游戏的综合程序设计
微信小程序picker组件省市二级联动及其修改时进行回显
STM32控制步进电机正反向和加减速
电力系统暂态仿真 MATLAB
模拟退火算法python实现+PPT+视频演示
readline-7.0.tar.gz
栅格变化趋势,一元线性回归
5点差分格式的Matlab程序
广东省电设一等奖作品源码_智能家居系统STM32F407程序设计源码
小型X射线激光器
项目计划无忧管理系统案例数据库
1922154.pdf
ask_crawler.py
SecureCRT.rar
MultiThread(VS2013 MFC多线程-含源码-含个人逐步实现文档)
mybatis3.4.1jar包及框架源码
C#实现xps转图片
VC 导出excel
JSP连接access学生管理系统
Lunchbox for grasshopper
arm汇编指令集全面