选题背景 Titanic生存概率预测是Kaggle平台上的经典竞赛项目,泰坦尼克号成员存活的数据集非常适合新手开始作为机器学习项目和Kaggle竞赛的练手。我们将在该项目中探索具备何种特征的人在此次海滩中幸存的几率更高,并通过改建机器学习模型和深度学习模型来预测乘客的生存率。Titanic项目的描述如下所示: 泰坦尼克号的沉没是历史上最声明远扬的航海事件 1912年4月15日,在她的处女航中,被广泛认为的“沉没” RMS泰坦尼克号与冰山相撞后沉没。 不幸的是,船上没有足够的救生艇供所有人使用,导致2224名乘客和机组人员中的1502人死亡 虽然幸存有一些运气,但似乎有些人比其他人更有可能生存 在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 您可以使用乘客数据(即姓名,年龄,性别,社会经济舱等)来进行预测 开发环境 操作系统:Macos Python版本:3.7.4 Anaconda版本:4.9.2 tensorflow版本:2.1.0 keras版本:1.1.0 1 数据源集数据处理 1.1 数据源 数据集来自Kaggle网站提供的数据集,Kaggle提供的乘员数据分为两个部分: 训练集(train.csv) 测试集(test.csv) 训练集将用于构建我们的机器学习/深度学习模型。并且在训练集中对于每位乘客我们会有表示该乘客是否存活的label,也就是survival字段。在训练集中会给出每一位乘客的特征,我们需要从这些乘客的特征当中学得一些知识,或者可以使用特征工程来创建新的特征来帮助模型的构建 测试集数据将用来评判我们模型的表现。因此对于测试集中的每一位乘客没有代表该乘客是否存活的label,我们的模型需要根据每一位乘客的特征值来输出相应的label,真实的label将由kaggle网站保留
2021-12-27 12:03:14 418KB kaggle
中山大学后勤服务综合服务公司家政服务信息.docx
2021-12-23 20:09:55 44KB
操作系统原理实验(课程项目) 中山大学计算机学院 操作系统原理实验(Operating Systems Laboratory, DCS218) 教师:凌应标 2018-2019 学年第二学期(大二下) 实验目录 序号 名称 简介 镜像文件 成绩 1 在裸机(虚拟机)上运行自己的程序 A++ 2 实现监控程序(原始操作系统)执行用户程序这一项基本功能 A++ 3 用C和汇编实现操作系统内核,并增加批处理能力 A+++ 4 用时钟中断、键盘中断等处理异步事件 A+++ 5 实现原型操作系统中一些基本的系统调用 A++ 6 多进程分时系统,采用时间片轮转调度进程运行 A+++ 7 五状态进程模型,支持 fork、wait 和 exit A+++ 特色 GCC + NASM 实模式(16 位兼容的 32 位代码); 使用 Shell 脚本自动编译、链接、整合; 未经美化的界面 软盘镜像仅在 VMw
2021-12-16 10:32:14 1.53MB sysu operating-system-learning x86-os Assembly
1
中山大学2016级数据库笔记及PPT整合归纳,开卷考试查询
2021-12-15 21:10:51 45.15MB 数据库
1
文件系统的实现 linux ext2fs 中山大学 万海 界面 操作系统
2021-12-12 21:19:47 9.13MB 文件系统的实现 linux ext2fs 中山大学
1
中山大学的一套完整DELPHI教程,费了我好久才找到的资源
2021-12-10 09:41:31 96KB 种子
1
广东省中山市地图GeoJson数据(到区县一级)
2021-12-08 17:01:32 20KB 中山市 GeoJson 地图 区县
1
广东省中山市普通高中2018届高考数学一轮复习模拟试题08.doc
2021-11-30 17:02:52 850KB
广东省中山市普通高中2018届高考英语一轮复习模拟试题02.doc
2021-11-30 17:02:52 115KB
广东省中山市普通高中2018届高考英语一轮复习模拟试题04.doc
2021-11-30 17:02:52 160KB