该入门代码是Andrew ng(吴恩达)老师在coursera上开设的机器学习课程的编程习题的matlab代码,非常适合机器学习初学者作为参考来熟悉算法内涵、养成良好的编程习惯。
2021-11-11 15:15:41 29.13MB 机器学习代码
1
2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课 课程介绍: 从基本的软件安装到必备的Python扩展讲起,然后对机器学习算法一一讲解,同时配合编程实操的实现过程,适合零基础系统学习,配套资料包括讲义作业软件数据都有。 课程目录: 第一章Numpy前导介绍 1.1、Anconda安装 1.2、JupyterNoteBook 1.3、Numpy介绍+ndarry 1.4、ndarry的shape属性巧算 1.5、ndarray的常见创建方式 1.6、NumPy中的数据类型 1.7、NumPy数据类型2 1.8、Numpy基本操作 1.9、索引和切片 1.10、索引和切片(2) 1.11、数组转制与轴兑换 1.12、通用函数 1.13、np.where函数 1.14、np.unique函数 1.15、数组数据文件读取 第二章Pandas前导课程 2.1、Pandas介绍 2.2、Series 2.3、索引对象 2.4、DataFrame 2.5、Pandas常用操作(1) 2.6、Pandas常用操作(2) 2.7、缺失值处理 2.8、pandas制图 2.9、Matplotlib(1) 2.10、Matplotlib(2) 2.11、Matplotlib中文输出解决 第三章机器学习(一) 3.1、01机器学习定义及理性认识 3.2、02机器学习商业应用场景、机器学习分类 3.3、03机器学习开发流程 3.4、04模型评估方法和部署 3.5、05线性回归原理推倒过程 3.6、06线性回归基础认识及原理讲解 3.7、07线性回归案例分析 第四章机器学习(二) 4.1、01_线性回归案例1、正则项、梯度下降 4.2、02_梯度下降方法及回归案例分析 4.3、03_线性回归、lasso、ridge、ElasitcNet以及案例分析 4.4、04_逻辑回归原理 4.5、05_逻辑回归及案例分析 4.6、06_softmax回归及案例分析 4.7、07_综合案例分析 第五章机器学习三-决策树 5.1、01决策树、属性分割、信息增益 5.2、02信息增益的计算、模型评估、ID3、C4.5、CART_ 5.3、03决策树案例分析1 5.4、04决策树案例分析二、过拟合、剪枝分析 5.5、05bagging、随机森林、随机森林案例分析 5.6、06GBDT、Adaboost原理讲解 5.7、07Adaboost案例分析、综合案例分析 第六章机器学习四-SVM支持向量机 6.1、svm讲解 6.2、核函数 6.3、代码讲解(一) 6.4、代码讲解(二 6.5、代码讲解(三) 6.6、代码讲解(四) 第七章机器学习五-聚类分析+贝叶斯 7.1、01-聚类的相似性度量(距离公式) 7.2、02-聚类思想、kmeans聚类、kmeans聚类应用案例 7.3、03-二分kmeans、kmeans++、kmeansII、canopy、mini-batchkm 7.4、04-聚类算法的衡量指标及案例实现 7.5、05-层次聚类及实现案例 7.6、06-密度聚类 7.7、07-密度聚类案例实现、谱聚类、谱聚类案例实现 7.8、08-不同聚类效果对比实现、文本案例、图片案例 7.9、09-朴素贝叶斯原理、案例1、案例2 7.10、10-贝叶斯网络 7.11、11-贝叶斯网络拓展 第八章机器学习六-EM-HMM-LDA-ML 8.1、01.EM算法讲解 8.2、02.HMM及中文分词 8.3、03.主题模型 8.4、04.spark机器学习安装环境 8.5、05.spark机器学习离线处理及训练和使用 8.6、06.机器学习实时新闻分类
2021-11-09 23:46:49 2KB 机器学习 numpy pandas Matplotlib
1
ml-in-action:出版书籍《机器学习入门到实践——MATLAB实践应用》一书中的实例程序。涉及监督学习,非监督学习和强化学习。(本书的代码“ MATLAB中的机器学习简介与操作” ”)
1
聚类概念 聚类是把相似的东西分到一组,它是一个无监督问题,没有标签使用 难点: 对于有标签的有监督学习问题,标签可以便于我们来评估模型,无监督学习问题在评估上比较难一点 对于不同的参数组合,得到的学习结果,因为比较难对模型做评估,所以不能通过一个精确度的好坏来选择参数组合 K-MEANS算法 K-MEANS算法是聚类问题中,最简单,也是最实用的一个算法 基本概念 一个数据放进来,需要指定K值,来声明要得到簇的个数 质心:一个簇的数据均值,即向量各维取平均即可(迭代时使用) 距离的度量:常用欧几里得距离和余弦相似度(数据需先标准化) 优化目标 通过目标函数进行不断地优化、求解 min∑i=1K∑
2021-10-23 10:22:29 438KB mean ns 学习
1
本文中将针对树模型的参数进行优化 数据预处理 前面已经做过好几次数据预处理了,这里直接上代码 得到数据 # 导入工具包 import pandas as pd import numpy as np from sklearn.model_selection import train_test_split # 读取数据 features = pd.read_csv('data/temps_extended.csv') # 独热编码处理数据 features = pd.get_dummies(features) # 标签和特征划分 labels = features['actual'] featur
2021-10-17 11:02:04 104KB 参数 学习 机器学习
1
个人黑马机器学习入门笔记
2021-08-21 19:13:35 46.21MB 机器学习 python
1
数据集介绍 总共包含150行数据 每一行数据由 4 个特征值及一个目标值组成。 4 个特征值分别为:萼片长度、萼片宽度、花瓣长度、花瓣宽度 目标值为三种不同类别的鸢尾花,分别为: Iris Setosa、Iris Versicolour、Iris Virginica 数据集中每朵鸢尾花叫做一个数据点,它的品种叫做它的标签 数据集样式: 导入需要的模块包 import numpy as np from matplotlib import colors from sklearn import svm from sklearn import model_selection import mat
2021-08-16 22:40:34 142KB python python机器学习 分类
1
多元逻辑斯蒂回归matlab代码机器学习课程 挑战 了解机器学习的基础。 动作 研究了以下概念: 线性回归:训练集,特征,目标变量,假设,学习算法,参数,成本函数,优化问题,梯度下降,学习率,批次梯度下降 多元线性回归:特征缩放,均值归一化,选择学习率,正态方程 逻辑回归:分类,逻辑函数,S形函数,决策边界,非线性决策边界,成本函数,优化算法,多类分类,一对多 正则化:过度拟合,正则化参数,正则线性回归,正则逻辑回归 神经网络:计算机视觉,S型激活函数,层,偏差,正向传播,非线性分类,反向传播算法,随机初始化 模型选择:训练/验证/测试集,诊断偏差和方差,交叉验证错误,正则化,学习曲线,高偏差,高方差,误差分析,精度,召回率,F1得分 支持向量机:SVM假设,大余量分类器,核,相似度,高斯核,线性核,多项式核, 无监督学习:聚类,K-均值 主成分分析:降维,数据压缩,数据可视化,协方差矩阵sigma,sigma的特征向量,压缩表示的重构,pf主成分数,学习加速 k-均值聚类:聚类索引,聚类质心,随机初始化,肘法 异常检测:密度估计,正态与异常,欺诈检测,制造,监控工作参数,高斯分布,特
2021-08-09 22:25:34 75.16MB 系统开源
1
为什么要做降维: 提高计算效率 留存有用的特征,为后续建模使用 在项目中实际拿到的数据,可能会有几百个维度(特征)的数据集,这样的数据集在建模使用时,非常消耗计算资源,所以需要通过使用降维方法来优化数据集 线性判别分析(Linear Discriminant Analysis) 用途:数据预处理中的降维,分类任务(有监督问题) 目标:LDA关心的是能够最大化类间区分度的坐标轴成分 将特征空间(数据集中的多维样本)投影到一个维度更小的 k 维子空间中,同时保持区分类别的信息 原理:投影到维度更低的空间中,使得投影后的点,会形成按类别区分,一簇一簇的情况,相同类别的点,将会在投影后的空间中更接近
2021-07-07 15:03:37 281KB api ar c
1
机器学习入门与算法总览
2021-06-28 11:07:37 2.82MB 机器学习
1