假新闻检测器 使用现代机器学习技术识别政治新闻文章中的虚假信息通过本杰明·卡尔斯伯格 目录 背景 什么是“假”新闻? 从广义上讲,“假”新闻所包含的信息是虚假的或超出客观事实的夸大信息。 假新闻文章往往包含被认为是偏颇的语言,并且偏向一种观点,以促进政治议程或产生广告观点。 检测器如何工作 通过细化倾向于在“真实”和“伪造”新闻文章中使用的语言,检测器能够计算该文章来自事实来源的可能性。 *注意:这并不意味着检测器会验证文章中的实际要求。 它主要怀疑文章是否带有偏见。 数据 用于训练模型的数据包含超过70,000条带有标签的文章,这些文章来自“ Politifact.com”(占80%),“纽约时报”(占10%)和“洋葱杂志”(占10%)。 47%的文章标记为“伪造”,53%的标记为“真实”。 模型测试 使用TF-IDF向量为自然语言处理组织了数据: 用词合法化,避免重复 包含的三字组
2021-11-01 21:01:34 55.6MB JupyterNotebook
1
仿生智能算法 机器学习技术 遗传算法 基于遗传算法的随机优化搜索 优质课件 共36页.rar
2021-10-01 09:04:53 216KB
酒店预订需求分析 这是机器学习技术的最后一个项目,南大林轩天教授。 () 指导 设置 执行以下命令进行设置 sh setup.sh 相依性 如果要导入新库,请将其添加到requirements.txt 获取数据集路径 from HTML import Config print ( Config . test_path ) print ( Config . train_path ) print ( Config . train_label_path )
2021-09-28 10:39:15 2.06MB HTML
1
使用监督学习的股市价格预测 目标 检查许多不同的预测技术,以根据过去的收益和数字新闻指标预测未来的股票收益,以构建多只股票的投资组合,以分散风险。 为此,我们通过解释看似混乱的市场数据,将监督学习方法应用于股价预测。 设定说明 $ workon myvirtualenv [Optional] $ pip install -r requirements.txt $ python scripts/Algorithms/regression_models.py <input-dir> 从下载运行代码所需的数据集。 项目概念视频 方法 预处理和清洁 特征提取 Twitter的情绪分析和得分 数据归一化 各种监督学习方法的分析 结论 研究论文 使用的数据集 有用的链接 幻灯片: : 视频: : 报告: : 参考文献
2021-09-27 21:49:36 7.33MB machine-learning video analysis lstm
1
机器学习技术在期货市场运行预估中的应用.pdf
2021-09-25 17:02:38 1.98MB 机器学习 参考文献 专业指导
企业案例研究:T-Mobile US通过机器学习技术增强客户服务.pdf
2021-09-25 17:02:23 1.05MB 机器学习 参考文献 专业指导
使用随机森林的汽车价格预测:该项目使用随机森林回归器作为监督的机器学习技术来预测汽车价格
2021-09-20 15:43:08 3.46MB JupyterNotebook
1
代码Kindle 一个ReactJS网络应用程序,可使用SMT(统计机器翻译)将源代码转换为伪代码。 它是如何工作的 转换器页面包含两个编辑器,一个用于编写要转换的源代码,另一个用于在转换后显示伪代码。 您还可以通过先从下拉菜单中选择语言,然后浏览并上传文件来上传要转换的文件。 您选择的文件也将显示在文本编辑器中。 现在,只需单击转换按钮,它将在后台运行基于Docker容器的编译器。 未来范围 增加对更多语言的支持 将一种语言代码转换为其他语言,例如将cpp代码转换为php等。 改进翻译器的算法,使其包含复杂的情况,例如在主体内部进行多个函数调用。 项目结构 backend文件夹包含基于Django API的代码,以将文件上传到projects目录。 code_converter文件夹包含部署在DFINITY上的前端代码。 cpp-pseudogen文件夹包含cpp / c语
2021-09-19 21:53:43 1.07MB 系统开源
1
4.1 基本概念 4.2 基本遗传算法 4.3 遗传算法应用举例 4.4 遗传算法的特点与优势 习题四   1. 适应度与适应度函数(重点)   适应度(fitness)就是借鉴生物个体对环境的适应程度, 而对所求解问题中的对象设计的一种表征优劣的测度。适应度函数(fitness function)就是问题中的全体对象与其适应度之间的一个对应关系, 即对象集合到适应度集合的一个映射。 它一般是定义在论域空间上的一个实数值函数。   2. 染色体及其编码   遗传算法以生物细胞中的染色体(chromosome)代表问题中的个体对象。而一个染色体可以看作是由若干基因组成的位串, 所以需要将问题中的个体对象编码为某种位串的形式。这样,原个体对象也就相当于生命科学中所称的生物体的表现型(phenotype), 而其编码即“染色体”也就相当于生物体的基因型(genotype)。遗传算法中染色体一般用字符串表示, 而基因也就是字符串中的一个个字符。例如,假设数字9是某问题中的个体对象, 则我们就可以用它的二进制数串1001作为它的染色体编码。
【概述】 遗传算法是一种大致基于模拟进化的学习方法 假设通常被描述为二进制位串,也可以是符号表达式或计算机程序 搜索合适的假设从若干初始假设的群体或集合开始 当前群体的成员通过模拟生物进化的方式来产生下一代群体,比如随机变异和交叉 每一步,根据给定的适应度评估当前群体中的假设,而后使用概率方法选出适应度最高的假设作为产生下一代的种子 遗传算法已被成功用于多种学习任务和最优化问题中,比如学习机器人控制的规则集和优化人工神经网络的拓扑结构和学习参数 本章主要介绍了基于位串描述假设的遗传算法和基于计算机程序描述假设的遗传编程 【动机】 遗传算法(GA)是一种受生物进化启发的学习方法,它不再是从一般到特殊或从简单到复杂地搜索假设,而是通过变异和重组当前已知的最好假设来生成后续的假设 每一步,更新被称为当前群体的一组假设,方法是使用当前适应度最高的假设的后代替代群体的某个部分 这个过程形成了假设的生成测试的柱状搜索,其中若干个最佳当前假设的变体最有可能在下一步被考虑