基于Mahout的新闻推荐系统 相关技术 推荐算法 基于用户的协同过滤 基于内容的推荐 基于景点的推荐 :整体框架,实现了协同过滤 ,建立VSM :分词,关键词提取 :分词,关键词 :提供API,ORM 关键实现 基于用户的协同过滤 直接调用Mahout相关接口即可 选择不同的用户相似度度量方法,这里选择了基于谷本系数,基于对数似然和基于曼哈顿距离 基于内容的推荐 对新闻文本进行分词 调用Deeplearning4j中内置paragraphvector的方法,通过doc2vec内置VSM 用Gensim会更方便点 基于景点的推荐 统计最高浏览量 过滤一定时间前的新闻保证景点的准确 评估指标 F1-Measure(精度+召回率) 算法 最近邻数量K 推荐数N F1-措施 UserCF--Tanimoto 20 11 0.481591183699049 UserCF--Log
2021-12-26 22:46:42 14.93MB 系统开源
1
COMSOL News 2021 多物理场仿真
2021-12-22 16:03:57 5.11MB 多物理场仿真
1
消息 描述 News Highlights是使用Flask和News API开发的网络应用。 它还允许用户在主网站上查看各种新资源和文章以及新闻源。该应用程序结合了单元测试,面向对象编程和Flask框架的概念。 链接到网站 作者 基马尼 安装 Place your api key in the start.ps1 file git clone https://github.com/JKimani77/News.git cd News $ ./start.ps1(windows) or $ ./start.sh(ubuntu) 测试班 $ python3.9 manage.py test(ubuntu) $ python manage.py test(windows) 使用的技术 Python Shell Python 3.6 Flask Boot
2021-12-21 16:03:02 4.57MB Python
1
微信小程序源码-News-master-仿今日头条小程序 有需要的可以下载
2021-12-16 11:45:48 7KB 微信 小程序 源码
1
matlab仿真代码Binhvq新闻语料库 基本信息: 从包括报纸在内的互联网上约14.896,998篇文章中摘录: 2Sao, ANTG, ANTT, ANTĐ, ATGT, BVPL, BizLIVE, Biên Phòng, Bnews, Báo Văn hóa, Bộ Công thương, Bộ GTVT, Bộ KHĐT, Bộ Ngoại Giao, Bộ Nội Vụ, Bộ Tài Chính, Bộ VHTTDL, CAND, CAĐN, CL&XH, CSTC, Cartimes, Chính Phủ, Công Luận, Công Lý, Công Thương, DNVN, Doanh Nghiệp, Dân Sinh, Dân Việt, Em Đẹp, GD&TĐ, GTVT, Gia Đình Mới, Gia Đình VN, Giao Thông, Giáo Dục VN, GĐ&XH, Hà Nội Mới, Hà Tĩnh, Hải Quan, ICTNews, Infonet, KTNT, KTĐT, Khỏe 365, Khỏe Plus
2021-12-13 16:18:33 87KB 系统开源
1
假新闻Confia 基于新闻传播和用户声誉的虚拟媒体虚假新闻检测研究 剧本 这些脚本旨在创建用于数据挖掘和训练分类器的一组数据集。 数据集基于从Twitter提取到文件结构中的现有内容。 Jupyter笔记本 笔记本打算从以前创建的数据集中提取信息。 收集信息并将其用作不同分类器的输入,以创建多个机器学习模型。
2021-12-08 17:23:38 14KB JupyterNotebook
1
MAIS202 2020年秋季最终项目:假新闻检测器 抽象的 这是麦吉尔MAIS202的最终项目。 该项目的目标是对任何新闻产生“真实”或“伪造”分类。 提出并实现的算法是经典的朴素贝叶斯算法。 另外,我已经实现了广泛的自然语言预处理,使用了诸如“停用词去除”和“词义化”之类的方法来提高分类的准确性。 通过对多项式算法进行网格搜索并实现最佳参数,测试精度达到了97%。 储存库结构 该存储库包含2个文件夹和2个文件:。 派力宝 可交付成果1 数据选择提案.pdf 交付品2 Deliverable2.ipynb Delivearble2.pdf 可交付成果3 Deliverable3.ipynb 交付品3.pdf 可交付成果4 Deliverable4.ipynb 资料集 Fake.csv True.csv 最终项目 pycache的 环保 范本 fake.html r
2021-12-08 17:05:21 139.45MB JupyterNotebook
1
本文对虚假新闻的检测进行了综述。我们的调查介绍了自动识别假新闻的挑战。我们系统地回顾了为这项任务所开发的数据集和NLP解决方案。我们还讨论了这些数据集和问题公式的限制、我们的见解和建议的解决方案。
2021-12-08 16:57:01 111KB Fake News Detection
1
假新闻检测器 建立一个模型来识别不可靠的新闻文章。 贡献者: Hutaf R. Aljohani,Abdullah Almokainzi,Arwa Ashi
2021-12-08 16:48:02 20KB JupyterNotebook
1
假新闻检测系统 提议的系统分为多个阶段,以根据数据挖掘操​​作领域(例如数据收集,数据预处理,特征提取,特征选择和机器学习模型的实现)完全隔离工作,以进行将新闻分类为是非的预测并预测新闻属于预测标签的概率。 实施了许多机器学习模型,并根据准确性,f1得分,准确性和召回率等指标对机器学习模型的性能进行了比较。 评估模型性能的主要决定指标被选为f1得分,其中考虑了精度和召回率之间的折衷。 在对以下机器学习模型(SVM,逻辑回归,朴素贝叶斯和随机森林)进行了训练和调整之后,实施了投票分类器,将上述所有模型组合在一起,形成了一个集成分类器,该分类器使用所有这些分类器来预测标签和分类概率并使用软投票方法做出最终预测。 建议的系统步骤: 数据收集:为了实施和测试所建议的系统,使用了William Yang Wang []的“说谎者,说谎者裤子着火:用于虚假新闻检测的新基准数据集”。 该存储库中
2021-12-08 15:47:24 31.54MB 系统开源
1