爬虫代码matlab-ScienceDirectWebCrawler:使用Python中的网络爬虫从ScienceDirect数据库下载和分析

上传者: 38717450 | 上传时间: 2021-11-13 18:29:17 | 文件大小: 2.06MB | 文件类型: -
爬虫代码matlab 使用 Python 调查 ScienceDirect 数据库 这个代码文件夹是由张子涵为他在纽约大学牙科学院的实验室实习而制作的。 目的是使用网络爬虫从数据库中获取信息。 这些代码主要基于 Python,并涉及一些 Matlab 和 SQL。 heatmap_create 部分用于生成不同关键字组合的总找到结果的可视化表示。 download_pdf 部分用于下载与此关键字组合相关的所有 pdf 并将它们存储到不同的文件夹中。 database_create部分用于提取每篇文章相关的重要信息,包括相关关键词、DOI、作者、发表日期等,并存入MySQL数据库。 analysis_pdf 部分用于将 pdf 文件转换为可编辑和可搜索的 JSON 文件,以便用户可以跟踪特定关键字并浏览内容。 请注意,每个文件夹中的代码或多或少彼此相似。 这是为了方便读者将它们视为单独的项目以供将来参考。 我还发布了数据提取团队的临时演示文稿,以更好地介绍我在创伤项目中的角色和贡献。 可以在 中找到最终组织良好的程序。

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明