爬取指定标签List下评分8.5分以上的图书信息,包括书名、作者、评分、简介,并保存到excel,以标签分类,放到不同的sheet中。核心代码: title= book.find_element_by_xpath('.//a[1]').text #获取书名 zuozhe= book.find_element_by_xpath('.//div[1]').text.split('/',1)[0] jianjie= book.find_element_by_xpath('.//p[1]').text #获取简介 worksheet.write(i,0,fenshu); #分数写入第i行的第一列 worksheet.write(i,1,title); #书名写入第i行的第二列 worksheet.write(i,2,zuozhe); #作者写入第i行的第三列 worksheet.write(i,3,jianjie); #简介写入第i行的第四列
2020-01-03 11:36:35 3KB 豆瓣爬虫 Python selenium
1
Python爬虫实现对图虫网相关图片的在线爬取,只需要填写相应的主题名即可自动下载资源至相应目录
2020-01-03 11:32:04 2KB Python爬虫
1
利用Python中的Scrapy框架,爬取优酷平台的电影目录,包括电影名,演员,播放量,和电影海报。
2020-01-03 11:22:29 6.4MB 爬虫 Python Scrapy
1
这是一个爬取知网的社科基金项目的代码,用python语言写的,这个代码参考了其他人写的代码。最终能够实现爬取社科基金项目信息的功能,在pycharm3.6下开发,需要替换成你自己的浏览器的cookie。
2020-01-03 11:17:14 7KB 爬虫 python
1
1.从一个给定的网址中分析其所包含的 URL 并爬取对应的网页,直到爬取完全部 不重复的网页为止。 2.支持分布式爬取,同时记录输出每一个网页的大小。 3.采用多线程结构设计,实现高性能的网络爬虫。
2019-12-21 22:13:46 10.42MB 分布式 爬虫 python
1
抓取CSDN博客文章的简单爬虫python源码
2019-12-21 22:09:56 4KB 爬虫 python csdn博客
1
这是一个python专利爬虫,使用中介者模式防止目标网站长时间无响应
2019-12-21 21:54:13 17.36MB 爬虫 python
1
这是一个基于python scrapy的专利爬虫
2019-12-21 21:54:13 20.14MB 爬虫 python scrapy
1
网站后台收集的真实UA大全,放出10000个给大家使用,爬虫,多开等都可以使用到。
2019-12-21 21:36:05 1.8MB user-agent UA 爬虫 python
1
Python是一种面向对象的解释型计算机程序设计语言 语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进 并具有丰富和强大的库 应需求本次整理分享的教程包括 Python编程基础、简单爬虫开发、基础进阶项目开发 适用于Python初学者基础学习了解 以及捣鼓爱好者开发实践操作 ★情人节没有情人就在整理这些内容★ 由于内容多达N...G,所以只能为提供网盘下载。
1