爬取指定标签List下评分8.5分以上的图书信息,包括书名、作者、评分、简介,并保存到excel,以标签分类,放到不同的sheet中。核心代码: title= book.find_element_by_xpath('.//a[1]').text #获取书名 zuozhe= book.find_element_by_xpath('.//div[1]').text.split('/',1)[0] jianjie= book.find_element_by_xpath('.//p[1]').text #获取简介 worksheet.write(i,0,fenshu); #分数写入第i行的第一列 worksheet.write(i,1,title); #书名写入第i行的第二列 worksheet.write(i,2,zuozhe); #作者写入第i行的第三列 worksheet.write(i,3,jianjie); #简介写入第i行的第四列
2020-01-03 11:36:35 3KB 豆瓣爬虫 Python selenium
1
包括每本书的书名、作者、出版商、图书号、标签、内容简介、封面地址及其他出版信息。仅限于数据内容,不包含爬虫代码。如果需要代码私聊我。
2019-12-21 21:35:11 1.45MB 豆瓣图书 标签
1
豆瓣电影数据集12万+用户影评40万+爬虫程序(两个csv,一个db数据库) 最近在学习爬虫,辛辛苦苦爬了几天,分享给大家。。可以用来做推荐系统 觉得好的朋友帮忙评论下打个5星~ 可以看下这篇文章 https://blog.csdn.net/qq_37717661/article/details/81458779
2019-12-21 20:48:11 42.45MB 数据集 豆瓣 爬虫
1
基于python+neo4j的豆瓣电影知识图谱,与cypher查询语句相关,主要是爬虫代码及数据,有意向者可下载
2019-12-21 19:32:50 6.36MB neo4j python 爬虫 知识图谱
1