Scrapy爬虫翻页爬取诗歌胖排行榜案例

terry 3年前 (2023-09-24) 阅读数 144 #后端开发

Scrapy框架实现自动翻页和数据爬取，爬取胖诗歌排行榜中的标题（
https://www.shicimingju.com/paiming）。

1。创建一个新文件夹

scrapy 文件名starproject（壁纸）

scrapy爬虫翻页爬取诗词胖排行榜案例

2。创建一个新的爬虫文件

scrapy genspider 文件名（宽度）www.xxx.com

scrapy爬虫翻页爬取诗词胖排行榜案例

3.提交请求并分析

数据已经在前两课中详细讲解过，本节不再赘述。

scrapy爬虫翻页爬取诗词胖排行榜案例

4。创建翻页链接

我们上面放置的链接就是第一页的地址。根据翻页的页面地址，我们发现“p”对应的值是可变的，所以我们拼接URL：

scrapy爬虫翻页爬取诗词胖排行榜案例

5。发送翻页链接请求

基本格式为：yield scrapy.Request(url地址,callback=self.parse)。当找到第二个页面时，就会根据上面的连接地址进行填充，并解析数据

scrapy爬虫翻页爬取诗词胖排行榜案例

6。总结

要实现自动提交翻页请求，首先要创建并解析第一个翻页请求，然后写入翻页URL，然后调用yield关键字来实现自动提交翻页。问

本文仅代表作者观点，不代表Code前端网立场。
本文系作者Code前端网发表，如需转载，请注明页面地址。