Code前端首页关于Code前端联系我们

Scrapy爬虫翻页爬取诗歌胖排行榜案例

terry 2年前 (2023-09-24) 阅读数 54 #后端开发

Scrapy框架实现自动翻页和数据爬取,爬取胖诗歌排行榜中的标题(
https://www.shicimingju.com/paiming)。

1。创建一个新文件夹

scrapy 文件名starproject(壁纸)

scrapy爬虫翻页爬取诗词胖排行榜案例

2。创建一个新的爬虫文件

scrapy genspider 文件名(宽度)www.xxx.com

scrapy爬虫翻页爬取诗词胖排行榜案例

3.提交请求并分析

数据已经在前两课中详细讲解过,本节不再赘述。

scrapy爬虫翻页爬取诗词胖排行榜案例

4。创建翻页链接

我们上面放置的链接就是第一页的地址。根据翻页的页面地址,我们发现“p”对应的值是可变的,所以我们拼接URL:

scrapy爬虫翻页爬取诗词胖排行榜案例

scrapy爬虫翻页爬取诗词胖排行榜案例

5。发送翻页链接请求

基本格式为:yield scrapy.Request(url地址,callback=self.parse)。当找到第二个页面时,就会根据上面的连接地址进行填充,并解析数据

scrapy爬虫翻页爬取诗词胖排行榜案例

6。总结

要实现自动提交翻页请求,首先要创建并解析第一个翻页请求,然后写入翻页URL,然后调用yield关键字来实现自动提交翻页。问

版权声明

本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门