我有一个功能齐全的scrapy脚本,可以从网站中提取数据。在设置过程中,目标站点基于我的USER_AGENT信息禁止了我。随后,我添加了RotateUserAgentMiddleware以随机旋转USER_AGENT。这很好。
但是,现在,当我尝试使用scrapy shell测试xpath和CSS请求时,出现403错误。我确定这是因为scrapy shell的USER_AGENT默认为目标站点已列入黑名单的某个值。
问题:是否可以使用与默认用户名不同的USER_AGENT在scrapy shell中获取URL?
fetch(‘ http://www.test ’)[添加一些内容?更改USER_AGENT]
谢谢