scrapy lofter
这是一个爬取lofter文章的小爬虫程序,采用Scrapy框架,更多内容可参考官方文档
lofter/lofter/spiders/article_spider.py
中的start_urls
,更改成要爬取的第一个页面,如:
class LofterArticleSpider(Spider):
name = "lofter"
start_urls = [
"http://{name}.lofter.com/?page=1" # 此处{name}改成你的名字
]
virtualenv -p python3 .env
source .env/bin/activate
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
cd lofter/ && mkdir articles
scrapy crawl lofter