Dùng scrapy-splash kết hợp lua script để crawl các trang web sử dụng Javascript (websosanh)
Dùng scrapy-splash kết hợp lua script để crawl các trang web sử dụng Javascript (websosanh)
├── crawl_service
│ ├── __init__.py
│ ├── items.py
│ ├── middlewares.py
│ ├── pipelines.py
│ ├── run.py
│ ├── settings.py
│ └── spiders
│ ├── __init__.py
│ └── websosanh.py
└── lazada.py
├── requirements.txt
└── scrapy.cfg
Cài Docker sau đó chạy
$ sudo docker pull scrapinghub/splash
và
$ sudo docker run -p 8050:8050 scrapinghub/splash
pip install -r requirements.txt
hoặc
python run.py
scrapy crawl wss
scrapy crawl lazada